能识别讽刺暗示,人工智能更“像人”了
日期:05-31
解读和推断他人心理状态的能力被称为“心智理论”,是人类社交互动的核心能力,涉及沟通、共情和社会决策等。德国汉堡-埃彭多夫大学医学中心等机构研究人员,测试了美国开放人工智能研究中心(OpenAI)发布的GPT系列大语言模型在解读他人心理状态方面的表现,并与人类比较。
研究人员为大语言模型设置了通常用于评估“心智理论”涉及能力的5项测试:分别为识别错误信念、讽刺、失言、暗示和含有误导信息的奇怪故事,并将大语言模型的识别水平与1907名人类参与者相比较。研究发现,在所有5项测试中,GPT-4有3项测试(识别讽刺、暗示、奇怪故事)的表现优于人类,一项测试(识别错误信念)表现与人类相当,仅在识别失言的测试中逊于人类。
OpenAI本月新发布的模型GPT-4o,则在与人的自然交互方面达到新高度,它可进行文本、音频和图像多模态的识别与回应,且更具“人情味”。它还能识别人的面部表情、感知发言者的语气和情绪,并给出相应回应,让人惊呼“更像人”了。
中国科学技术大学机器人实验室主任陈小平接受新华社记者采访时指出,要警惕人类对大模型产生“幻觉”。大模型学习大量历史数据,输出的表达方式符合许多人的语言习惯,让许多人误以为大模型会“说人话”或“理解人”,继而以为它具有某种“社会属性”,但实际上它没有心智。
据新华社