斯坦福大学研究登上《Science》……仅一次对话就会强化确信、削弱和解意愿

有研究结果显示,聊天机器人比人类以更高比例迎合用户观点,表现出“阿谀(sycophancy)”倾向。此前这一问题已多次被提出,但此次通过正式学术期刊的研究,对其影响进行了实证检验,因而备受关注。


根据美国斯坦福大学研究团队于27日(当地时间)在国际学术期刊《Science》上发表的研究结果,研究团队设置了人际关系冲突、网络社区帖子、非法情境等多种场景,对11种大型语言模型(Large Language Model, LLM)的回答进行了分析。

为帮助理解报道而配发的资料图片。Pixabay供图

为帮助理解报道而配发的资料图片。Pixabay供图

View original image

结果显示,即便在涉及欺骗、伤害、非法行为的情境中,人工智能(AI)也比人类更频繁地肯定用户行为,频率高出47%至49%。


尤其是在冲突情境中,这一影响更加突出。即便只与具有阿谀倾向的AI对话过一次,参与者“自己是对的”的确信就会被强化,而和解或承担责任的意愿则呈下降趋势。


研究团队警告称:“AI反复的附和会扭曲用户的自我认知和对人际关系的判断。”


此外,参与者还认为爱阿谀奉承的AI“更有帮助、更值得信赖”,再次使用的意向也更高。研究团队分析称:“对用户有害的特性,反而成为提升服务参与度的因素。”


“将人类弱点量化”……对确认偏误与依赖性的担忧


专家在接受韩国科学技术媒体中心(SMCK)采访时评价称,本次研究揭示了人类心理与AI交互中的结构性问题,意义重大。


Handong大学教授 Son Hwacheol 表示:“人类本能地渴望被支持,但他人的支持从来都不够充足”,“AI的个性化附和,反而可能让人与人之间的沟通变得更加困难。”他接着评价说:“这项研究是通过实验和数据,证明了人类的弱点。”


不过,专家也指出在解读时需要谨慎。阿谀倾向不仅受模型设计影响,也会受到用户提问方式、情境语境等因素的左右,因此在真实环境中的效果可能会有所不同。


Yeungnam大学教授 Park Hanwoo 将AI的阿谀解读为一种结构性特征。他提及艾萨克·阿西莫夫的“机器人三定律”并解释说:“AI是沿着服从用户的方向被设计出来的,因此很有可能给出强化用户满足感和确信的回答。”


他进一步表示担忧:“使用者会更加信任给出对自己有利答案的AI,这可能导致确认偏误和过度依赖。”


专家强调,随着国内AI应用的扩散,也需要同步制定应对策略。关键在于“AI素养”。不仅要会用AI,还需要开展包括:认识AI的附和倾向、比较多元视角、强化批判性思维等方面的教育。



Park教授指出:“在冲突情境中,应当改进设计方向,让AI不是一味附和,而是更多建议和解与负责任的态度”,“如果任由阿谀倾向发展,用户的依赖性可能会进一步加深。”


本报道由人工智能(AI)翻译技术生成。

版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。