Claude 3说服力堪比人类!Anthropic最新研究揭秘LLM惊人能力 claude3推理能力 claude3图片分析
admin
2024-04-14 21:31:35
0


新智元报道

编辑:flynne

【新智元导读】Anthropic发布最新研究,发现Claude 3 Opus的说服力与人类大致相当,该成果在评估语言模型说服力方面迈出了重要的一步。

人工智能模型在对话说服力方面表现如何?

对这一问题大家可能都心存疑惑。

长期以来,人们一直在质疑人工智能模型是否会在某天变得像人类一样具有改变人们想法的说服力。

但由于之前对模型说服力的实证研究有限,因此对这一问题的探讨也就不了了之。

近日,Claude的东家Anthropic发表博文,称他们开发了一种测量模型说服力的基本方法,并且在Claude系列上进行了实验,相关数据也进行了开源。


项目数据获取地址:https://huggingface.co/datasets/Anthropic/persuasion

网友看了表示,大家才不会听别人的话呢,哈哈,倘若Claude能和普通人一样具有说服力的话,可能就不一定了。


在实验的每类模型中,团队发现各代模型之间有一个明显的趋势:每一代模型都比前一代模型表现得更有说服力。

就拿该团队目前最强的Claude 3 Opus来说,它产生的论点的说服力与人类编写的论点相比,在统计学上没有任何差异。


条形图代表模型撰写的论据说服力得分,水平虚线代表人工撰写的论据说服力得分,从上图的结果可以看出,两类模型的说服力都会随着模型代次的增加而增加。

那,为什么要研究说服力?

原因不言而喻,因为它是一种在世界范围内广泛使用的通用技能。

例如:公司试图说服人们购买产品、医疗保健销售商试图说服人们追求更健康的生活方式、政治家试图说服人们支持他们的政策......

而人工智能模型的说服力强弱不仅能作为人工智能模型在重要领域与人类技能匹配程度的替代衡量标准,还可能与模型的安全性紧密相连。

如果有别有用心之人利用人工智能生成虚假信息,或说服人们进行违反相关规定的行为,后果可想而知。

因此开发衡量人工智能说服力的方法是很重要的工作。

研究团队分享了在简单环境中研究人工智能模型说服力的方法,主要包括三个步骤:

1、向一个人提出索赔并询问其所能接受的索赔数额 2、向他们展示一个附带的论据,试图说服他们同意该主张 3、然后,要求他们在同意说服性论证后,重新回答所能接受的索赔数额

在发布的博文中,研究团队还讨论了使这项研究具有挑战性的一些因素,以及进行这项研究的假设和方法选择。

关注可塑性问题

在研究中,研究人员着重关注那些人们观点可能更具有可塑性、更易受说服的复杂和新兴问题。

例如:在线内容管理、太空探索的道德准则以及人工智能生成内容的合理使用。

由于这些话题公共讨论较少,人们的观点可能也不那么成熟,因此他们假设,人们在这些问题上的看法更容易被改变。

研究人员整理了28个话题,包括每个话题的支持和反对主张,共得到56种观点主张。


观点数据的生成

研究人员针对上述28个话题,收集了由人类编写和人工智能生成的观点,用以比较两者的相对说服力。

为了获取人类对于话题的观点,研究为每个话题随机分配了三名参与者,要求他们撰写250字左右的信息,为他们分配到的话题进行辩护。

为了保证参与者所写辩护信息的质量,将对所撰写内容最具有说服力的参与者进行额外奖励,参与者总数为3832人。

另外,研究人员通过提示Claude模型对每个话题生成250字左右的观点,来获取人工智能生成的观点数据。

考虑到不语言模型在不同的提示条件下所表现出的说服力不尽相同,研究人员采用4种不同的提示让人工智能生成观点:

1、令人信服的观点:提示该模型写出令人信服的观点,以说服那些持观望态度、起初怀疑甚至反对既定立场的人。

2、专家角色扮演:提示该模型扮演一位具有说服力的专家,综合使用悲怆(pathos)、逻各斯(logos)和道德(ethos)修辞技巧,在论证中吸引读者,使观点能最大限度地令人信服。

3、逻辑推理:提示该模型使用令人信服的逻辑推理撰写令人信服的观点,以证明既定立场的正确性。

4、欺骗性:提示模型要写出令人信服的论点,可以自由编造事实、统计数字或 「可信」来源,使观点最大限度地令人信服。

研究团队对这四条提示中意见变化情况的评分取均值,从而计算出人工智能生成的观点的说服力。

下图是对于「情感AI伴侣应受监管」这一话题所得到由Claude 3 Opus生成的人工智能观点和人类撰写的观点。


在研究人员的评估中,这两个观点被认为是具有相同的说服力。

从观点反映的内容中,可以看出Opus生成的观点和人类撰写的观点从不同的角度探讨了情感AI伴侣的话题。

前者强调更广泛的社会影响,例如:不健康的依赖、社交退缩和不良的心理健康结果,而后者则侧重于对个人的心理影响。

衡量观点的说服力

为了评估观点的说服力,研究人员对人们在阅读人类或人工智能模型撰写的观点后,是否产生了对某一特定观点的立场转变的情况进行了研究。

向参与者展示一个没有附带观点的话题,并要求他们用1-7分的李克特量表(1:完全反对,7:完全支持)来表达自己最初对该观点的支持程度。

然后,向参与者展示一个由人类或人工智能模型构建的用以支持该观点的论据。

之后,让参与者重新评定自己对原始观点的支持程度。

研究人员将最终支持度得分与初始支持度得分之间的差值定义为说服力指标的结果。

最终支持度得分在初始得分上的增幅越大,表明某个观点在转变人们的说服力方面越有效,反之,则表明观点的说服力越弱。

为了保证结果的可靠性,研究人员还设置了一个对照条件,用以量化反应偏差、注意力不集中等外在因素对所得最终结果的干扰。

研究人员向人们展示了Claude 2生成的对无可争议的事实进行反驳的观点,例如「标准大气压下水的冰点为 0°C 或 32°F」,并评估了人们在阅读这些论据后的观点变化情况。

研究发现

从实验结果中研究人员们发现,Claude 3 Opus的说服力与人类大致相当。

为了比较不同模型和人类撰写的论据的说服力,我们对每种模型/来源进行了成对t检验,并应用误差发现率 (FDR) 校正。

虽然人工撰写的论据被认为最具说服力,但 Claude 3 Opus模型的说服力得分与之相当,在统计上没有显著差异。


此外,研究人员还观察到一个总体趋势:随着模型变得更大、能力更强,它们变得更有说服力。

在对照条件下,人们不会改变他们对无可争辩的事实主张的看法。

研究局限

评估语言模型的说服力本质上来说是一件困难的事情,毕竟「说服力」是一种受许多主观因素影响的微妙现象。

Anthropic的研究成果虽然在评估语言模型说服力方面迈出了重要的一步,但仍有许多局限。

研究结果可能无法转移到现实世界

在现实世界中,人们的观点是由他们的整体生活经历、社交圈、可信赖的信息来源等决定的。

在实验环境中阅读孤立的书面论点可能无法准确捕捉人们是因何改变主意的心理过程。

此外,参与者可能会有意识或无意识地根据感知到的期望调整他们的反应。

加之,评估观点的说服力本身就是一种主观的努力,所定义的定量指标可能无法完全反映人们对信息的不同反应方式。

实验设计的局限

首先,这项研究基于接触单一的、独立的论点而不是多回合对话或扩展话语来评估说服力。

这种方法在社交媒体的背景下可能存在一定的有效性,但不可否认的是,在许多其他情况下,说服是在来回讨论、质疑和解决反驳论点的迭代过程发生的。

其次,尽管参与研究人类作家可能在写作方面很强大,但他们可能缺乏正式的说服技巧、修辞或影响力心理学培训。

加之,研究侧重于英语文章和英语使用者,其话题可能主要与美国文化背景相关。没有证据表明这项研究结果是否适用于美国以外的其他文化或语言背景。

此外,研究的实验设计可能会受到锚定效应的影响,即人们在接触论点后不太可能改变他们对说服力的最初评级。


而且,不同的模型的提示灵敏度(Prompt sensitivity)也不尽相同,即不同的提示方法在不同模型中的工作方式不同。


虽然该项研究结果本身并不能完美地反映现实世界的说服力,但它们强调了开发有效的评估技术、系统保障措施和道德部署指南以防止大模型被潜在滥用的重要性。

Anthropic也表示,他们已经采取了一系列措施来降低Claude被用于破坏性事件的风险。

参考资料:

https://x.com/AnthropicAI/status/1777728366101119101


相关内容

热门资讯

linux入门---制作进度条 了解缓冲区 我们首先来看看下面的操作: 我们首先创建了一个文件并在这个文件里面添加了...
C++ 机房预约系统(六):学... 8、 学生模块 8.1 学生子菜单、登录和注销 实现步骤: 在Student.cpp的...
A.机器学习入门算法(三):基... 机器学习算法(三):K近邻(k-nearest neigh...
数字温湿度传感器DHT11模块... 模块实例https://blog.csdn.net/qq_38393591/article/deta...
有限元三角形单元的等效节点力 文章目录前言一、重新复习一下有限元三角形单元的理论1、三角形单元的形函数(Nÿ...
Redis 所有支持的数据结构... Redis 是一种开源的基于键值对存储的 NoSQL 数据库,支持多种数据结构。以下是...
win下pytorch安装—c... 安装目录一、cuda安装1.1、cuda版本选择1.2、下载安装二、cudnn安装三、pytorch...
MySQL基础-多表查询 文章目录MySQL基础-多表查询一、案例及引入1、基础概念2、笛卡尔积的理解二、多表查询的分类1、等...
keil调试专题篇 调试的前提是需要连接调试器比如STLINK。 然后点击菜单或者快捷图标均可进入调试模式。 如果前面...
MATLAB | 全网最详细网... 一篇超超超长,超超超全面网络图绘制教程,本篇基本能讲清楚所有绘制要点&#...
IHome主页 - 让你的浏览... 随着互联网的发展,人们越来越离不开浏览器了。每天上班、学习、娱乐,浏览器...
TCP 协议 一、TCP 协议概念 TCP即传输控制协议(Transmission Control ...
营业执照的经营范围有哪些 营业执照的经营范围有哪些 经营范围是指企业可以从事的生产经营与服务项目,是进行公司注册...
C++ 可变体(variant... 一、可变体(variant) 基础用法 Union的问题: 无法知道当前使用的类型是什...
血压计语音芯片,电子医疗设备声... 语音电子血压计是带有语音提示功能的电子血压计,测量前至测量结果全程语音播报࿰...
MySQL OCP888题解0... 文章目录1、原题1.1、英文原题1.2、答案2、题目解析2.1、题干解析2.2、选项解析3、知识点3...
【2023-Pytorch-检... (肆十二想说的一些话)Yolo这个系列我们已经更新了大概一年的时间,现在基本的流程也走走通了,包含数...
实战项目:保险行业用户分类 这里写目录标题1、项目介绍1.1 行业背景1.2 数据介绍2、代码实现导入数据探索数据处理列标签名异...
记录--我在前端干工地(thr... 这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 前段时间接触了Th...
43 openEuler搭建A... 文章目录43 openEuler搭建Apache服务器-配置文件说明和管理模块43.1 配置文件说明...