大模型竞赛加剧,OpenAI最大对手发布Claude 3,可预测美国经济 大模型竞赛加剧,OpenAI最大对手发布Claude 3,可预测美国经济
admin
2024-03-05 16:56:17
0


图片来源:Anthropic官网

当地时间3月4日,没有任何预告,位于美国硅谷的人工智能创业公司Anthropic在社交平台X上宣布发布大模型Claude 3,宣称全方位超越GPT-4。Anthropic被视为OpenAI最大的竞争对手,最初由OpenAI前高管层创立,背后的大投资者有谷歌和亚马逊,与OpenAI背后的微软形成阵营对比。

Anthropic表示,Claude有先进的高级推理、视觉分析、代码生成、多语言处理等功能。目前Anthropic发布了Claude 3的三个版本:Claude 3 Haiku(Haiku意指俳句)、Claude 3 Sonnet(Sonnet意指十四行诗)和Claude 3 Opus(Opus意指艺术作品),这三个版本功能依次增强,价格成本也依次上升,Opus版本最强大。

据Anthropic官方发布的视频,Claude可以使用一系列工具,来预测美国GDP走势。Claude3 Opus可以使用网页视图工具,进入网页的URL链接并利用多模态中的视觉能力查看网 页信息。Claude 3 Opus还使用Python解释器来写出代码,渲染图像,将数据生成折线图。结果显示Claude预测的GDP走向的准确度在5%以内。


Claude 3预测的GDP走向准确度在5%以内。图片来源:Anthropic官方YouTube

在让Claude 3分析世界上几大经济体的GDP变化时,Claude 3还使用了调度子代理的工具,能自行建立多个子模型代理(相当于Claude 3自身的多个版本),Claude3给这些子模型写提示词,指挥几个代理平行进行GDP的运算和预测。

据博主"数字生命卡兹克"测评,Claude有着目前大模型中一流的推理能力,甚至超越GPT-4。Claude官网给出的Claude 3测评结果显示,在使用MMMU多语言数学推理测试集来测试时,Claude 3 Opus达到90.7%的准确率,用的是0-shot,GPT4是8-shot,达到了74.5%。0-shot意味着大模型没有在Prompt里给任何示例,就直接被要求完成任务。而8-shot则是在提示词中给了8个示例。这说明Claude在不给出示例的情况下,利用提示词里的上下文来推理的能力更强,


图片来源:Anthropic官网

Anthropic表示,Claude能处理超长的上下文,有着近乎完美的记忆力。Claude 3 系列型号在发布时最初将提供 200K 上下文窗口。然而,所有三种模型都能够接受超过 100 万个词元的输入。为了有效地处理长上下文提示,模型需要强大的回忆能力。

一种叫"大海捞针"(NIAH)的评估,是测试Claude大模型从输入的海量数据中准确回忆并找到某个细小信息的能力。Anthropic使用开源文档,每个提示词中放置30个随机问题针,来训练Claude,结果Claude 3 Opus 不仅实现了近乎完美的召回率,超过 99% 的准确率,而且在某些情况下,它甚至识别出提示词中的"针"语句似乎是人类特意插入到原文中的,并识别这个测试本身的局限性。

据科技自媒体"平凡的平凡"测评,把刘慈欣2万字的小说《乡村医生》分别给到Claude 3和GPT-4后,提问历史学家的名字,Claude 3找出了历史学家名字所在段落,而GPT-4没找到。

另外,Anthropic的官方视频还显示,最轻量的Haiku版本Claude 3,可以做到将数千个扫描文档,这些PDF是扫描版而非文字版,即使对于不清晰的字迹,Claude大模型可以用视觉能力,通过上下文的推理来识别文字。随后,Claude 3分析并提取关键词,来转化为结构化的数据。这将简化出版商、医疗供应商、律师事务所的繁重的文件处理业务。

Anthropic 由 OpenAI 前高管 Daniela Amodei 和 Dario Amodei 兄妹于 2021 年创立。2023 年 9 月,亚马逊宣布投资高达 40 亿美元,谷歌随后在次月承诺投资 20 亿美元。2024 年 2 月,风险投资公司 Menlo Ventures 完成了一项额外投资 7.5 亿美元的交易。据纽约时报报道,Anthropic在一年内融资73亿美元。

据The Atlantic报道,2022年11月,当OpenAI高层得知Anthropic要发布Claude聊天机器人时,决定提前上线ChatGPT,随后这场席卷全球的AI风暴就此开启。2023年秋天,当OpenAI的首席执行官Sam Altman被董事会戏剧性地解雇时,董事会曾在那个混乱的周末邀请过Anthropic的首席执行官Dario Amodei来担任OpenAI的代理CEO,但是被Dario拒绝。

在Claude 3发布的几天前,3月1日,特斯拉首席执行官Elon Musk起诉 OpenAI 及其首席执行官Sam Altman,称OpenAI放弃了最初的造福人类的非盈利使命,转向为盈利而开发人工智能。Claude 3发布后,彭博社科技采访Anthropic联合创始人Daniela Amodei,问及Elon Musk起诉OpenAI一事时,Daniela表示Anthropic作为一家公益公司,致力于平衡AI的潜在力量,同时保证产品的可靠、安全,执行公司最初的愿景,即提高人工智能行业的水平,保证投入市场的模型产品尽可能安全。

相关内容

热门资讯

linux入门---制作进度条 了解缓冲区 我们首先来看看下面的操作: 我们首先创建了一个文件并在这个文件里面添加了...
C++ 机房预约系统(六):学... 8、 学生模块 8.1 学生子菜单、登录和注销 实现步骤: 在Student.cpp的...
A.机器学习入门算法(三):基... 机器学习算法(三):K近邻(k-nearest neigh...
数字温湿度传感器DHT11模块... 模块实例https://blog.csdn.net/qq_38393591/article/deta...
有限元三角形单元的等效节点力 文章目录前言一、重新复习一下有限元三角形单元的理论1、三角形单元的形函数(Nÿ...
Redis 所有支持的数据结构... Redis 是一种开源的基于键值对存储的 NoSQL 数据库,支持多种数据结构。以下是...
win下pytorch安装—c... 安装目录一、cuda安装1.1、cuda版本选择1.2、下载安装二、cudnn安装三、pytorch...
MySQL基础-多表查询 文章目录MySQL基础-多表查询一、案例及引入1、基础概念2、笛卡尔积的理解二、多表查询的分类1、等...
keil调试专题篇 调试的前提是需要连接调试器比如STLINK。 然后点击菜单或者快捷图标均可进入调试模式。 如果前面...
MATLAB | 全网最详细网... 一篇超超超长,超超超全面网络图绘制教程,本篇基本能讲清楚所有绘制要点&#...
IHome主页 - 让你的浏览... 随着互联网的发展,人们越来越离不开浏览器了。每天上班、学习、娱乐,浏览器...
TCP 协议 一、TCP 协议概念 TCP即传输控制协议(Transmission Control ...
营业执照的经营范围有哪些 营业执照的经营范围有哪些 经营范围是指企业可以从事的生产经营与服务项目,是进行公司注册...
C++ 可变体(variant... 一、可变体(variant) 基础用法 Union的问题: 无法知道当前使用的类型是什...
血压计语音芯片,电子医疗设备声... 语音电子血压计是带有语音提示功能的电子血压计,测量前至测量结果全程语音播报࿰...
MySQL OCP888题解0... 文章目录1、原题1.1、英文原题1.2、答案2、题目解析2.1、题干解析2.2、选项解析3、知识点3...
【2023-Pytorch-检... (肆十二想说的一些话)Yolo这个系列我们已经更新了大概一年的时间,现在基本的流程也走走通了,包含数...
实战项目:保险行业用户分类 这里写目录标题1、项目介绍1.1 行业背景1.2 数据介绍2、代码实现导入数据探索数据处理列标签名异...
记录--我在前端干工地(thr... 这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 前段时间接触了Th...
43 openEuler搭建A... 文章目录43 openEuler搭建Apache服务器-配置文件说明和管理模块43.1 配置文件说明...