OpenAI发布会回顾:最新旗舰模型免费用 ChatGPT进入实时互动纪元 open ai劲敌发布新款大模型 open ai发布会总结
admin
2024-05-14 04:59:09
0

财联社5月14日讯(编辑 史正丞)北京时间周二凌晨1点,自年初“文生视频模型” Sora后许久未给市场带来惊喜的OpenAI举行春季发布会。公司首席技术官Mira Murati向外界展现了多项与ChatGPT有关的更新。


简要来说,OpenAI的发布会主要干了两件事情:发布最新GPT-4o多模态大模型,相较于GPT-4 Trubo速度更快、价格也更便宜

通过响应速度的大幅提升,该模型在语音模式下已经可以达到“实时”响应的状态。用户可以与ChatGPT像真人一样聊天——在机器人回应的过程中打断它,提出更多的要求(例如转变话题、要求机器人改变语音语调),再也不需要等待机器人完成上一个问题的回复后,再提出新的问题。

第二件事情就是宣布,ChatGPT的免费用户也能用上最新发布的GPT-4o模型(更新前只能使用GPT-3.5),来进行数据分析、图像分析、互联网搜索、访问应用商店等操作。这也意味着GPT应用商店的开发者,将面对海量的新增用户。

当然,付费用户将会获得更高的消息限制(OpenAI说至少是5倍)。当免费用户用完消息数量后,ChatGPT将自动切换到 GPT-3.5。另外,OpenAI将在未来1个月左右向Plus用户推出基于GPT-4o改进的语音体验,目前GPT-4o的API并不包含语音功能。

最后,苹果电脑用户将迎来一款为macOS设计的ChatGPT桌面应用,用户可以通过快捷键“拍摄”桌面并向ChatGP提问,OpenAI表示,Windows版本将在今年晚些时候推出。

----发布会直击全程回顾----

01点00分:倒计时结束,直播正式开始。首席技术官Mira Murati登场。


01点01分:Mira Murati表示,今天她将谈论3件事情:1)为什么一个可以免费、广泛使用的工具对于OpenAI非常重要?2)如何减少摩擦,让每个人都能使用ChatGPT,公司将发布桌面版的ChatGPT;3)公司将在今日发布最新的旗舰大模型,叫做GPT-4o。

这里的“o”指的是“全方位”(omni)的意思——指的是GPT-4o的多模态特性。


01点05分:对于桌面版的ChatGPT,OpenAI表示重新对UI进行了设计。(注:OpenAI在公告中表示,桌面应用程序适用于macOS,Windows版本将在今年晚些时候推出)


01点08分:GPT-4o具备GPT-4同等的智能,但运行速度更快,兼具文字、音频和视频能力。这是OpenAI历史上第一次在“便于使用”这个目标上实现了飞跃的进步。

01点13分:直到今天之前,在语音模式下,OpenAI仍需要调用三个模型——转写、智能和文生语音功能,这也造成了体验上的巨大延迟。而GPT-4o可以自然地在图片、文件和声音上进行推理

01点17分:通过效率的提升,也使得OpenAI可以向免费用户提供GPT-4级别的智能

01点19分:Murati重申,由于GPT-4o带来的效率提升,现在OpenAI可以让所有人都能使用上(GPT-4)工具。

01点20分:目前GPT Store里已经有超过100万个GPTs。伴随着免费开放,GPTs的开发者将获得更大的用户基数。


01点22分:免费用户也将能够上传图片、进行分析、使用“浏览器”功能搜索实时信息。同时GPT-4o也将支持记忆功能。GPT-4o也将支持API,供开发者调用。相较于GPT-4 Turbo,GPT-4o快两倍、便宜50%,速率限制高出5倍。


01点25分:两名研究主管Mark Chen和Barret Zoph登台,他们将演示一系列新功能。


01点26分:Mark Chen正在与ChatGPT寒暄,机器人能够从急促的喘气声中理解“紧张”的含义,并且指导他进行深呼吸。


01点28分:Chen表示,他的演示是为了说明,在目前的语音模式下,不需要再与机器进行机械的一问一答,可以进行实时的沟通交流。实时交流中不需要再每次“尴尬地等待2-3秒”。

01点30分:实时演示中,主持们不断要求ChatGPT变换语调,包括夸张的语气、机器人的预期和使用“唱腔”讲故事。


01点35分:Barret Zoph启动摄像头,要求ChatGPT实时帮助他解决一个一元方程题。


01点37分:除了图像识别和解题能力外,ChatGPT展现了实时根据影像变化,与Barret实时互动的能力。


01点40分:Barret进一步展示了ChatGPT桌面版对代码和电脑桌面(一张气温图表)进行实时解读的能力。



01点42分:Murati和Mark Chen展示ChatGPT进行意大利语、英语的实时交传翻译。


发布会结束,OpenAI表示今天的发布会主要聚焦于免费用户,这些功能将在未来几周内逐步向所有用户推送。

根据OpenAI的官网公告显示,GPT-4o将同时向付费的Plus、Team用户,以及免费用户推出。Plus 用户的消息限制数量将是免费用户的5倍,Team和Enterprise用户的可用消息数量还会更高一些。当免费用户的使用量达到限制后,ChatGPT将自动切换到GPT-3.5,以便继续进行对话。


相关内容

热门资讯

linux入门---制作进度条 了解缓冲区 我们首先来看看下面的操作: 我们首先创建了一个文件并在这个文件里面添加了...
C++ 机房预约系统(六):学... 8、 学生模块 8.1 学生子菜单、登录和注销 实现步骤: 在Student.cpp的...
A.机器学习入门算法(三):基... 机器学习算法(三):K近邻(k-nearest neigh...
数字温湿度传感器DHT11模块... 模块实例https://blog.csdn.net/qq_38393591/article/deta...
有限元三角形单元的等效节点力 文章目录前言一、重新复习一下有限元三角形单元的理论1、三角形单元的形函数(Nÿ...
Redis 所有支持的数据结构... Redis 是一种开源的基于键值对存储的 NoSQL 数据库,支持多种数据结构。以下是...
win下pytorch安装—c... 安装目录一、cuda安装1.1、cuda版本选择1.2、下载安装二、cudnn安装三、pytorch...
MySQL基础-多表查询 文章目录MySQL基础-多表查询一、案例及引入1、基础概念2、笛卡尔积的理解二、多表查询的分类1、等...
keil调试专题篇 调试的前提是需要连接调试器比如STLINK。 然后点击菜单或者快捷图标均可进入调试模式。 如果前面...
MATLAB | 全网最详细网... 一篇超超超长,超超超全面网络图绘制教程,本篇基本能讲清楚所有绘制要点&#...
IHome主页 - 让你的浏览... 随着互联网的发展,人们越来越离不开浏览器了。每天上班、学习、娱乐,浏览器...
TCP 协议 一、TCP 协议概念 TCP即传输控制协议(Transmission Control ...
营业执照的经营范围有哪些 营业执照的经营范围有哪些 经营范围是指企业可以从事的生产经营与服务项目,是进行公司注册...
C++ 可变体(variant... 一、可变体(variant) 基础用法 Union的问题: 无法知道当前使用的类型是什...
血压计语音芯片,电子医疗设备声... 语音电子血压计是带有语音提示功能的电子血压计,测量前至测量结果全程语音播报࿰...
MySQL OCP888题解0... 文章目录1、原题1.1、英文原题1.2、答案2、题目解析2.1、题干解析2.2、选项解析3、知识点3...
【2023-Pytorch-检... (肆十二想说的一些话)Yolo这个系列我们已经更新了大概一年的时间,现在基本的流程也走走通了,包含数...
实战项目:保险行业用户分类 这里写目录标题1、项目介绍1.1 行业背景1.2 数据介绍2、代码实现导入数据探索数据处理列标签名异...
记录--我在前端干工地(thr... 这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 前段时间接触了Th...
43 openEuler搭建A... 文章目录43 openEuler搭建Apache服务器-配置文件说明和管理模块43.1 配置文件说明...