国内大模型能达到Sora水平吗?权威解读来了 为什么说sora是世界模型 大模型sora视频
admin
2024-04-14 13:16:52
0


本报(chinatimes.net.cn)记者李明会 北京报道

伴随着ChatGPT、Sora、Figure01不断引发全球关注,人工智能(AI)的惊人迭代速度不断扩展着人们的想象空间。

中国正发出拥抱新一轮科技和产业浪潮的新信号,发力以人工智能为引擎的新质生产力。

自2017年以来,人工智能多次被写入《政府工作报告》。2024年两会期间,“人工智能+”首次被写入《政府工作报告》。报告提出,深化大数据、人工智能等研发应用,开展“人工智能+”行动,打造具有国际竞争力的数字产业集群。

问题随之而来,作为人工智能发展的核心引擎,国外的大模型不断引爆国内舆论场、刷新大众认知,我们的国产大模型还能弯道超车吗?今年是大模型应用元年,在现实的不同场景之下,大模型又将与产业擦出什么样的火花?

4月13日晚间,中央广播电视总台财经节目中心《对话》栏目播出了新一期节目《AI+未来大猜想》。四位企业家——360集团创始人周鸿祎、国产大模型独角兽智谱AI CEO(首席执行官)张鹏、人形机器人初创公司九光智能创始人徐志根、广药集团董事长李楚源,以及三位财经媒体代表——《华夏时报》执行总编辑张志伟、《中国企业家》杂志副总编辑何伊凡、《财经》杂志副主编朱弢,和中央电视台主持人靳强一道共同探讨人工智能的技术发展、商业化路径等话题。

对于上述两个问题,本文撷取了相关节目要点。

大模型做“小”也能弯道超车

靳强:OpenAI发布Sora,掀起新一轮对人工智能的讨论热潮,国产大模型能达到Sora的水平吗?

张鹏:Sora确实令人惊艳,但我们仔细研究了它的技术报告之后,发现它并没有外界看起来的那么新奇。Sora运用到的仍是已有的技术,只不过OpenAI把这些技术综合起来从工程上进行了优化,做到了之前的人没有做到的事情。

我觉得,国产大模型能否做到Sora这种水平就是一个资源和时间的问题。因为Sora本身还有很多创新的技术大家还在研究,我也不敢特别准地去预测需要多少时间,但我相信应该不需要太久。

张志伟:周鸿祎先生在今年两会期间接受《华夏时报》记者采访时曾表示,中国大模型的水平相当于美国GPT-3.5的水平。如何做出这个判断?

周鸿祎:首先,我认为有差距是必然的,知道差距是多少,剩下的就是追赶问题。

我现在说话比较谨慎,你说大了,别人说你自卑;你说小了,别人说你自大。按照刷榜的成绩,国内的模型早就超过了GPT-4了。但真正用一用,我觉得国内的大部分都达到或者超过了GPT-3.5的能力,全世界也就只有中国有这个能力。

如果GPT-4是100分的话,GPT-3.5差不多应该有75分到80分,我认为这个速度就很快了。

其次,美国也不是全面领先,美国真正在人工智能领先的公司,我认为就两家,软件是OpenAI,硬件是英伟达。

我认为,大模型比光刻机、芯片的难度要低很多,因为毕竟是软件,但未来是要奔着AGI,也就是通用人工智能去的,这块的挑战就是算力。

但如果把大模型越做越小,走垂直化、产业化、企业化、场景化的道路,可能不需要万亿、千亿的参数,只需要百亿的参数,再加上一些私有的核心数据加持,在一个垂直单元上是可以超过GPT-4的。这就对算力的要求就降到很低,可能有十张消费级显卡在一个场景就能用起来,非常适合我们国家,这也是我们弯道超车的一个场景。

我们有这么多的工业门类,国家这么重视制造业的数字化转型,如果中国企业都用上了这种小规模的大模型,在自己的场景上让大模型跟业务相结合,其意义不亚于我们在超级AGI上追赶国外。

大模型与产业的结合:小切口,大纵深

张志伟:周鸿祎先生说过,今年是大模型场景应用元年。关于大模型如何与产业相结合,你提出了一个理念,叫“小切口,大纵深”。能不能展开聊聊?

周鸿祎:我们去年从to B模式中找到一些方法论。

比如,要给医疗机构做一个医药医疗大模型,必须把医疗进行场景细分——在里边找出50到100个场景,并对每个场景分析,看看文章生成、情感判断、内容翻译等大模型最常见的功能能不能发挥作用。

能不能做这个大模型取决于两个因素:一是场景下有没有数据知识,因为没有知识、光有场景,训不出大模型。二是看大模型的容错度,因为大模型最致命的就是“幻觉”,如果某个场景中不能承受幻觉风险,那这个场景就不能用到大模型里。

所以我主张要在企业用大模型不要一下子宏大叙事,而是在内部业务链条,或在外部产品功能中,选取两到三个场景,用大模型赋能。如果能取得成绩,我认为就已经是很大的进步了。所以,我谈的“小切口”,就是刚开始宁可保守一点,积小胜于大胜。

而“大纵深”是什么概念呢?大模型像发动机,现在大模型厂商在造世界上最牛、最快的发动机,但是B端企业要的不是发动机,而是一辆车。所以,我们要找到一个底盘,把发动机装上,再给它装上外壳、座椅,最后交付一辆车,企业才能用。

2023年,中国有上百家公司在做大模型,鱼龙混杂,泥沙俱下。今年就消停很多了,因为很多企业知道,有些特别难的事自己也做不了。据我了解,现在的大模型厂商纷纷转型,往产业方向走、往垂直方向走。

张鹏:通用大模型的能力提升所衍生的能力,能让我们去寻找到“大模型原生的应用”或者“大模型原生场景”。但是在这个过程当中,技术需要发展,产业也需要落地。打个比方,现在我们造出内燃机了,不能说我想造飞机,内燃机不能用,我不管了,我要造喷气发动机去。既然内燃机可以造出汽车,那就先把汽车造出来,我觉得这是不矛盾的一件事情。

责任编辑:孟俊莲 主编:张志伟

相关内容

热门资讯

linux入门---制作进度条 了解缓冲区 我们首先来看看下面的操作: 我们首先创建了一个文件并在这个文件里面添加了...
C++ 机房预约系统(六):学... 8、 学生模块 8.1 学生子菜单、登录和注销 实现步骤: 在Student.cpp的...
A.机器学习入门算法(三):基... 机器学习算法(三):K近邻(k-nearest neigh...
数字温湿度传感器DHT11模块... 模块实例https://blog.csdn.net/qq_38393591/article/deta...
有限元三角形单元的等效节点力 文章目录前言一、重新复习一下有限元三角形单元的理论1、三角形单元的形函数(Nÿ...
Redis 所有支持的数据结构... Redis 是一种开源的基于键值对存储的 NoSQL 数据库,支持多种数据结构。以下是...
win下pytorch安装—c... 安装目录一、cuda安装1.1、cuda版本选择1.2、下载安装二、cudnn安装三、pytorch...
MySQL基础-多表查询 文章目录MySQL基础-多表查询一、案例及引入1、基础概念2、笛卡尔积的理解二、多表查询的分类1、等...
keil调试专题篇 调试的前提是需要连接调试器比如STLINK。 然后点击菜单或者快捷图标均可进入调试模式。 如果前面...
MATLAB | 全网最详细网... 一篇超超超长,超超超全面网络图绘制教程,本篇基本能讲清楚所有绘制要点&#...
IHome主页 - 让你的浏览... 随着互联网的发展,人们越来越离不开浏览器了。每天上班、学习、娱乐,浏览器...
TCP 协议 一、TCP 协议概念 TCP即传输控制协议(Transmission Control ...
营业执照的经营范围有哪些 营业执照的经营范围有哪些 经营范围是指企业可以从事的生产经营与服务项目,是进行公司注册...
C++ 可变体(variant... 一、可变体(variant) 基础用法 Union的问题: 无法知道当前使用的类型是什...
血压计语音芯片,电子医疗设备声... 语音电子血压计是带有语音提示功能的电子血压计,测量前至测量结果全程语音播报࿰...
MySQL OCP888题解0... 文章目录1、原题1.1、英文原题1.2、答案2、题目解析2.1、题干解析2.2、选项解析3、知识点3...
【2023-Pytorch-检... (肆十二想说的一些话)Yolo这个系列我们已经更新了大概一年的时间,现在基本的流程也走走通了,包含数...
实战项目:保险行业用户分类 这里写目录标题1、项目介绍1.1 行业背景1.2 数据介绍2、代码实现导入数据探索数据处理列标签名异...
记录--我在前端干工地(thr... 这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 前段时间接触了Th...
43 openEuler搭建A... 文章目录43 openEuler搭建Apache服务器-配置文件说明和管理模块43.1 配置文件说明...