Kimi引燃大模型“长文本竞赛”,阿里360百度急出手:商业化应用场景继续拓宽 Kimi引燃大模型“长文本竞赛”,阿里360百度急出手:商业化应用场景继续拓宽
admin
2024-03-24 15:24:05
0


本报(chinatimes.net.cn)记者石飞月 卢晓 北京报道

从ChapGPT到Sora,从数千亿参数到千万长文本,大模型浪潮下,永远不缺热点。近日,“Kimi概念股暴涨”“Kimi为宕机道歉”等词条先后冲上微博热搜,让月之暗面这家刚成立一年的人工智能公司进入越来越多公众的视野。

3月18日,月之暗面宣布Kimi智能助手启动200万字内测的动作,这引燃了大厂们新一轮“内卷”的热情,阿里巴巴直接将行业最高水平拉到1000万字,百度被曝下月开放200万-500万长度。3月23日下午,360也来凑热闹了,宣布正式内测500万字长文本处理功能。

去年还在拼参数,今年又拼起了长文本/无损上下文,一个大模型让互联网大佬们使尽了全身解数,可见万物皆可AI的大势已经不可阻挡。然而,数据上的领先只是暂时的理论成果,未来,解决问题的能力才是AI公司们真正筑起商业化大楼的底气。

数据比拼

和此前的参数竞赛不同的是,这轮大模型之间的竞争,不只停留在数据层面,还有概念上的“拉扯”。

仅从表面上的数据水平来看,360和百度打的是“安全牌”,并未在数据上猛冲。3月23日,360AI浏览器宣布正式内测500万字长文本处理功能,据用户反馈,该浏览器目前已可一分钟读完《三体》,并就文本外的“超纲”问题进行问答和延展学习。而在2月底时,360AI浏览器就已向用户免费开放100万字长文本阅读功能。

目前,360AI浏览器PC端已可免费下载使用,移动端也即将上线各大移动平台,该浏览器同时也支持对视频、音频、网页和中英文论文等常用文档类型的处理,可以帮助用户自动总结要点、生成思维导图等。

百度也被曝将于下个月对文心一言进行升级,届时也将开放长文本能力,文本范围在200万-500万。

相较于360和百度的“安全牌”,阿里巴巴打出的则是“一鸣惊人牌”,通义千问升级后直接向所有人免费开放1000万字的长文档处理功能,成为全球文档处理容量第一的AI应用。据悉,所有金融、法律、科研、医疗等领域的专业人士,都可通过通义千问网站和App快速读研报、分析财报、读科研论文、研判案情等。

要知道,目前国外头部大模型中,Open AI的GPT-4Turbo上下文窗口为12.8万tokens,谷歌的Gemini1.5支持100万tokens上下文。1个汉字通常相当于1-2个token,单从理论上分析,360AI浏览器、文心一言和通义千问的上下文窗口已经是这些头部大模型的好几倍。

而一开始引燃这场“战争”的月之暗面,给出的数据是200万,虽然和以前的20万字相比有极大提升,但和阿里巴巴的1000万字相比,还是小巫见大巫了。

概念“拉扯”

对于数据上的差距,月之暗面有自己的想法。

首先在概念上,月之暗面给出的是200 万字无损上下文长度,而不是长文本。“之所以不能称为‘长文本’,是因为输入的信息不只是文本,也可以是图片、录音、视频、动作等多模态的信息。”月之暗面相关负责人对《华夏时报》记者表示。

另外,上述负责人指出,一些产品对数百万甚至上千万字的文档支持,通常采用的并不是无损长上下文窗口的方案,而是一种被称为检索增强生成(RAG)的方案,这种方式是从文档中搜索出相关的部分内容,然后将这些内容给到大模型去做推理,模型的真实上下文窗口长度,也就是真正输入给模型去推理的内容,仍然是 3 万字左右(以当前市场上常见的32K上下文窗口模型为例)。“以读书来比喻的话,支持长上下文窗口的模型是真的逐字读了一本书,然后跟你讨论书的内容;RAG方案是读了几个摘抄片段,然后跟你讨论书的内容。讨论的深度和精度自然不可同日而语。”

一石激起千层浪,或许就连月之暗面也没想到,自己的一个动作能引发这么多互联网大佬的竞逐,让AI市场再起涟漪。

月之暗面为200万字无损上下文的能力提供了多个场景,也确实吸引了众多尝鲜的用户:上传一份完整的近百万字中医诊疗手册,让 Kimi 针对用户的问题给出诊疗建议;上传英伟达过去几年的完整财报,让 Kimi分析总结英伟达历史上的重要发展节点;上传几十万字的经典德州扑克长篇教程,让 Kimi 扮演德扑专家提供出牌策略的指导……

由于众多用户涌入,系统流量持续异常增高,3月21日Kimi的App和小程序出现宕机现象,月之暗面对此表示抱歉。

有意思的是,当国内大模型卷向长文本的同时,爱跨界的马斯克还在卷参数。3月18日,马斯克的AI创企xAI正式发布开源大模型Grok-1,其参数量达到3140亿,超过OpenAI GPT-3.5的1750亿,一举成为迄今参数量最大的开源大语言模型。

艾媒咨询CEO兼首席分析师张毅对《华夏时报》记者表示,参数之争到长文本之争的变化,本质上是大模型更加贴近用户的使用和需求场景。“长文本的主要应用领域,目前主要集中在方案、合同、论文、法律文书、科普、小说、文字策划、广告创意等文本处理的场景。”

因此当Kimi突然爆火时,大涨的概念股基本为影视、传媒类的公司。截至3月22日收盘,慈文传媒涨停,华策影视、掌阅科技和中广天择都是三连板。

商业价值待估

除了引燃概念股,Kimi的跨越式升级也在业内引发了对AI应用落地和商业化的期待。

平安证券发布研究报告称,Kimi无损长文本模型的出现,解决了很多大模型在应用中的痛点,打开了大模型的应用空间,AIGC最终的落地,还是要找到合适的场景,Kimi作为千亿大模型,能够支持复杂运算,同时还能接受和处理大文本,解决了很多大模型实际应用中的难题,后续商业化潜力将凸显。

那么,接下来要探讨的问题,就是商业模式。

张毅推断,GPT是用户通过付费方式使用的,但国内的大模型竞争在初期就如此激烈,很有可能会走上过去搜索引擎的路子,免费恐怕是一个主要方向。“所以未来也可能是‘羊毛出在猪身上’成为普遍现象,当然,垂直化应用场景、个性化解决方案,也是大模型文本未来的商业突破之道。”

随着Kimi的爆火,月之暗面自身的商业化诉求正在变得强烈。该公司相关负责人向《华夏时报》记者透露,面对高峰时期 Kimi 会提示需要等待等问题,有用户反映是否可以付费解决,所以今年公司会有初步的方案出来。

商业化诉求背后是文本能力越强成本越高的现实问题。上述负责人表示,当模型支持的上下文窗口长度越长,精度越高(信息越无损),模型推理成本也会呈指数级上升,所以月之暗面会在工程上做一些创新探索,想办法尽快降低成本,让更多有需求的用户体验到超长无损上下文窗口能力。“如果是检索增强生成(RAG)的方案,模型本身的推理成本几乎没有变化,因为实际输入模型的上下文窗口长度没有发生变化。”

对于长文本带来的成本变化和商业化问题,《华夏时报》记者也采访了360方面,截至发稿,对方未给出回复。

但数据上的比拼,以及商业化能力的体现,最终还是要落实到真正的应用、用户体验上。

在张毅看来,从某种意义上讲,如果应用体验做得足够好,大模型长文本的商业化应用场景是存在的。“目前大模型的智能化程度还有待改善,结合具体的应用需求,国内大模型在数据、文字和设计创新上与国外头部大模型相比还有一定的差距,未来长文本的发展格局,或许就是看哪家能在这些方面有更好的表现,是否能够形成更大的竞争力。”

责任编辑:黄兴利 主编:寒丰

相关内容

热门资讯

linux入门---制作进度条 了解缓冲区 我们首先来看看下面的操作: 我们首先创建了一个文件并在这个文件里面添加了...
C++ 机房预约系统(六):学... 8、 学生模块 8.1 学生子菜单、登录和注销 实现步骤: 在Student.cpp的...
A.机器学习入门算法(三):基... 机器学习算法(三):K近邻(k-nearest neigh...
数字温湿度传感器DHT11模块... 模块实例https://blog.csdn.net/qq_38393591/article/deta...
有限元三角形单元的等效节点力 文章目录前言一、重新复习一下有限元三角形单元的理论1、三角形单元的形函数(Nÿ...
Redis 所有支持的数据结构... Redis 是一种开源的基于键值对存储的 NoSQL 数据库,支持多种数据结构。以下是...
win下pytorch安装—c... 安装目录一、cuda安装1.1、cuda版本选择1.2、下载安装二、cudnn安装三、pytorch...
MySQL基础-多表查询 文章目录MySQL基础-多表查询一、案例及引入1、基础概念2、笛卡尔积的理解二、多表查询的分类1、等...
keil调试专题篇 调试的前提是需要连接调试器比如STLINK。 然后点击菜单或者快捷图标均可进入调试模式。 如果前面...
MATLAB | 全网最详细网... 一篇超超超长,超超超全面网络图绘制教程,本篇基本能讲清楚所有绘制要点&#...
IHome主页 - 让你的浏览... 随着互联网的发展,人们越来越离不开浏览器了。每天上班、学习、娱乐,浏览器...
TCP 协议 一、TCP 协议概念 TCP即传输控制协议(Transmission Control ...
营业执照的经营范围有哪些 营业执照的经营范围有哪些 经营范围是指企业可以从事的生产经营与服务项目,是进行公司注册...
C++ 可变体(variant... 一、可变体(variant) 基础用法 Union的问题: 无法知道当前使用的类型是什...
血压计语音芯片,电子医疗设备声... 语音电子血压计是带有语音提示功能的电子血压计,测量前至测量结果全程语音播报࿰...
MySQL OCP888题解0... 文章目录1、原题1.1、英文原题1.2、答案2、题目解析2.1、题干解析2.2、选项解析3、知识点3...
【2023-Pytorch-检... (肆十二想说的一些话)Yolo这个系列我们已经更新了大概一年的时间,现在基本的流程也走走通了,包含数...
实战项目:保险行业用户分类 这里写目录标题1、项目介绍1.1 行业背景1.2 数据介绍2、代码实现导入数据探索数据处理列标签名异...
记录--我在前端干工地(thr... 这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 前段时间接触了Th...
43 openEuler搭建A... 文章目录43 openEuler搭建Apache服务器-配置文件说明和管理模块43.1 配置文件说明...