AI长文本之战:Kimi快跑,大厂围剿 | 焦点分析 AI长文本之战:Kimi快跑,大厂围剿 | 焦点分析
admin
2024-03-28 09:10:31
0

文 | 周鑫雨

编辑 | 苏建勋

一条名为“Kimi”的鲶鱼,将大模型公司卷到了长文本的新战场。

这款来自AI独角兽月之暗面的大模型对话产品,最大的标签就在于“长”。上下文窗口的大小,代表着一个模型的记忆力。窗口越长,模型单次可处理的文本就越长。对用户而言,模型能读懂的文字越多,在学习、工作等场景下就越有用。

深谙营销之道的月之暗面,是国内乃至全球范围内,第一家将“长文本”作为标签的大模型公司。2023年10月30日,打着“全球首个支持输入20万汉字”名号的Kimi Chat就快速在一堆卷榜单、卷参数的模型中,拥有了辨识度。

Kimi有多火?国信证券的调研显示,从2023年10月到2024年3月,Kimi的DAU从10万攀升到了300多万,翻了30倍。自春节起大规模投放广告后,SimilarWeb数据显示,Kimi的访问量在2月增长了107.6%,仅次于百度的文心一言和阿里的通义千问。3月21日,无法承接过多用户的Kimi App和小程序一度宕机,用户需要排队才能正常使用。

Kimi的爆火,还直接牵动了股市——一些与月之暗面有合作传闻的上市公司,被冠以“Kimi概念股”之名,股价飙升。后续纷纷出来辟谣的海天瑞声、中广天择,已经先吃上了Kimi的红利,在3月20日应声涨停。这段时间,沪深互动平台最多的问题是“公司是否与Kimi助手有合作”,又或是“公司有接入Kimi吗”。


网上流传的“Kimi概念股”名单。

在2024年3月24日的一场用户活动上,月之暗面的几位产品负责人直言:“我们不敢说太多,还是希望大家关注产品本身。”

而一场对Kimi的长文本围剿战,也已经在大厂中打响。3月23日,360 AI 浏览器宣布内测500万字长文本处理功能。百度的文心一言也被曝将在4月开放长文本功能,长度在200万-500万。阿里的通义千问则一口气免费开放了1000万字的长文档处理功能,坐上了“全球第一长”的宝座。

可炮制的技术,被验证的需求

Kimi带起的长文本之火,无外乎两个原因:技术门槛不高,市场需求已经被月之暗面初步验证。

2023年10月9日,Kimi带着“全球首个支持输入20万汉字”的标签走进大众视野。彼时,这一上下文窗口长度达到了Claude-100K(约8万字)的2.5倍,GPT-4-32K(约2.5万字)的8倍。

不过,多名从业者对36氪表示,长文本处理的技术壁垒并不高。长文本建模的方案,主要有外部召回(借助外部工具处理长文本或者利用外部记忆存储上下文向量)、模型优化、注意力计算优化三种,而每一种都有公开的研究论文和技术方案。

很快,Kimi“20万字”的记录就被他人打破。2023年10月30日,Kimi首发仅过了21天,王小川的百川智能就推出了上下文窗口达192K的大模型Baichuan2-192K,单次能处理35万个汉字。11月,王座再次易位,李开复成立的零一万物,又发布了能够处理约40万字的大模型Yi-34B,是Kimi的约2倍。

长文本带来的模型竞速,最根本的原因,还是在于看到了庞大的消费群体。

“C端用户对大模型的需求无外乎两种,一是提效工具,二是娱乐工具。”一名AI从业者告诉36氪。他认为,目前AI对短文本的理解和生成能力,还没完全超过人类,比如看咨询、写短文案,“人用在修改AI生成的文案的时间,其实不比自己从头想来的少。”

但大模型相较于人的竞争力,恰恰在于理解长文本的效率。“10万字的论文,一般人读完起码要30小时,还是在不休息的情况下,但大模型只要几分钟。”

一名法律行业AI产品经理向36氪提及,问答机器人、模拟法庭等AI产品在专业度高、实践性强的法律行业都跑不通,唯一能跑通的只有对判决文书等长文本的总结,而“Kimi是目前律师等法律专业用户认可度最高的一款AI产品”,不少律师用Kimi来总结资料,输出法律文书。

Kimi的火爆,是苦于C端变现途径的大厂所垂涎的。在大模型落地的打法上,体系庞大的大厂们,采用的基本是模型+云服务、AI功能+原有产品的保守打法。在B端,这样的打法初见成效。百度在2023年的财报中,强调了大模型对云等B端业务的推动。

但大模型对App、搜索等C端产品营收的助推,依然是个谜。百度财报显示,2023年12月,百度App的月活达6.67亿,同比增长了3%——然而,这个数字与9月的6.63亿基本持平,不及6月的6.77亿。

而Kimi证明了,不采用和其他产品的“打包”模型,大模型本身也有拉新造血的潜力。通过月之暗面这个对手,大厂们完成了对长文本的市场验证。

Kimi的难题是商业模式,大厂的难题是获客

但要让长文本真正造血,厂商们担心的仍然是高昂的成本。

日前,Kimi的获客成本就引发了讨论。据新浪科技获得的数据,算上广告投放和算力成本,Kimi每个用户的获客成本达12-13元,按照近一个月17804的日均下载量计算,Kimi每日的获客成本高达20万元。


Kimi在B站投放的广告。

每日20万元的获客成本,加之随着参数规模水涨船高的大模型研发费用,对尚未商业化造血的月之暗面而言,烧钱的局面依然要维持一段时间。

初创公司的另一难题,则在于如何运营如此庞大的用户群体,并提供稳定的服务。2024年3月21日下午,由于用户数超出负荷,Kimi的App和小程序一度无法正常使用,用户需要排队等待。

但月之暗面的困境,对于作为后来者的大厂们而言并非难题。亿欧智库2022年3月的数据显示,中国互联网企业的平均获客成本在380-580元之间。

可以说,Kimi人均不到20元的获客成本,对于大厂而言,反倒是用更低的获客成本,找到了新的流量入口。

而在服务质量上,算力资源、人力资源充足的大厂,更容易输出稳定的服务。而在技术上,一名AI从业者告诉36氪,将可以处理1000万字的通义千问后和Kimi比较,可以发现同等文本的解读,通义千问的总结完成度略高一筹。甚至于,360的长文本功能,增加了摘要和思维导图的能力。

但后来者的劣势,也恰恰在于失去了先发优势和辨识度。

当面向庞大的C端用户,亮眼的营销手段显得格外重要。被当成过河搭石的Kimi,胜在有一个别出心裁的亮相,早早就贴上了“长文本”的标签,在一众大模型模糊的面孔中打出了差异化。至少提到“长文本”,用户脑海中最先跳出的,大概率是月之暗面的Kimi。

而大厂的包袱,还在于要为用户提供更完整、更复杂的产品体系。不少体验过各家大模型产品的用户都告诉36氪,大厂模型产品的UI设计、插件生态很复杂,功能过多,导致用户的需求要经过多步操作解决。但Kimi的界面很简洁,对于用户而言,使用门槛反而降低了。


Kimi首页。

Kimi的爆火已经为商业化创造了时机。月之暗面表示,有用户反映是否可以用付费解决等待的问题,今年公司会有初步的商业化方案。

只是找到合适的商业模式,证明自身的造血能力,是月之暗面接下来面临的考题。面对异军突起长文本之战,当Kimi在用户前构筑了一道付费墙,能否贴牢“长文本第一家”的标签,还未可知。

欢迎交流

相关内容

热门资讯

linux入门---制作进度条 了解缓冲区 我们首先来看看下面的操作: 我们首先创建了一个文件并在这个文件里面添加了...
C++ 机房预约系统(六):学... 8、 学生模块 8.1 学生子菜单、登录和注销 实现步骤: 在Student.cpp的...
A.机器学习入门算法(三):基... 机器学习算法(三):K近邻(k-nearest neigh...
数字温湿度传感器DHT11模块... 模块实例https://blog.csdn.net/qq_38393591/article/deta...
有限元三角形单元的等效节点力 文章目录前言一、重新复习一下有限元三角形单元的理论1、三角形单元的形函数(Nÿ...
Redis 所有支持的数据结构... Redis 是一种开源的基于键值对存储的 NoSQL 数据库,支持多种数据结构。以下是...
win下pytorch安装—c... 安装目录一、cuda安装1.1、cuda版本选择1.2、下载安装二、cudnn安装三、pytorch...
MySQL基础-多表查询 文章目录MySQL基础-多表查询一、案例及引入1、基础概念2、笛卡尔积的理解二、多表查询的分类1、等...
keil调试专题篇 调试的前提是需要连接调试器比如STLINK。 然后点击菜单或者快捷图标均可进入调试模式。 如果前面...
MATLAB | 全网最详细网... 一篇超超超长,超超超全面网络图绘制教程,本篇基本能讲清楚所有绘制要点&#...
IHome主页 - 让你的浏览... 随着互联网的发展,人们越来越离不开浏览器了。每天上班、学习、娱乐,浏览器...
TCP 协议 一、TCP 协议概念 TCP即传输控制协议(Transmission Control ...
营业执照的经营范围有哪些 营业执照的经营范围有哪些 经营范围是指企业可以从事的生产经营与服务项目,是进行公司注册...
C++ 可变体(variant... 一、可变体(variant) 基础用法 Union的问题: 无法知道当前使用的类型是什...
血压计语音芯片,电子医疗设备声... 语音电子血压计是带有语音提示功能的电子血压计,测量前至测量结果全程语音播报࿰...
MySQL OCP888题解0... 文章目录1、原题1.1、英文原题1.2、答案2、题目解析2.1、题干解析2.2、选项解析3、知识点3...
【2023-Pytorch-检... (肆十二想说的一些话)Yolo这个系列我们已经更新了大概一年的时间,现在基本的流程也走走通了,包含数...
实战项目:保险行业用户分类 这里写目录标题1、项目介绍1.1 行业背景1.2 数据介绍2、代码实现导入数据探索数据处理列标签名异...
记录--我在前端干工地(thr... 这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 前段时间接触了Th...
43 openEuler搭建A... 文章目录43 openEuler搭建Apache服务器-配置文件说明和管理模块43.1 配置文件说明...