当端侧应用爆发撞上港股技术性牛市,商汤拐点已至 港股迈入技术性牛市 港股迎来技术性牛市
admin
2024-05-08 10:32:29
0


大模型怎么赚钱?商汤给出了新答案。

作者| 瀚星

封面来源|商汤秒画

AI竞赛进入下半场,不仅要继续死磕技术,还要回答另一个问题:大模型怎么赚钱?

在4月23日的技术交流日上,商汤科技发布全新升级的“日日新SenseNova 5.0”大模型,给行业打了个样。

升级后的大模型具备更强的知识、数学、推理及代码能力,综合性能全面对标GPT-4 Turbo,并在主流客观评测上达到或超越GPT-4 Turbo。



同步发布的还有应用于终端设备的“商汤端侧大模型”,以及面向金融、代码、医疗、政务等多个领域的边缘产品“商汤企业级大模型一体机”。

这些产品共同构成了人工智能行业内首个“云、端、边”全栈大模型产品矩阵。

对此,市场迅速给出反应,商汤股价在三个交易日内翻倍,并在五一假期“港股通”暂停的情况下,继续上攻至1.7港元附近,创半年股价最高值。

相比2023年日日新1.0发布后资本市场的谨慎乐观,到此次日日新5.0后的“热辣滚烫”,市场反应为何如此热烈?

商汤“朋友圈”亮相:小米、金山等生态伙伴现身站台

作为一家成立超过10年的AI公司,商汤无疑在人工智能和大模型领域有长期的投入和积累。但随着AI热潮下竞争环境加剧,大模型的高推理成本和高研发投入,越来越需要合理的商业落地来实现可持续发展。

经历初期的大模型热潮后,市场对于“百模大战”中的各家都保持相对谨慎态度,在公众认知里,国内大模型仍然与ChatGPT有着显而易见的差距,而利用市场和场景优势,从卷参数迅速进入到卷应用阶段,逐步成为行业共识。

商汤董事长兼CEO徐立同样表示:“比起去年,我们的认知有很大迭代。去年我们主要聚焦在模型本身的参数发布,今年则更多关注行业场景的落地,以行业来驱动人工智能的爆发。”


OpenCompass 2.0独立测评 蓝色:GPT-4 Turbo,红色:日日新 5.0

此次日日新5.0不仅对标GPT4-Turbo,显著拉平了与海外大模型的技术差距。更值得关注的是,海通证券、金山WPS、小米、阅文等合作伙伴悉数现身站台,让投资者“眼见为实”,大大提升了商汤大模型落地的可信性。

小米集团小爱总经理王刚现场分享和商汤并肩作战的小故事让人印象尤为深刻。

众所周知,雷军对于产品的要求很高。距离小米SU7正式发布倒计时两个多月,小爱同学在车端的Demo演示没有达到雷军要求,并提出了多个限时修改要求,整个团队压力很大。王刚团队将这些要求分别给到三个合作伙伴,并预期在一周内完成所有优化。让王刚感到意外的是,“商汤的同学两三天就把所有需求都干完了,而且整个体验表现非常不错。”

王刚总结了商汤大模型的三个优点:首先是响应速度快;其次是商汤的大模型加搜索能力,可以通过引入高质量信源,让搜索结果更加可靠;最后,针对小爱的使用场景,商汤大模型表现出很强的综合能力。

据悉,小米与商汤合作的大模型,主要应用于小米手机和汽车上,小米SU7就将商汤的日日新大模型带进座舱,支持小爱同学车载语音场景应用。以公开数据测算,小爱同学1.3亿设备用户,超2亿次日交互次,这对商汤而言是庞大的商业场景,也是最直接的压力测试方式。



金山办公CEO章庆元在发布会上表示,今年4月金山办公发布的Copilot Pro就是基于商汤日日新大模型开发的应用,主要涵盖数据分析和自动生成代码两大功能,直接用自然语言交流的方式实现自动化办公。

在与海通证券的合作中,商汤的生成式AI能力也得以展现,智能问答、智能研究、智能生成研报等功能,让海通证券整体的工作效率明显提升。

除了与各个生态伙伴在垂直领域的合作,徐立还在交流日上透露,商汤的行业大模型都是在华为昇腾原生生态上训练完成。今年3月初,商汤加入昇腾原生计划,4月下旬,它已经发布了四款行业大模型。



在为合作伙伴带来价值的同时,商汤也绘制了自己的大模型商业版图。

国投证券分析认为,商汤已经完成了大模型在“云端边”全栈布局,形成了全面的产品体系。“生成式AI逐步从技术走向应用落地,推动商业化订单需求增长,商汤基于技术能力、客户口碑有望获得一定市场份额,推动业绩增长。”

有投资人表示,商汤用案例的细节、丰富的场景和全栈产品线,完整展示了生成式AI驱动公司业绩进一步增长的可能性,特别是端侧,机会非常大。

投资人口中“中国的端侧大模型市场”究竟蕴藏怎样的机会呢?

更小模型更低成本,中国“端侧大模型”的更大机遇

AI竞赛从大模型卷到应用,仅仅拥有性能强大的大模型,已经不能满足多元化的应用市场。随着市场上越来越多的AI PC、AI Phone陆续推出,端侧大模型的商业价值也愈发明显。

所谓“端侧大模型”,是把更小的模型本地化部署在手机、汽车、音箱等智能终端上,使其可以进行本地化运算,即使在断网的情况下依然不影响使用。端侧大模型虽然没有云端大模型那么“全能”,但响应速度更快、成本更低、使用场景也更加多元。

商汤很早就看到了这一机遇,在端侧大模型上具备先发优势。徐立曾断言,中国最大的商业化场景就是各个终端。从智能手机,到汽车、办公软件、金融等越来越多的应用场景,为商汤AI大模型2.0时代提供了充足的商业化空间。

徐立在技术交流日上演示了一段游戏场景,展示了商汤端侧的能力。在一段街头霸王PK中,红色方使用商汤的端侧大模型SenseChat-Lite,绿色方则使用GPT-4。GPT-4一开始略占上风,但出拳速度更快的商汤端侧模型很快反败为胜。



“这不是因为模型能力怎么强,而是在不同的适用场景之下,小模型决策速度更快。当大模型还在计算的时候,小模型已经完成判断并出拳了。不管拳是不是最优的,都实实在在地打到了对手身上。”徐立表示。

他判断,2024年将是端侧大模型爆发元年。“如果几十亿个端侧设备都在不停地调用大模型的话,没有任何一个服务器能够服务得起。所以说端侧能力的应用,其实是大模型铺开最核心的关键。”

换句话说,在很多使用场景下,大部分推理能在端侧完成,就不需要上云,这将大大降低大模型的使用成本。这与徐立此前一直强调的,努力让AI跨越工业红线,推动AI普惠一脉相承。

权威测试BenchMark成绩显示,商汤日日新 5.0端侧大模型1.8B(1.8亿参数)领先所有开源2B同级别模型,甚至在大部分测试中跨级击败了Llama2-7B、13B模型。更加适合直接部署在智能手机、汽车等智能终端上。

小米王刚就表示,端侧大模型是未来小米与商汤合作的重点领域之一。“尤其在车端,我们看到端侧大模型需求非常强,在无网、弱网场景下需要给用户提供比较好的体验。”

同时,在实际应用中,为进一步提高各类终端任务处理灵活性,模型还引入端云联动的MoE框架,可针对不同行业应用设置不同的云端联动配比,在性能、速度和成本间取得平衡。

值得注意的是,商汤的端侧大模型在许多场景下已经可以做到“端云对齐”。

商汤科技联合创始人、首席科学家王晓刚表示,过去一年,商汤将端侧大模型的的推理效率提升了200%。“在某些特定的任务上,端侧模型达到的体验或性能要跟云侧的模型对齐,商汤有这方面的优势。”

有知名评论员发表观点,对端侧市场保持积极态度,并称商汤的端侧大模型,可能是最适合中国经济模式的大模型,有助于大模型民用化。

据IDC数据显示,2023年中国智能手机市场的总出货量为2.7亿部;另据中国汽车工业协会,2023全年中国汽车的总销量超过3000万辆。再加上PC、平板电脑等终端设备,如果将它们全部植入端侧大模型,将是一个巨大的商业化机会。

目前,商汤端侧大模型已开放SDK(软件开发工具包)服务,全面覆盖智能手机、平板电脑、VR眼镜、车载系统等多样化的设备场景,为开发者和制造商提供应用适配空间。

百模大战,商汤有何不同?

无论是生态伙伴们的认可,还是端侧大模型出色性能,都离不开商汤的AI“基座”——SenseCore商汤AI大装置。

2020年,商汤拿出56亿元投资建设算力基础设施“SenseCore商汤AI大装置”。截至2023年底,大装置总算力规模达到12000 petaFLOPS(千万亿次),运营超4.5万块GPU,其中上海临港AIDC的算力达到8400 petaFLOPS,是国内最大的人工智能计算平台。

商汤大装置的算力可支撑超过20个千亿超大模型同时训练,并支持万亿参数大模型的全生命周期生成。在算力资源紧俏的当下,拥有从算力到模型全方位服务能力的商汤,获得众多合作伙伴青睐。

正是基于大装置和大模型协同,商汤日日新大模型体系才得以持续升级,不断迭代,并推出了日日新5.0 ,相比于前代主要升级了四大亮点:

采用混合专家架构(MoE),能够完成6000亿的参数,且激活少量参数就能完成推理,保持推理效率;基于超过10TB tokens的训练数据,并具有几千亿的合成数据;推理上下文窗口达到200K;增强知识、推理、数学、代码能力,全面对标GPT-4 Turbo。

除此之外,以AI视觉起家的商汤在多模态能力上也有独特优势。最新发布的商汤商量多模态大模型SenseChat-Vision,在多模态大模型权威综合基准测试MMBench中综合得分排名首位,还可以支持车舱大脑、智能助理、自动驾驶等多个实际场景应用。

商汤的多模态能力能够把感知、理解、识别、生成一体化完成。

与此同时,商汤也同步推出了端侧的多模态模型:扩散模型。据徐立介绍,商汤端侧扩散模型已经实现业内最快的端侧推理速度,在高通旗舰平台上能够做到小于1.5秒。

进入“百模大战”下半场,一个观点逐渐成为业内共识:行业并不需要那么多大模型,做出差异化,才是胜出的必要条件。端侧大模型、算力、多模态能力,加上“云、端、边”全栈大模型产品矩阵,共同构成了商汤的AI护城河。

商汤同时也回答了资本市场与投资者一直关心的问题:大模型技术如何赚钱——通过与现有生态伙伴的合作案例,展示大模型服务、算力终端等的商业价值,并通过提前布局端侧大模型,瞄准端侧市场的庞大增量,是商汤给出的答案。

更关键的是,以商汤为首,带动了港股科技股的整体复苏。五一假期间,在没有南下资金的加持下,香港市场依然火爆,两个交易周的成交金额突破了1.1万亿港元。除商汤外,腾讯、美团、快手、蔚来等科技互联网龙头均表现出色。

中信建投研报认为,今年港股最佳的做多窗口已经到来。随着近期外资重新回流港股,以及内资方面的政策利好,估值更低但股息率更高的港股正在成为高性价比的投资标的。同时,该行也认为,随着商汤业务的重构,生成式AI业务收入和占比有望持续提升,维持其买入评级。

在港股进入技术性牛市,以及商汤大模型商业化明朗化的背景下,商汤还会给市场带来什么惊喜,我们拭目以待。

相关内容

热门资讯

linux入门---制作进度条 了解缓冲区 我们首先来看看下面的操作: 我们首先创建了一个文件并在这个文件里面添加了...
C++ 机房预约系统(六):学... 8、 学生模块 8.1 学生子菜单、登录和注销 实现步骤: 在Student.cpp的...
A.机器学习入门算法(三):基... 机器学习算法(三):K近邻(k-nearest neigh...
数字温湿度传感器DHT11模块... 模块实例https://blog.csdn.net/qq_38393591/article/deta...
有限元三角形单元的等效节点力 文章目录前言一、重新复习一下有限元三角形单元的理论1、三角形单元的形函数(Nÿ...
Redis 所有支持的数据结构... Redis 是一种开源的基于键值对存储的 NoSQL 数据库,支持多种数据结构。以下是...
win下pytorch安装—c... 安装目录一、cuda安装1.1、cuda版本选择1.2、下载安装二、cudnn安装三、pytorch...
MySQL基础-多表查询 文章目录MySQL基础-多表查询一、案例及引入1、基础概念2、笛卡尔积的理解二、多表查询的分类1、等...
keil调试专题篇 调试的前提是需要连接调试器比如STLINK。 然后点击菜单或者快捷图标均可进入调试模式。 如果前面...
MATLAB | 全网最详细网... 一篇超超超长,超超超全面网络图绘制教程,本篇基本能讲清楚所有绘制要点&#...
IHome主页 - 让你的浏览... 随着互联网的发展,人们越来越离不开浏览器了。每天上班、学习、娱乐,浏览器...
TCP 协议 一、TCP 协议概念 TCP即传输控制协议(Transmission Control ...
营业执照的经营范围有哪些 营业执照的经营范围有哪些 经营范围是指企业可以从事的生产经营与服务项目,是进行公司注册...
C++ 可变体(variant... 一、可变体(variant) 基础用法 Union的问题: 无法知道当前使用的类型是什...
血压计语音芯片,电子医疗设备声... 语音电子血压计是带有语音提示功能的电子血压计,测量前至测量结果全程语音播报࿰...
MySQL OCP888题解0... 文章目录1、原题1.1、英文原题1.2、答案2、题目解析2.1、题干解析2.2、选项解析3、知识点3...
【2023-Pytorch-检... (肆十二想说的一些话)Yolo这个系列我们已经更新了大概一年的时间,现在基本的流程也走走通了,包含数...
实战项目:保险行业用户分类 这里写目录标题1、项目介绍1.1 行业背景1.2 数据介绍2、代码实现导入数据探索数据处理列标签名异...
记录--我在前端干工地(thr... 这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 前段时间接触了Th...
43 openEuler搭建A... 文章目录43 openEuler搭建Apache服务器-配置文件说明和管理模块43.1 配置文件说明...