京东推出言犀大模型 率先布局产业应用
admin
2023-07-14 15:17:04
0

K图 09618_0

  7月13日,京东言犀大模型在2023京东全球科技探索者大会暨京东云峰会上推出。与通用大模型相比,这一源于产业、服务产业的大模型,融合70%通用数据与30%数智供应链原生数据,具有“更高产业属性、更强泛化能力、更多安全保障”的优势,致力于深入零售、物流、金融、健康、政务等知识密集型、任务型产业场景,解决真实产业问题。

  为夯实产业应用,京东推出了一套大模型的完整工具,包括支撑大模型研发的基础设施——言犀AI开发计算平台、向量数据库、混合多云操作系统云舰、高性能存储平台云海、软硬一体虚拟化引擎京刚等核心产品。

  依托京东言犀大模型,以及京东在产业和供应链侧的优势,京东还发布了两大服务平台,包括全新升级的优加DaaS和言犀智能服务平台,以及面向零售、金融、城市、健康、物流五大领域的行业解决方案。

  京东集团CEO许冉表示:“京东的大模型技术演进,遵循了京东的技术追求:成本、效率、体验、可信、普惠、突破。成本、效率和体验是从京东的经营理念传承而来,也是零售的第一性原理。可信、普惠和突破则是技术服务于产业和社会的承诺。”

  京东相信,京东关于技术追求的内涵,在以大模型为代表的AI技术领域,能够让产业伙伴更加放心和低门槛地使用技术创新的成果,帮助技术走出实验室和公司的围墙,真正推动行业生产效率的提升,在产业场景发挥更大价值。

  最懂产业的大模型,用产业数据和Know-how创造价值

  “大模型真正实现自己的价值,一定是在产业应用中。”许冉表示,大模型的价值=算法×算力×数据×产业厚度的平方。“前三个指标固然重要,但技术在产业场景落地应用,创造实际价值才是关键。当产业效率和产业的边界拓展得到质的提升以后,大模型才有了更重要的实际价值和意义,这将不亚于又一次工业革命。”

  “从产业端切入大模型,如同从北坡攀登技术珠峰,道路虽然更加艰难,却有更波澜壮阔的风景。”许冉说。

  产业场景是京东非常擅长的领域。京东作为一家新型实体企业,自身发展就来自产业场景历练,拥有包括零售、物流、科技、健康、工业、产发等丰富的产业布局。这为京东积累下每年数百亿条优质交互数据,训练言犀大模型的数据库,就由70%通用数据和30%供应链原生数据组成。

  深厚的产业数据积累,以及千行百业Know-How,成为京东布局大模型的核心优势,训练出的大模型天然具备“产业基因”。此外,言犀大模型还具备行业泛化能力,并能够保障客户在云上云下安全使用。

  “数智供应链训练了产业大模型,而大模型则依托供应链深入产业”,京东集团技术委员会主席、京东云事业部总裁曹鹏如是说。

  对于大模型的应用实践,京东也有明确的“三步走”规划。目前,京东云已经基于内部实践构建了通用大模型;到今年年底这段时间,京东将经由高复杂场景大规模锤炼,迭代出扎实的产业服务;预计在2024年初,会将大模型能力向外部严肃商业场景开放。目前,京东已经走到第二步,并在内部取得了丰富的实践成果。

  “某种意义上,我们的大模型相当于既做了通识教育,又读了四年专业性的本科教育”, 京东探索研究院院长、京东科技智能服务与产品部总裁何晓冬博士表示。大模型的难点不在技术追赶,而是产业突破。京东言犀大模型的产业实践,是京东非常关注的部分。

  构建大模型“训练营”和“弹药库”,打通技术落地每一步

  京东从很早就开始布局大模型。2021年,京东就推出十亿级模型K-PLUG,2022年推出百亿级模型Vega,本次大会则展示了千亿级模型。

  正是提早布局,让京东形成了一套大模型的完整工具链:言犀AI开发计算平台、向量数据库,以及全新升级的基础设施云舰、云海和京刚。

  京东的言犀AI开发计算平台,能够为客户的大模型开发和行业应用开发,提供定制化解决方案。它既具备行业知识库,沉淀了京东自己的零售、物流、健康、金融等行业Know-How,又具备100多种训练和推理优化工具,能将通用模型迅速转化为专业模型。

  在大会现场,京东演示了将通用大模型转化为健康产业大模型的操作。通常,客户完成这套流程,从数据准备、模型训练到模型部署,需要10余名科学家花费一周时间。但利用言犀AI开发计算平台,只需要1-2名算法人员,在数分钟就能完成。通过平台模型加速工具的优化,还能节省90%的推理成本。

  京东健康发布的京医千询大模型,就是建立在京东言犀通用大模型基础之上,能快速完成在医疗健康领域各个场景的迁移和学习,从而实现产品和解决方案的全面AI化部署,能为远程医疗服务提供坚实的技术底座。

  此外,京东还展示了金融领域AI营销运营平台。使用者通过简单的对话,就能一站式生成营销活动,覆盖运营策略制定、营销人物调度编排、搭建活动页面、批量生成营销文案和素材、数字化投放等方面。过去这套流程需要产品、研发、算法、设计、分析师5类职能人员,如今减少到1人;过去流程需要2000次人机交互,也减少到少于50次。在大模型能力的加持下,营销方案的生产效率有了百倍提高。

  在电商领域,京东云AIGC内容营销平台也大有作为。从一张商品图出发,它能够理解商品特征,快速胜场电商运营需要的商品主图、营销海报图和商详图等,满足商家快速开店和营销的需求。有了人工智能的加持,每套图的制作成本能降低90%,制作周期也从7天缩短到半天。

  以财富场景为例,目前京东机构基金代销系统中已经上线言犀有方模块,给机构客户提供更便捷的基金筛选和投研分析功能。

  如果说言犀AI开发计算平台是大模型的“训练营”,向量数据库则是大模型的“弹药库”,是大模型使用数据的桥梁。京东从2019年开始研发向量数据库,历经电商大促场景磨练,向量数据库Vearch已经能支撑百亿级高性能检索,延时降低到毫秒级,可用性达到99.99%,已经服务超过100家大中型企业用户。京东将向量数据库用于大模型预训练,将推理成本降低了80%。

  对大模型所需的计算资源,京东也做出了充分的准备。在重庆太阳岛,京东全国首个超算中心——天琴α集群正日夜不停地运转,推理速度较过去提升6.2倍,推理成本节约90%,成为技术创新背后强大的算力支撑。

  京东云的三个核心产品,此次也迎来升级:全新升级的混合多云操作系统云舰,将GPU/NPU的资源成本降低50%,并提供行业最高的业务连续性承诺。高性能存储平台云海,将单集群每秒读写性能提升5倍,达到千万级;时延降低50%,达到百微秒级;使用成本则降低30%。软硬一体的虚拟化引擎京刚,将虚拟化卸载到智能网卡中,虚拟化损耗降至0,网络性能提升高达4倍,并支持100Gb VPC网络,云硬盘单实例性能突破百万IOPS。

  升级多场景解决方案,技术创新让产业受益

  伴随技术进步,产业应用已经从流程驱动和数据驱动,进化到知识驱动阶段。京东也升级了两个能够积累高质量行业数据的平台:全新的优加DaaS和言犀智能服务,来支撑产业应用对数据的新需求。

  新升级的优加DaaS具备三个优势:更多维,既包括企业自身的数据,也能实现企业和京东及生态数据的安全互通和融合;更易用,大幅提高交互体验、降低使用门槛,用简单描述即可生成答案;更简单,串联数据开发平台、数据服务平台、数据可视化平台等的原子能力,将原本复杂系统间的操作简化。

  言犀智能服务升级后,也具备了更丰富的交互渠道,覆盖从智能客服到直播间,从移动终端到线下智能端;更生动的交互效果,支持语音、视频、文字等方式;更专业的交互内容,生成的专业领域交互内容,更加可控、可用。目前,它已经服务于12345热线、银行数字员工、专家诊断场景等严肃场景。

  技术要实现产业价值,供应链是重要的抓手。京东云深入全渠道一盘货、供应链金融科技、产业协同、数据中台、数字仓库等20多个数字化场景,已经服务100座城市、2500+家大型企业、944家金融机构和超250万家中小微企业。这些千行百业的数字化实践,成就了最懂产业的云。

  “智能化优先在数字化领先的行业发生”,京东集团副总裁、京东科技产品与解决方案总裁高礼强表示。在零售、金融、城市、物流等多个场景,京东都发布了全新的智能化解决方案,借助大模型能力实现服务能力的升级。

  在本次大会上,京东物流发布了一站式数智化供应链数据管理平台京慧3.0,在大模型的加持下,其销量预测、库存、供应及补货计划方面更具表现力,其交互式供应链控制塔能够帮助用户快速定位并解决供应链问题,实现降本增效。

  过去人工智能的发展历程,曾经数次达到应用爆发的边缘,但很多都没有创造出很大的价值,技术没有在产业端形成扎实的应用是重要的原因之一。作为新型实体企业,京东一直根植并服务于实体经济,在大模型的产业应用过程中更是凭借扎实的产业积累,勾画了一条以实助实的产业价值创造路径。

  在大会现场,京东宣布携手零售和金融行业伙伴,在零售场景探索供应链优化、顾客体验、营销降本增效等方面,在金融场景探索金融客服、智能投顾、产品营销等方面,共建零售和金融行业的大模型创新应用。

  正如许冉所说:“京东发展大模型的旅程,注定会与产业伙伴携手同行。京东会与产业伙伴紧密合作,通过技术创新持续为产业高质量发展贡献力量。”

(文章来源:新华财经)

相关内容

热门资讯

linux入门---制作进度条 了解缓冲区 我们首先来看看下面的操作: 我们首先创建了一个文件并在这个文件里面添加了...
C++ 机房预约系统(六):学... 8、 学生模块 8.1 学生子菜单、登录和注销 实现步骤: 在Student.cpp的...
A.机器学习入门算法(三):基... 机器学习算法(三):K近邻(k-nearest neigh...
数字温湿度传感器DHT11模块... 模块实例https://blog.csdn.net/qq_38393591/article/deta...
有限元三角形单元的等效节点力 文章目录前言一、重新复习一下有限元三角形单元的理论1、三角形单元的形函数(Nÿ...
Redis 所有支持的数据结构... Redis 是一种开源的基于键值对存储的 NoSQL 数据库,支持多种数据结构。以下是...
win下pytorch安装—c... 安装目录一、cuda安装1.1、cuda版本选择1.2、下载安装二、cudnn安装三、pytorch...
MySQL基础-多表查询 文章目录MySQL基础-多表查询一、案例及引入1、基础概念2、笛卡尔积的理解二、多表查询的分类1、等...
keil调试专题篇 调试的前提是需要连接调试器比如STLINK。 然后点击菜单或者快捷图标均可进入调试模式。 如果前面...
MATLAB | 全网最详细网... 一篇超超超长,超超超全面网络图绘制教程,本篇基本能讲清楚所有绘制要点&#...
IHome主页 - 让你的浏览... 随着互联网的发展,人们越来越离不开浏览器了。每天上班、学习、娱乐,浏览器...
TCP 协议 一、TCP 协议概念 TCP即传输控制协议(Transmission Control ...
营业执照的经营范围有哪些 营业执照的经营范围有哪些 经营范围是指企业可以从事的生产经营与服务项目,是进行公司注册...
C++ 可变体(variant... 一、可变体(variant) 基础用法 Union的问题: 无法知道当前使用的类型是什...
血压计语音芯片,电子医疗设备声... 语音电子血压计是带有语音提示功能的电子血压计,测量前至测量结果全程语音播报࿰...
MySQL OCP888题解0... 文章目录1、原题1.1、英文原题1.2、答案2、题目解析2.1、题干解析2.2、选项解析3、知识点3...
【2023-Pytorch-检... (肆十二想说的一些话)Yolo这个系列我们已经更新了大概一年的时间,现在基本的流程也走走通了,包含数...
实战项目:保险行业用户分类 这里写目录标题1、项目介绍1.1 行业背景1.2 数据介绍2、代码实现导入数据探索数据处理列标签名异...
记录--我在前端干工地(thr... 这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 前段时间接触了Th...
43 openEuler搭建A... 文章目录43 openEuler搭建Apache服务器-配置文件说明和管理模块43.1 配置文件说明...