通义千问2.5版本问世,让大模型既“通情”又“达义” 通义千问2.0 通义千问2.0怎么用
admin
2024-05-11 19:05:05
0

在天文领域,大模型如何发挥本领?

近期,由中国科学院国家天文台人工智能组推出的天文大模型“星语3.0”,已经成功接入国家天文台兴隆观测站望远镜阵列。该模型可以自主控制望远镜观测、分析观测结果,给出后续观测建议,能让科研人员从繁琐的天文观测中解放出来,更多地专注于天文发现。据了解,“星语3.0”基于阿里云通义千问开源大模型打造而成,是大模型在天文观测领域的首次应用。

实际上,通义千问大模型诞生一年以来,落地应用的速度不断加快。除了如上提到的天文领域,也已经进入PC、文旅、航空、矿业等多个领域。

2024年5月9日,在AI智领者峰会·北京站上,阿里云CTO周靖人围绕技术、生态和落地三大层面,分享了公司在大模型领域取得的新进展。

发布通义千问2.5版本,让通义APP真正做到“通情、达义”

会上,阿里云正式发布通义千问2.5版本,多方面基础能力均实现大幅提升。具体来说,相较于通义千问2.1版本,新版的理解能力、逻辑能力、指令遵循和代码能力,分别提升9%、16%、19%和10%。经过权威基准OpenCompass评测,该模型的中文性能比如文本理解、文本生成、知识问答等多个方面,全面赶超GPT-4 Turbo。



(来源:资料图)

与此同时,通义大模型也迎来品牌升级,“通义千问APP”更名为“通义APP”,仍将免费地为全球用户提供服务。

首先,从文档处理能力来看,通义APP单次可处理高达1000万字的长文档,并能同时解析100份不同格式的文档。其次,从音视频理解能力来看,能够同时上传50个音视频文件,并对其进行包括内容识别理解、摘要总结、多语言翻译在内的多项处理。此外,从代码编程能力来看,集成智能编码助手通义灵码,帮助所有用户提高编码效率。

值得一提的是,为满足企业用户在私域知识检索、企业数据合规等方面的需求,在本次峰会上,通义灵码发布标准版和专属版两个企业版本。前者可接入企业私域知识,实现相关问答;后者能提供公共云上专属实例部署等服务,满足大中型企业客户定制模型、节约算力的需求。

就阿里云而言,其希望通义APP在全面升级之后,能够真正做到“通情、达义”,成为人们在工作、学习、生活和娱乐方面的全能AI助手。



(来源:资料图)

推出千亿参数开源模型,全方位推动开源体系构建

大模型的发展离不开整个生态。

阿里云认为,将AI技术赋能给企业和开发者,帮助他们更快地实现应用创新,和升级大模型技术一样重要。因此,其也在积极推进开源体系的构建。

从模型尺寸上看,推出一系列不同参数的大模型,让用户能够根据自身场景,快速挑选合适的模型开展业务创新。从模型模态上看,在推出语言模型的同时,也发布视觉理解模型、声音模型和代码模型等多种模态的开源大模型。

本次峰会上,阿里云发布新款开源模型——1100亿参数的Qwen1.5-110B。目前,该模型在MMLU、TheoremQA等基准测评中超过Meta发布的Llama-3-70B模型,并成为HuggingFace推出的开源大模型排行榜Open LLM Leaderboard上的榜首模型。



(来源:资料图)

除了推出开源大模型,阿里云也在努力推广AI开发者社区的发展。阿里云魔搭社区现已拥有4500个高质量开源模型,开发者数量超过500万。

然而,对于大模型是否需要开源,该领域的从业者也秉持不同态度。例如,有的认为大模型不但推理成本过高,而且黑箱特性也让普通开发者难以参与,这种情况下的开源并无意义。

对此,阿里云并不认同,其认为开源技术体系对全球技术领域的贡献毋庸置疑。

“作为全球唯一一家敢于全方位开源的云计算厂商,阿里云的最终目的是将AI技术全面地赋能给用户,让更多人能够在这样的模型体系上搭建创新应用。”周靖人表示,“而在大模型的潜力尚未得到充分挖掘的今天,我们希望以开放的心态开源最先进的技术,从而在产业和企业的创新发展中扮演重要角色。”

同时,他也指出,阿里云在开源最强模型的同时也在开发闭源模型,会基于开源和闭源的体系为客户提供全方位服务。

如此说来,对于大模型本身的发展而言,开源是否能够发挥良好的促进作用?

阿里云副总裁、公众沟通部总经理张启表示:“通义千问目前有十分活跃的开发者社区,每天都会给模型开发人员提供非常多有意义的反馈,很多甚至超出我们的设想。这也是为什么通义千问能够在一年时间内发展到中文性能赶超GPT-4 Turbo。”

“可以说,开源后吸收到的来自全球开发者的真实反馈,对模型发展本身意义重大。”张启继续说道。

升级百炼大模型平台,已为超9万家企业提供服务

在搭建生态的基础上,怎样才能让模型能力与真实业务场景有机融合,从而走向模型应用落地呢?阿里云希望百炼大模型平台能够发挥这一纽带作用。

本次会上,百炼大模型平台也迎来了新版本——2.0版本,不仅实现模型开发、应用开发和算力底座的全面升级,还引入足够多的模型选择,并率先兼容LlamaIndex等开源框架,以充分满足企业需求,让他们能以高性价比的方式使用模型。



(来源:资料图)

根据阿里云公布的最新数据,目前通义大模型已经服务超9万家企业,通义开源模型累计下载量突破700万。这些来自不同领域的企业,均基于通义大模型实现了业务效率的提升。

例如,中国一汽推出的大模型应用GPT-BI,已实现在财务、质保等领域的智能报表生成,并覆盖一汽研产供销等9大领域决策场景。西部机场集团上线AI助理“小西”,可提供创作生成、智能报表和知识问答等功能,旨在服务集团下辖陕、宁、青三省(区)的18个机场和1.8万名员工。

对于那些正在成长中的中小企业,阿里云也会借助百炼大模型平台为其提供核心帮助,比如直接调用基础模型、进行深度指令Prompt优化等。

而在赋能客户的过程中,阿里云也同样“被赋能”。正如周靖人所说,“很多企业在我们没有接触之前就使用了开源模型。正是因为模型的出色能力,让他们又再次找到我们。这种案例比比皆是,和我们的发展是相辅相成的”。

综上可以看出,持续优化模型、坚持构建生态,以及将模型能力与业务场景有机融合,是阿里云在大模型领域的三大发力方向。只有这样,才能在AI技术变革的时代中,帮助开发者和企业实现更多的大模型创新应用。

相关内容

热门资讯

linux入门---制作进度条 了解缓冲区 我们首先来看看下面的操作: 我们首先创建了一个文件并在这个文件里面添加了...
C++ 机房预约系统(六):学... 8、 学生模块 8.1 学生子菜单、登录和注销 实现步骤: 在Student.cpp的...
A.机器学习入门算法(三):基... 机器学习算法(三):K近邻(k-nearest neigh...
数字温湿度传感器DHT11模块... 模块实例https://blog.csdn.net/qq_38393591/article/deta...
有限元三角形单元的等效节点力 文章目录前言一、重新复习一下有限元三角形单元的理论1、三角形单元的形函数(Nÿ...
Redis 所有支持的数据结构... Redis 是一种开源的基于键值对存储的 NoSQL 数据库,支持多种数据结构。以下是...
win下pytorch安装—c... 安装目录一、cuda安装1.1、cuda版本选择1.2、下载安装二、cudnn安装三、pytorch...
MySQL基础-多表查询 文章目录MySQL基础-多表查询一、案例及引入1、基础概念2、笛卡尔积的理解二、多表查询的分类1、等...
keil调试专题篇 调试的前提是需要连接调试器比如STLINK。 然后点击菜单或者快捷图标均可进入调试模式。 如果前面...
MATLAB | 全网最详细网... 一篇超超超长,超超超全面网络图绘制教程,本篇基本能讲清楚所有绘制要点&#...
IHome主页 - 让你的浏览... 随着互联网的发展,人们越来越离不开浏览器了。每天上班、学习、娱乐,浏览器...
TCP 协议 一、TCP 协议概念 TCP即传输控制协议(Transmission Control ...
营业执照的经营范围有哪些 营业执照的经营范围有哪些 经营范围是指企业可以从事的生产经营与服务项目,是进行公司注册...
C++ 可变体(variant... 一、可变体(variant) 基础用法 Union的问题: 无法知道当前使用的类型是什...
血压计语音芯片,电子医疗设备声... 语音电子血压计是带有语音提示功能的电子血压计,测量前至测量结果全程语音播报࿰...
MySQL OCP888题解0... 文章目录1、原题1.1、英文原题1.2、答案2、题目解析2.1、题干解析2.2、选项解析3、知识点3...
【2023-Pytorch-检... (肆十二想说的一些话)Yolo这个系列我们已经更新了大概一年的时间,现在基本的流程也走走通了,包含数...
实战项目:保险行业用户分类 这里写目录标题1、项目介绍1.1 行业背景1.2 数据介绍2、代码实现导入数据探索数据处理列标签名异...
记录--我在前端干工地(thr... 这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 前段时间接触了Th...
43 openEuler搭建A... 文章目录43 openEuler搭建Apache服务器-配置文件说明和管理模块43.1 配置文件说明...