大模型,阿里云不做选择题 阿里云大模型如何申请 阿里云推荐的ai大模型
admin
2024-05-11 14:00:38
0


图片系AI生成

什么加速了云的发展?

自2006年云计算诞生之日算起,互联网和移动应用、云原生技术普及、企业向先进技术架构演进、中企全球化等因素,先后塑造了云计算的内在与外表,造就了一个数万亿规模的行业。

毋庸置疑的是,生成式AI将是云计算产业下一个革命性要素,但是,云厂商如何做大模型,行业内还没有达成一致。

开源与闭源,自研与投资,基础模型与工程化落地,技术创新与产业生态,阿里云没有做选择题,而是兼收并蓄,去构建一个AI与云的商业循环。

5月9日,阿里云正式发布通义千问2.5,中文性能全面赶超GPT-4 Turbo,同时通义千问1100亿参数开源模型在多个基准测评收获最佳成绩,超越Llama-3-70B,成为开源领域最强大模型。此外阿里云还升级了百炼平台,更便于支持大型企业和成熟开发者的需求。

通义千问2.5,地表最强中文大模型

基础模型是生成式AI产业的起点,模型本身在快速发展,从单一语言模型,到能处理文档、音视频、代码等各方面的能力,每个维度能力的宽度和深度都在快速地增加,在未来一段时间仍将继续迭代。


对于大模型厂商来说,本身的基础模型能力至少要保持在第一梯队,才有海量的用户基础和可持续的吸引力。相比通义千问2.1版本,通义千问2.5的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%,中文能力表现更为突出,在权威基准OpenCompass上,通义千问2.5得分追平GPT-4 Turbo。

和部分厂商不同的是,阿里云开源和闭源两条路并重,在开源方面走的是“全模态、全尺寸”路线。“阿里云的策略不是简简单单的开源,我们是要做开源最强的模型”,阿里云CTO周靖人表示。

最新款开源的1100亿参数模型Qwen1.5-110B,在MMLU、TheoremQA、GPQA等基准测评中超越了Meta的Llama-3-70B模型;在HuggingFace推出的开源大模型排行榜Open LLM Leaderboard上,Qwen1.5-110B冲上榜首。

通义也不断丰富多模态模型和专有能力模型,例如通义千问视觉理解模型Qwen-VL-Max在多个多模态标准测试中超越Gemini Ultra和GPT-4V,通义千问代码大模型CodeQwen1.5-7B是HuggingFace代码模型榜单Big Code的头名,也是助手通义灵码的底座。

周靖人提到,“我们是全球唯一一家积极做最先进的AI模型,同时也敢于全方位开源的云计算厂商,因为我们认识到,今天只有把AI能力真正赋能给企业,才能推动整个企业产业的快速发展。”

百炼2.0,开发性与自由度

大模型应用落地的过程中,需要试验各种各样的模型,并且企业希望以高性价比的方式融合在自己的业务开发里,业务场景复杂、自身数据敏感,企业如何安全高效地将大模型和业务有机结合,这是工程化落地的重要课题。

阿里云百炼的一大特点,在于最大程度的开放性和自由度。当下一些大模型应用平台采用封闭链路,不支持替换原子能力,导致企业开发应用时无法引入自研插件,和业务场景充分融合。


图片系AI生成

百炼2.0平台从模型开发、应用开发到算力底座全面升级。“当下企业应用大模型存在三种范式:一是对大模型开箱即用,二是对大模型进行微调和持续训练,三是基于模型开发应用,其中最典型的需求是RAG,以企业数据对大模型进行知识增强。围绕这些需求,百炼打造了模型中心和应用中心,提供最丰富的模型和最易用的工具箱。”周靖人说。

对希望直接调用模型进行推理的企业,百炼集成了上百款大模型API,除了通义、Llama、ChatGLM等系列,还首家托管百川等系列三方模型,值得一提的是,这可能是阿里大手笔投资大模型创业厂商带来的优势。

对需进一步训练模型的用户,百炼提供从数据管理、模型调优、评测到部署的全链路模型服务,用户可弹性按需调用算力,无需关心底层架构。训练过程可视化,还可自动评测模型质量,并与其他模型对比。

对希望打造RAG应用的企业,百炼支持Assistant API开发模式,可在百炼上轻松创建知识库,并一键开启知识检索增强(RAG),通过Assistant API联合输出。同时,百炼支持agent智能体开发,并能实现多智能体协作、对话记忆等高级功能。

大模型生态亟需建设

相比于海外市场,国内对大模型生态建设的需求更高。据外媒消息,美国初步计划对最先进的专有 AI 模型实施出口管制,诸如此类风险,要靠系统生态协作来缓解单点难题。

开源模型和百炼平台也是是生态建设一部分,开源模型能够让更多的开发者使用,并于其上搭建更复杂的应用,甚至更复杂的Agent,更好地服务企业,从而推动AI产业的发展。百炼平台能够链接模型能力和业务场景,帮助大模型在各行各业落地。


阿里云不仅在做通义模型的开源,同时也在积极推广AI社区的发展,魔搭社区总用户数超过500万,成为了中国最大的AI模型社区,社区内有大量的AI模型,以及各种数据和经验,为大模型落地提供指引。

“一门技术的良好发展一定要有一个好的生态,这也是为什么阿里云积极参与生态建设,从魔搭社区到开源体系,更多反馈才能实现更多的业务创新,激发更多模型的应用。”周靖人说。

阿里云在大模型领域正在构建大循环,以基础模型为起点,开放生态聚合用户和行业,更多人使用通义模型,也就能进一步优化模型效果,并且带动阿里云服务的采用,最终阿里云想实现的是——AI即云计算。(本文首发于钛媒体APP,作者 | 张帅,编辑 | 盖虹达)

相关内容

热门资讯

linux入门---制作进度条 了解缓冲区 我们首先来看看下面的操作: 我们首先创建了一个文件并在这个文件里面添加了...
C++ 机房预约系统(六):学... 8、 学生模块 8.1 学生子菜单、登录和注销 实现步骤: 在Student.cpp的...
A.机器学习入门算法(三):基... 机器学习算法(三):K近邻(k-nearest neigh...
数字温湿度传感器DHT11模块... 模块实例https://blog.csdn.net/qq_38393591/article/deta...
有限元三角形单元的等效节点力 文章目录前言一、重新复习一下有限元三角形单元的理论1、三角形单元的形函数(Nÿ...
Redis 所有支持的数据结构... Redis 是一种开源的基于键值对存储的 NoSQL 数据库,支持多种数据结构。以下是...
win下pytorch安装—c... 安装目录一、cuda安装1.1、cuda版本选择1.2、下载安装二、cudnn安装三、pytorch...
MySQL基础-多表查询 文章目录MySQL基础-多表查询一、案例及引入1、基础概念2、笛卡尔积的理解二、多表查询的分类1、等...
keil调试专题篇 调试的前提是需要连接调试器比如STLINK。 然后点击菜单或者快捷图标均可进入调试模式。 如果前面...
MATLAB | 全网最详细网... 一篇超超超长,超超超全面网络图绘制教程,本篇基本能讲清楚所有绘制要点&#...
IHome主页 - 让你的浏览... 随着互联网的发展,人们越来越离不开浏览器了。每天上班、学习、娱乐,浏览器...
TCP 协议 一、TCP 协议概念 TCP即传输控制协议(Transmission Control ...
营业执照的经营范围有哪些 营业执照的经营范围有哪些 经营范围是指企业可以从事的生产经营与服务项目,是进行公司注册...
C++ 可变体(variant... 一、可变体(variant) 基础用法 Union的问题: 无法知道当前使用的类型是什...
血压计语音芯片,电子医疗设备声... 语音电子血压计是带有语音提示功能的电子血压计,测量前至测量结果全程语音播报࿰...
MySQL OCP888题解0... 文章目录1、原题1.1、英文原题1.2、答案2、题目解析2.1、题干解析2.2、选项解析3、知识点3...
【2023-Pytorch-检... (肆十二想说的一些话)Yolo这个系列我们已经更新了大概一年的时间,现在基本的流程也走走通了,包含数...
实战项目:保险行业用户分类 这里写目录标题1、项目介绍1.1 行业背景1.2 数据介绍2、代码实现导入数据探索数据处理列标签名异...
记录--我在前端干工地(thr... 这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 前段时间接触了Th...
43 openEuler搭建A... 文章目录43 openEuler搭建Apache服务器-配置文件说明和管理模块43.1 配置文件说明...