全国政协委员张云泉接受环球时报专访:“主权级大模型”需要国家整合资源研发 全国政协委员张云泉接受环球时报专访:“主权级大模型”需要国家整合资源研发
admin
2024-03-07 12:47:29
0

来源:环球时报

【环球时报报道 记者 赵觉珵】人工智能(AI)大模型的发展日新月异。这一飞速发展、竞争激烈的领域成为今年两会不少代表委员的关注点,其中全国政协委员、长期从事超级计算机研发与建设工作的中国科学院计算技术研究所研究员张云泉将提案聚焦在如何解决大模型算力瓶颈问题上。张云泉在接受《环球时报》记者专访时表示,当前国内面临大模型训练用国产高端AI芯片供应不足等问题,应该由国家主导、整合优质科研和产业资源,尽快训练出我国的“主权级”大模型。

在其提交的提案中,张云泉将大模型描述为“实现新质智能生产力的重要手段”。他提到,人工智能带来的效果在现代就像是“核武器”一样,如果前十年的人工智能技术就像是“原子弹”为各行各业赋能,大模型技术就像是“氢弹”,将会深刻改变世界思考问题的方式;而芯片就像是“导弹”,有了“导弹”才能投射“原子弹、氢弹”,发挥“实战”效果。包括Meta公司、软银集团、研发GPT的OpenAI等公司都在大模型领域持续发力,其中一些公司计划自研AI芯片。而在美国封锁之下,能够用于大模型训练的国产智能算力芯片的创新和供应显著落后,国产多模态大模型的训练受到美国制裁的影响。

张云泉说,国内领先的AI芯片厂商因半导体工艺受限或进入美国实体清单的原因,难以使用最新工艺量产所设计的国产芯片,导致大模型训练用国产高端AI芯片供应不足,生态建设严重落后,我们有算法、有数据但没有合适的算力支撑,大模型这样的“氢弹”也不能真正发挥出作用。他还认为,当前国产AI芯片公司缺乏顶层设计,各自为战,无法形成合力,延误了能够替代英伟达高端训练GPU的国产AI芯片的尽快推出。此外,大模型落地所需要的配套软件、服务生态及市场也缺乏投资、引导与建设。

近日,当前大模型训练用GPU的主要供应商英伟达提出“主权AI”的概念,并将其定义为“一个国家利用自己的基础设施、数据、劳动力和商业网络生产AI的能力”。受“主权AI”概念启发,张云泉提出要重视“主权级大模型”的开发。他向《环球时报》记者解释称,“主权级大模型”是一个动态概念,它应该是某一时期内最高水平的大模型。这一大模型算力要求最高、智能水平最高,是一个国家AI水平的最高点、基础大模型的基础,也可以被形容为“根模型”。

张云泉认为,“主权级大模型”将深刻影响一个国家的科技竞争力,涉及军事、经济、政治等多方面能力。“没有‘主权级大模型’,就像是国家没有了国防重器,国家就会被打压,国家安全也会受到威胁”,张云泉强调,因此必须尽快研制处于国际领先水平的“主权级大模型”,以维护未来的国家安全。

在国产AI芯片研发制造仍需时日的情况下,作为超算领域的“老兵”,张云泉建议利用我国在超算研发建设中的丰富积累,设立能够支持“主权级”多模态大模型训练的专用超算攻关专项,快速缓解国产“主权基础大模型”训练的算力瓶颈。

张云泉告诉《环球时报》记者,目前大模型使用的GPU最早就是来自超算界。但它在超算上的使用效率不高,却在深度学习和大模型找到了最佳应用点。大模型训练用到的很多技术,如大规模并行技术、高速网络技术、可靠性技术、绿色功耗技术、液冷技术等,中国超算科研人员都已有很成熟的积累,并有较高水平。

在解决AI芯片“卡脖子”的基础性问题上,张云泉则建议,集中全国AI芯片研制力量,组建由业内权威专家和各主要AI芯片厂家参加的智能算力发展专项组,通过多轮竞争,确定最优的训练芯片研发技术路线和国家标准,择优集中投入资金和优秀人才资源,整合芯片产能,尽快研制出能够满足国产主权基础大模型训练的十万卡、百万卡甚至千万卡并行算力需求的AI芯片和系统。

“我之所以认为必须要由国家‘出手’,‘集中力量办大事’,是因为国内一些企业往往倾向于使用国外的开源大模型,还经常出现低水平重复与‘内卷’,延误了‘主权级大模型’的研发”,张云泉认为,无论是专用超算攻关专项还是AI芯片攻关专项,都需要国家出面协调资源,统一协调国内优质科研产业资源,以取得快速突破,在智能领域的“核武器”时代占领先机。“留给我们的时间窗口并不长,不能错失良机。”

相关内容

热门资讯

linux入门---制作进度条 了解缓冲区 我们首先来看看下面的操作: 我们首先创建了一个文件并在这个文件里面添加了...
C++ 机房预约系统(六):学... 8、 学生模块 8.1 学生子菜单、登录和注销 实现步骤: 在Student.cpp的...
A.机器学习入门算法(三):基... 机器学习算法(三):K近邻(k-nearest neigh...
数字温湿度传感器DHT11模块... 模块实例https://blog.csdn.net/qq_38393591/article/deta...
有限元三角形单元的等效节点力 文章目录前言一、重新复习一下有限元三角形单元的理论1、三角形单元的形函数(Nÿ...
Redis 所有支持的数据结构... Redis 是一种开源的基于键值对存储的 NoSQL 数据库,支持多种数据结构。以下是...
win下pytorch安装—c... 安装目录一、cuda安装1.1、cuda版本选择1.2、下载安装二、cudnn安装三、pytorch...
MySQL基础-多表查询 文章目录MySQL基础-多表查询一、案例及引入1、基础概念2、笛卡尔积的理解二、多表查询的分类1、等...
keil调试专题篇 调试的前提是需要连接调试器比如STLINK。 然后点击菜单或者快捷图标均可进入调试模式。 如果前面...
MATLAB | 全网最详细网... 一篇超超超长,超超超全面网络图绘制教程,本篇基本能讲清楚所有绘制要点&#...
IHome主页 - 让你的浏览... 随着互联网的发展,人们越来越离不开浏览器了。每天上班、学习、娱乐,浏览器...
TCP 协议 一、TCP 协议概念 TCP即传输控制协议(Transmission Control ...
营业执照的经营范围有哪些 营业执照的经营范围有哪些 经营范围是指企业可以从事的生产经营与服务项目,是进行公司注册...
C++ 可变体(variant... 一、可变体(variant) 基础用法 Union的问题: 无法知道当前使用的类型是什...
血压计语音芯片,电子医疗设备声... 语音电子血压计是带有语音提示功能的电子血压计,测量前至测量结果全程语音播报࿰...
MySQL OCP888题解0... 文章目录1、原题1.1、英文原题1.2、答案2、题目解析2.1、题干解析2.2、选项解析3、知识点3...
【2023-Pytorch-检... (肆十二想说的一些话)Yolo这个系列我们已经更新了大概一年的时间,现在基本的流程也走走通了,包含数...
实战项目:保险行业用户分类 这里写目录标题1、项目介绍1.1 行业背景1.2 数据介绍2、代码实现导入数据探索数据处理列标签名异...
记录--我在前端干工地(thr... 这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 前段时间接触了Th...
43 openEuler搭建A... 文章目录43 openEuler搭建Apache服务器-配置文件说明和管理模块43.1 配置文件说明...