他带领团队攻坚克难 让智能汽车更懂人的心
admin
2022-05-05 05:15:57
0

  人在车外也能通过语音唤醒车辆,通过语音让车自动驾驶或开启车门。这款全球首发的车外语音交互系统于今年3月在重庆发布,这一系统来自一支青年人工智能技术团队,这支团队在“80后”青年专家马鸿鹏的带领下,对智能汽车人机交互多项关键技术进行攻关,助力重庆汽车产业发展。

  “80专家带头突破人车交互难点

  “以前汽车的语音交互都在车内,实际上车外智能交互也是用户的需求。”科大讯飞智能汽车重庆分中心总经理马鸿鹏说,车外语音交互相较车内语音交互来说,难点在于如何保障车外噪音等复杂环境下,机器能听清楚并执行指令。为了实现车外的人车交互,他和团队独创了神经网络降噪算法和“冷启动”系统两项技术,让车外语音交互系统做到360度语音降噪和无死角识别覆盖,实现稳定高效的车外语音交互。

  从计算机专业毕业到去日本企业深造,再回国带领团队进行研发,马鸿鹏有个振兴自主品牌的汽车梦。2018年,科大讯飞西南总部落地重庆,同时落地的还有科大讯飞智能汽车的重庆分中心,作为领头人,马鸿鹏带领团队在汽车电子智能化的技术研发、产品设计,以及整车应用领域与长安汽车等重庆车企展开合作。

  “小安你好,帮我查一下北京的天气。”

  “好的,北京天气晴,白天气温20度。”

  “再帮我订一张去那儿的机票。”

  ……

  这样的对话,在人与人交流中再平常不过,但是对于人机互动而言,想要和机器持续对话,并让机器理解“那儿”就是上文所指的北京,技术难度不言而喻。

  马鸿鹏解释,对于机器来说,机器需要记忆和理解当前说话人的意图和场景,就需要覆盖尽可能多的场景和可能问法,这种会呈几何级数增长的算法复杂度,使软件的开发和维护都有较大难度。

  为了实现这一智能操作,马鸿鹏带领着20多人组成的团队入驻长安汽车,反复测试形成庞大的场景知识库,“通常车内常用指令不超过2000种,但我们在车机上内置了常用指令近6000条,不常用指令近2万条,才精准实现了用户指令。”马鸿鹏说。

  另一项技术难点是,怎样才能让语音控制系统保持收音状态,同时车内对非指令正常交流不做反馈。马鸿鹏说,他们在车内研发设置了声纹识别、声源定位等系统,能够准确识别指令发出者的指令,而非指令者和日常车内交流则不会被接收进语音控制系统,让车内语音操作更加智能和人性化。

  打破垄断重庆造汽车走出国门

  随着智能汽车产业发展,不少重庆汽车品牌也走向国际市场。马鸿鹏说,智能汽车在海外使用,必须适用当地的语种,而在过去外语的车载语音识别及合成系统被国外企业垄断,国内车企只能使用国外企业的语音技术。为了解决这一卡脖子问题,马鸿鹏团队联合科大讯飞研究院展开长安汽车车载外语语音识别及合成系统研发。

  “做车载外语识别,不仅需要听懂,还要理解其他国家的语言文化习惯,甚至同一语种不同地区的口音,这就需要有强大的识别模型和机器学习做支撑。”马鸿鹏说,车载语音的“识别”分为“语音识别”和“语义识别”两个技术层次,“语音识别”相当于人的嘴巴和耳朵,负责表达和获取,而“语义识别”相当于人的大脑,负责思考和信息处理。为此,团队开创性地采用实体抽取加动态模板、融合深度学习的框架,将语言和语义技术剥离,构建出“云+端”多语种语义平台,基于该平台可快速实现多语种的语义理解。

  2021年,这套车载外语语音识别系统已实现了国产化,长安汽车海外发行的车型均采用了这一国产系统。“关键技术的国产化不仅更稳定安全,在生产成本上也实现了降低,助力国内自主品牌出海。”马鸿鹏说。

  “汽车革命的下半场是智能化、网联化、共享化。”马鸿鹏说,他正在和团队开发多模态交互的新技术,未来的智能汽车除了在语音交互外,还将增加视觉感应交互。他们将发挥人工智能优势,进一步从技术提供商,向信息娱乐系统、音响系统等迈进,走向软硬一体化发展,助力重庆汽车产业智能制造。

(文章来源:科技日报)

相关内容

热门资讯

linux入门---制作进度条 了解缓冲区 我们首先来看看下面的操作: 我们首先创建了一个文件并在这个文件里面添加了...
C++ 机房预约系统(六):学... 8、 学生模块 8.1 学生子菜单、登录和注销 实现步骤: 在Student.cpp的...
A.机器学习入门算法(三):基... 机器学习算法(三):K近邻(k-nearest neigh...
数字温湿度传感器DHT11模块... 模块实例https://blog.csdn.net/qq_38393591/article/deta...
有限元三角形单元的等效节点力 文章目录前言一、重新复习一下有限元三角形单元的理论1、三角形单元的形函数(Nÿ...
Redis 所有支持的数据结构... Redis 是一种开源的基于键值对存储的 NoSQL 数据库,支持多种数据结构。以下是...
win下pytorch安装—c... 安装目录一、cuda安装1.1、cuda版本选择1.2、下载安装二、cudnn安装三、pytorch...
MySQL基础-多表查询 文章目录MySQL基础-多表查询一、案例及引入1、基础概念2、笛卡尔积的理解二、多表查询的分类1、等...
keil调试专题篇 调试的前提是需要连接调试器比如STLINK。 然后点击菜单或者快捷图标均可进入调试模式。 如果前面...
MATLAB | 全网最详细网... 一篇超超超长,超超超全面网络图绘制教程,本篇基本能讲清楚所有绘制要点&#...
IHome主页 - 让你的浏览... 随着互联网的发展,人们越来越离不开浏览器了。每天上班、学习、娱乐,浏览器...
TCP 协议 一、TCP 协议概念 TCP即传输控制协议(Transmission Control ...
营业执照的经营范围有哪些 营业执照的经营范围有哪些 经营范围是指企业可以从事的生产经营与服务项目,是进行公司注册...
C++ 可变体(variant... 一、可变体(variant) 基础用法 Union的问题: 无法知道当前使用的类型是什...
血压计语音芯片,电子医疗设备声... 语音电子血压计是带有语音提示功能的电子血压计,测量前至测量结果全程语音播报࿰...
MySQL OCP888题解0... 文章目录1、原题1.1、英文原题1.2、答案2、题目解析2.1、题干解析2.2、选项解析3、知识点3...
【2023-Pytorch-检... (肆十二想说的一些话)Yolo这个系列我们已经更新了大概一年的时间,现在基本的流程也走走通了,包含数...
实战项目:保险行业用户分类 这里写目录标题1、项目介绍1.1 行业背景1.2 数据介绍2、代码实现导入数据探索数据处理列标签名异...
记录--我在前端干工地(thr... 这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 前段时间接触了Th...
43 openEuler搭建A... 文章目录43 openEuler搭建Apache服务器-配置文件说明和管理模块43.1 配置文件说明...