科大讯飞多语种智能语音技术,让听障群体“看见”声音 科大讯飞实时语音系统 科大讯飞降噪耳机对听障的帮助
admin
2024-05-09 14:00:56
0

今年5月19日是第三十四次全国助残日,此次助残日活动主题为"科技助残,共享美好生活"。在日新月异的信息时代,如何让残疾人共享科技红利、平等地参与社会生活,成为当前人们关注的热点。

5月8日,今年也是"听见AI的声音"关爱听障人士公益行动的第五个年头。在承诺终身免费提供相关服务的基础上,"科技助残"也在持续升级,如讯飞听见App新增快捷卡片启动、听障模式文本对话等功能等,通过多语种智能语音技术,让更多听障人士"看见"声音,共享美好生活,实现自身价值。

"听见AI的声音"累计提供超1亿分钟免费服务

最近几年,律师谭婷一直走在为听障人士普法、为健听人科普听障世界的路上。

2020年,谭婷成为我国第一位通过法律职业资格考试的听障人士后,越来多听障人士来到律所找她咨询。而更多的法律咨询工作则发生在线上,最多时她一天接了14位聋人的微信视频咨询。

"我想用一双会说话的手,把正义的声音带到每个无声的角落。"从以前准备法考到如今工作中各种线上线下交流,讯飞听见App成为谭婷的"助手"。


世界卫生组织(WHO)提出,全球听力残疾人在2018年已达4.66亿,预计2050年将达9亿,其中93%为成年人,7%为儿童。

这是一个庞大的"沉默"群体。

自2019年起,科大讯飞联合中国聋协、中国残疾人艺术团发起"听见AI的声音"关爱听障人士公益行动。以多语种智能语音技术为支撑,围绕讯飞听见系列、讯飞智能助听器等软硬件产品,为听力障碍人士提供免费的实时语音转文字服务、捐赠产品或者免费时长。产品形式多元化,覆盖听障群体的日常生活、工作、学习等场景,构建了完整的公益生态场景。

其中,讯飞听见App和智能助听器应用到听障和视障人士日常交流中,"让盲人听得见文字,让聋人看得见声音";讯飞输入法无障碍模式为视障人群铺设了通向互联网世界的"盲道"等;讯飞开放平台也在创建无障碍环境,截至2023年年底,累计创建了近3万个无障碍应用,累计服务1269万视听障人群;"听见AI的声音"关爱行动累计为听障人士提供超1亿分钟的免费转写服务,并承诺终身免费提供相关服务。


多语种智能语音,助力视听障公益

近几年,科大讯飞在多语种智能语音语言技术系统性创新中不断取得突破,有力支撑了讯飞翻译机、讯飞智能录音笔、讯飞听见等智能软硬件产品不断创新。这些AI产品也一直在助力国际沟通和无障碍交流。

使用软硬件结合的多语种技术解决方案,科大讯飞先后服务2022北京冬奥会与冬残奥会、2022年成都世界乒乓球团体锦标赛、第31届世界大学生夏季运动会、2023年布达佩斯世界田径锦标赛等国际赛事,累计为超202个国家,近4万名参赛人员提供翻译服务。

特别值得一提的是,在2023布达佩斯世界田径锦标赛赛事期间,科大讯飞联合组委会响应可持续发展战略,与匈牙利聋哑协会Sinosz联合发起了"Smile for a Sustainable World"活动,用AI语音翻译技术为听障者和视障者提供无障碍沟通工具,让世界"听见AI的声音"。

科技助残背后,25年智能语音研发之路

科大讯飞1999年成立,立志要"将中文语音技术掌握在中国人自己手里,中文语音产业要由中国人做到最好",从2006年开始就屡次在世界大赛中夺冠,近五年就累计获得20余项世界冠军。深耕智能语音技术25年,科大讯飞不仅将中文语音技术做到了最好,也将多语种语音技术做到了最好。2020年,科大讯飞60个语种的语音识别、翻译和37个语种的语音合成超过谷歌、微软,达到国际领先水平;2021年,科大讯飞在美国国家标准与技术研究院NIST发起的国际低资源多语种语音识别竞赛OpenASR中,获得全部受限赛道的15个语种冠军及7个语种非受限赛道冠军;2024年,讯飞星火语音大模型的首批37个主流语种的语音识别效果超过OpenAI最新语音大模型Whisper V3。

星火语音大模型首批覆盖语种中,24个主要语种识别率达到了90%(已超过实用门槛);13个重点语种识别率更是超过了94%。在多语种语音合成能力方面,27个主要语种MOS(Mean Opinion Score)评分达到了4.4(普通人口语水平为4),13个重点语种MOS评分高达4.6(地方播音员水平)。

就在今年4月26日,讯飞星火大模型V3.5春季上新。面向用户高效准确知识获取的痛点,科大讯飞发布业界首个长文本、长图文、长语音大模型,不仅能够把各种信息来源的海量文本、图文资料、会议录音等进行快速学习,还能够在各种行业场景给出专业、准确回答。在AI语音交互方面,科大讯飞发布了多情感超拟人合成,进一步提升了情绪表达的可感知度,对高兴、抱歉、安慰、撒娇、困惑等情绪表达的可感知度达到85%以上,AI语音更加生动、真实。除了超拟人对话,科大讯飞还推出"一句话声音复刻"功能,一句话就可以定制你的AI助手声音。

随着技术的进步,人工智能在科技助残方面正在发挥越来越大的作用。大模型技术的语言理解能力、内容生成能力、对话等能力持续升级,在残障人士信息获取、陪伴、安全守护等方面有广阔的应用前景,未来以人形机器人为代表的智能硬件在赋能残疾人方面也将大有作为。

相关内容

热门资讯

linux入门---制作进度条 了解缓冲区 我们首先来看看下面的操作: 我们首先创建了一个文件并在这个文件里面添加了...
C++ 机房预约系统(六):学... 8、 学生模块 8.1 学生子菜单、登录和注销 实现步骤: 在Student.cpp的...
A.机器学习入门算法(三):基... 机器学习算法(三):K近邻(k-nearest neigh...
数字温湿度传感器DHT11模块... 模块实例https://blog.csdn.net/qq_38393591/article/deta...
有限元三角形单元的等效节点力 文章目录前言一、重新复习一下有限元三角形单元的理论1、三角形单元的形函数(Nÿ...
Redis 所有支持的数据结构... Redis 是一种开源的基于键值对存储的 NoSQL 数据库,支持多种数据结构。以下是...
win下pytorch安装—c... 安装目录一、cuda安装1.1、cuda版本选择1.2、下载安装二、cudnn安装三、pytorch...
MySQL基础-多表查询 文章目录MySQL基础-多表查询一、案例及引入1、基础概念2、笛卡尔积的理解二、多表查询的分类1、等...
keil调试专题篇 调试的前提是需要连接调试器比如STLINK。 然后点击菜单或者快捷图标均可进入调试模式。 如果前面...
MATLAB | 全网最详细网... 一篇超超超长,超超超全面网络图绘制教程,本篇基本能讲清楚所有绘制要点&#...
IHome主页 - 让你的浏览... 随着互联网的发展,人们越来越离不开浏览器了。每天上班、学习、娱乐,浏览器...
TCP 协议 一、TCP 协议概念 TCP即传输控制协议(Transmission Control ...
营业执照的经营范围有哪些 营业执照的经营范围有哪些 经营范围是指企业可以从事的生产经营与服务项目,是进行公司注册...
C++ 可变体(variant... 一、可变体(variant) 基础用法 Union的问题: 无法知道当前使用的类型是什...
血压计语音芯片,电子医疗设备声... 语音电子血压计是带有语音提示功能的电子血压计,测量前至测量结果全程语音播报࿰...
MySQL OCP888题解0... 文章目录1、原题1.1、英文原题1.2、答案2、题目解析2.1、题干解析2.2、选项解析3、知识点3...
【2023-Pytorch-检... (肆十二想说的一些话)Yolo这个系列我们已经更新了大概一年的时间,现在基本的流程也走走通了,包含数...
实战项目:保险行业用户分类 这里写目录标题1、项目介绍1.1 行业背景1.2 数据介绍2、代码实现导入数据探索数据处理列标签名异...
记录--我在前端干工地(thr... 这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 前段时间接触了Th...
43 openEuler搭建A... 文章目录43 openEuler搭建Apache服务器-配置文件说明和管理模块43.1 配置文件说明...