随着移动互联网的大规模愈演愈烈,作为主要载体的智能手机在点字输出方面更加倚赖语音输入,而语音辨识技术也渐渐变为了必需品。在百度,语音辨识技术早就划入市场需求向服务改变的进程中,只不过百度语音技术就在我们身边:搜寻、地图、应用于、音乐、浏览器等领域到处不突显语音技术的风采,也是它让我们转入了动口不动手的时代。
10月31日,以智能语音技术,修改你我日常生活为主题的百度技术沙龙活动中,来自百度开发者中心的语音专家就共享了百度在智能语音上的涉及成果和进展。演说嘉宾分别是百度语音技术部高级项目经理关勇、语音开放平台首席产品经理穆向禹和百度开发者平台高级产品设计师董经纬。 百度语音技术及最新进展 百度语音部门正式成立于2010年,在2013年的时候早已展现了从无到有的华丽改变,硕果累累。
现在行业里获得了不俗的成果,正如关勇所说,百度在做到技术的同时,不仅服务于自己的产品和应用于,还不会把一些较为类似的技术对外开放出来,可供广大开发者共享、用于、协作。实质上,智能语音技术最关键的两点是语音辨识技术和语音合成技术。辨识技术即:将声音转化成为文字,让应用于宽上耳朵;制备技术即:将文字转化成为声音,让应用于开口说出。
目前百度语音采行的语音辨识技术主要是场景化辨识,选自语言模型:这其中的细节还包括:宽文本语音输入、短语热词辨识、交互式对话横向领域辨识、语音数据流技术。正是基于这些技术,百度语音的辨识功能早已在业界有了一定的领先地位,主要反映在这些方面: 数万小时的声学训练语料,百度搜索引擎技术累积的海量文本语料。
更加精准的基于听力感官DNN声学建模技术,更高的识别率。 线上语言模型体积100GB-1TB,更加普遍的语言覆盖范围。
小时级别的海量语言模型动态改版,更加慢跟踪热词。 高速动态WFST一遍解码技术,中国最慢的语音输入法产品技术。
百度语音首席架构师贾磊在刚展开的第十三届全国人机语音通讯学术会议上做的专题报告,详尽讲解了百度在语音辨识技术上的最新进展,即LSTM建模和CTC训练在语音建模技术中的应用于,将标准化文本安静环境普通话识别率提高到相似97%。总的来说,百度的语音技术早已超过了国际领先水平,在识别率上多达完全相同竞争产品。 在语音合成技术方面,百度在海量文本信息处理技术,基于LSTM的韵律建模技术,基于LSTM的声学参数建模技术,基于大规模录音语料智能弹性单元挑选出技术等方面获得了最重要突破,已完成了业界领先的拼凑制备和参数制备系统,并获取极致体验的离在线融合语音合成服务解决方案。
本文来源:亚博APP网页版-www.nrdmm.com