微软语音识别出错率达5.1%创新低 比肩专业速录员_最新动态_新闻资讯_程序员俱乐部

中国优秀的程序员网站程序员频道CXYCLUB技术地图
热搜:
更多>>
 
您所在的位置: 程序员俱乐部 > 新闻资讯 > 最新动态 > 微软语音识别出错率达5.1%创新低 比肩专业速录员

微软语音识别出错率达5.1%创新低 比肩专业速录员

 2017/8/21 15:09:15    程序员俱乐部  我要评论(0)
  • 摘要:据科技博客TechCrunch北京时间8月21日报道,微软公司在当地时间周日宣布,其对话式语音识别系统的出错率达到5.1%,创下目前为止的最低水平,超过了去年微软人工智能及研究事业部一组研究人员所实现的5.9%出错率,达到了专业速录员的同等水平。在此次研究中,专业速录员具备重复收听录音等优势。这两次研究转录的是Switchboard语料库中的录音。Switchboard语料库包含了2400段电话对话,自上世纪90年代以来一直被研究人员作为测试语音识别系统的样本
  • 标签:语音识别 微软 创新
class="topic_img" alt=""/>

  据科技博客 TechCrunch 北京时间 8 月 21 日报道,微软公司在当地时间周日宣布,其对话式语音识别系统的出错率达到 5.1%,创下目前为止的最低水平,超过了去年微软人工智能研究事业部一组研究人员所实现的 5.9% 出错率,达到了专业速录员的同等水平。

  在此次研究中,专业速录员具备重复收听录音等优势。这两次研究转录的是 Switchboard 语料库中的录音。Switchboard 语料库包含了 2400 段电话对话,自上世纪 90 年代以来一直被研究人员作为测试语音识别系统的样本。

20170821 Cortana.jpg

  新闻配图

  新研究由微软人工智能及研究事业部的一组研究人员实施,目标是在出错率上达到一组速录员的同等水平,后者可以反复收听录音样本,了解对话语境,与其他速录员合作。

  整体来说,通过改进微软语音识别系统中基于神经网络的听觉和语言模型,实施最新研究的研究人员能够在去年基础上把出错率降低大约 12%。

  显然,他们还可以让语音识别器了解整体对话,适应录音样本的语境,预测对话中很可能出现的下一个词汇或短语。这正是人类在与其他人对话时的做法。

  微软的语音识别系统已被用于语音助手“小娜”、实时翻译字幕功能 Presentation Translator 以及微软认知服务中。

发表评论
用户名: 匿名