语音助手已成趋势,但还不够强大_最新动态_新闻资讯_程序员俱乐部

中国优秀的程序员网站程序员频道CXYCLUB技术地图
热搜:
更多>>
 
您所在的位置: 程序员俱乐部 > 新闻资讯 > 最新动态 > 语音助手已成趋势,但还不够强大

语音助手已成趋势,但还不够强大

 2017/2/5 5:31:57    程序员俱乐部  我要评论(0)
  • 摘要:编者按:FraserAllison是墨尔本大学人机交互博士候选人,他最近刊文讨论了语音界面的发展。在过去几年里,语音界面进步很快,理解日常、自然语音的能力大大提升,不再局限于呆板、谨慎的言辞命令。如果一个包裹出乎意料来到了门口,你也许想和家中的智能设备说几句话。最近,美国达拉斯州一个6岁的小孩告诉家里的Echo音箱,让它定一个玩具屋。亚马逊语音助手Alexa遵命照办,真的定了一个。圣迭哥电视台报道了此事,新闻节目主持人还评论说:“我真是喜欢这个小女孩,她说:&lsquo
  • 标签:

语音助手已成趋势,但还不够强大

  编者按:Fraser Allison 是墨尔本大学人机交互博士候选人,他最近刊文讨论了语音界面的发展。在过去几年里,语音界面进步很快,理解日常、自然语音的能力大大提升,不再局限于呆板、谨慎的言辞命令。

  如果一个包裹出乎意料来到了门口,你也许想和家中的智能设备说几句话。 

  最近,美国达拉斯州一个 6 岁的小孩告诉家里的 Echo 音箱,让它定一个玩具屋。亚马逊语音助手 Alexa 遵命照办,真的定了一个。 

  圣迭哥电视台报道了此事,新闻节目主持人还评论说:“我真是喜欢这个小女孩,她说:‘Alexa 给我定了一个玩具屋。’”听到新闻之后,圣迭哥家庭的许多亚马逊设备也纷纷购买了玩具屋。 

  有些人可能曾经尝试苹果 Siri、微软 Cortana 对话,听到这个故事,他们可能会涌起一种熟悉感。虽然设备已经很强大,可以听清我们的命令,但是它们并非总是能够理解我们的意思。 

  最近,微软的研究人员指出,当今的语音界面存在一个问题:它们自称为“智能”助手,可以讲俏皮的笑话,掌握大量知识,但是因为缺乏常识而让我们感到沮丧。 

  研究人员还发现,有一些人会持续与数字助手对话,这些人往往开始时对数字助手抱有很低的预期。 

  语音界面到底能够做什么? 

  当你与语音界面讲话时,它必须具备如下能力: 

  • “听清”你的声音,将它与背景噪音区分。

  • 确定每一个词汇的起点和终点,将“哼”“阿哈”之类的词忽略。

  • 将每一个词的声音与字典中的词汇匹配,如果是同音异形异义词,语音助手必须根据环境挑选出正确的词汇。

  • 正确解释整个句子的意思。

  • 根据用户的请求生成有意义、实用的回应信息。 

  Google 从网络上收集了大量数据,如果你使用了 Google 服务,它还可以收集个人活动信息,所以在回答许多问题时 Google Now 可以提供中肯的答案。如果身处嘈杂的房间,当你向 Echo 提问,Echo 听清问题的能力很强,主要是因为 Echo 安装了降噪远场麦克风阵列。除此之外,用 Echo 从亚马逊购物也很方便。 

  在过去几年里,语音界面进步很快,理解日常、自然语音的能力大大提升,不再局限于呆板、谨慎的言辞命令。它可以处理一些简单的问题,比如:“有哪些人会参加澳大利亚网球公开赛?”还可以处理一些复杂的命令:“第一次参加澳大利亚网球公开赛的选手都有谁?”你还可以继续提问,比如:“决赛时会不会下雨?” 

  除了英语还有许多其它的语言,因此情况更加复杂,Siri 已经支持 40 种语言和方言,Alexa 只支持英语和德语。还好,所有功能都在稳步改进。 

  语音界面存在的难点 

  语音界面会不会接管一切技术,正如电影《她》(Her)描述的一样?科技咨询公司 Gartner 认为,到了明年 30% 的技术交互将会通过语音会话进行。 

  尽管如此,语音界面仍然存在局限性,光是改进技术还不能解决问题。噪音污染是一个主要的障碍。设备能够将用户的语音与背景噪音区分开来吗?技术的确能起到作用,它可以削减噪音、识别个性化语音、阅读唇语。 

  你与智能设备说话,这些话对其它人来说也是噪音,这种背景噪音如何处理?我们不妨设想一下,在办公室或者飞机上,有人坐在你的傍边,他在与 Siri 对话,而你正在读东西,此时你就会明白:从社交层面考虑,语音并非总是能被人们所接受。 

  还有一些问题来自于语音界面对精神的要求。学习使用语音系统可能是一件很困难的事,如果没有屏幕会更难,正如亚马逊 Echo 一样。 

  如果打电话给银行、电话公司,你会听到合成声音,它将选项全都念出来,此时你要集中精力听,心中很厌倦,你一直等待,直到自己想要的选项出现,生怕错过了,这种悲惨经历相信每个人都有过。传统图形界面不存在类似的问题,它可以将选项展示出来,让你快速选择。 

  当你学会操作语音命令,使用时也可能会分心。研究人员发现,与鼠标、键盘相比,语音命令更容易让人分心。 

  如果在汽车内使用语音命令,危害更大,美国犹他大学在报告中指出,使用语音命令之后司机注意力分散的时间最长可达 27 秒。 

  派上用场 

  正因如此,语音界面暂时不会完全接管世界,不过它会在我们的生活中找到小市场,发挥自己的作用。在汽车中语音命令已经很流行,随着技术的改进,希望语音命令引发的分心问题可以得到缓解。 

  在厨房内,你正在忙着做菜,此时你可以与 Alexa 交流,让它说出菜谱,更新购物信息。在 VR 与 AR 中,当你看不到自己的手时可以用语音界面控制系统。 

  学习语言时,我们可以用语音助手练习发音。有些人运动能力受损,出现肢体重复性劳损,或者存在诵读困难,此时语音可以帮上大忙。语音界面是一种期待以久的技术,有许多理由让我们相信语音时代已经来临。不过语音命令还不是那么聪明,在语音购物服务中,你最好还是设置一个密码,免得孩子乱买东西。

  本文来自翻译:theconversation.com

  • 相关文章
发表评论
用户名: 匿名