Facebook为何要让电脑像人一样思考?_最新动态_新闻资讯_程序员俱乐部

中国优秀的程序员网站程序员频道CXYCLUB技术地图
热搜:
更多>>
 
您所在的位置: 程序员俱乐部 > 新闻资讯 > 最新动态 > Facebook为何要让电脑像人一样思考?

Facebook为何要让电脑像人一样思考?

 2013/10/24 10:53:09    程序员俱乐部  我要评论(0)
  • 摘要:今年早些时候,Facebook小范围内推出GraphSearch(图谱搜索),方便用户搜索在线活动。随后,Facebook的工程师被迫调整该搜索引擎的算法,以便其机器可以识别俚语和口语,比如将“我哥们儿的照片”理解为“我朋友的照片”。算法改变后,GraphSearch的搜索效果有所优化,但这只是万里长征的第一步。正如谷歌和苹果这些科技巨人,Facebook也开始让其设备进行“深层学习”(DeepLearning)
  • 标签:Facebook

Facebook 为何要让电脑像人一样思考?

  今年早些时候,Facebook 小范围内推出 Graph Search(图谱搜索),方便用户搜索在线活动。随后,Facebook 的工程师被迫调整该搜索引擎的算法,以便其机器可以识别俚语和口语,比如将“我哥们儿的照片”理解为“我朋友的照片”。

  算法改变后,Graph Search 的搜索效果有所优化,但这只是万里长征的第一步。正如谷歌和苹果这些科技巨人,Facebook 也开始让其设备进行“深层学习”(Deep Learning)。“深层学习”领域是计算机科学一个新兴领域,简单说来就是构建像人脑一样处理数据的计算机程序,以达到电脑可以理解人类语言和行为的目的。Facebook 的一位发言人表示,该公司才刚刚开始这方面的研究

  在英语中,“off”、“the”和“hook”等常用的单词有很多种意思,而且它们在不同的词组中可有产生不同的解释,这取决于语境本身。举例来说,“酷”有时候是指“很棒”的意思,但是 Facebook 的机器可能不知道“酷”是什么意思,这是因为这些机器还没有受“教育”。

  对于 Graph Search,这些微妙的解读似乎无关重要,因为它一开始就只能帮助用户理清用户与朋友之间的关系。现在,Graph Search 已经可以提取和分析 Facebook 的帖子和评论了。换言之,所有你在 Facebook 写下的信息都可以被搜索出来,包括在时间线和动态消息上部的状态栏写下的所有东西,

  “因为在文化教养上存在差异,所以人类使用语言的方式有很大的不同。我们需要教育机器去认知这些细微之处,”文本分析公司 Semantria 首席执行官 Oleg Rogynskyy 说。“现在,电脑没有办法可以准确地理解这些东西,这是因为它们缺乏文化背景。这将是未来 10 至 15 年最难实现突破的困难。”

  为了能让电脑更像人脑,百度、谷歌、微软、IBM 等公司的计算机科学家已经开始研究“深层学习”。今年秋天,Facebook 加入他们的行列,并推出自己的“深层学习”研究组。

  “深层学习”包括建立神经网络,即多层次的软件处理系统——这个灵感来自于人类的大脑构造。就像人的大脑,这些人工搭建的神经网络可以收集信息,并做出反应。它们可以理解一个物体的所说所做,以及词句的意思,而且不必经历传统的机器学习过程。

  深层学习可以解决许多复杂的问题,比如计算机视觉、语音识别、语言翻译、自然语言处理等,但是要实现这些事情就必须需要大量的数据。在斯坦福大学研究自然语言处理的计算机科学家 Richard Socher 表示:“深度学习对人体工程学的要求较少,其能力程度取决于越来越多的训练数据。数据越多,它就越能得出正确的推断。”

  百度、谷歌和微软等公司都已经使用深层学习的算法去加强图像和语音搜索的效果。下一个大的挑战就是,用深层学习的算法去破译个人的思维和想法。这个挑战会让这些公司头疼很久——想一下,你 Facebook 和 Twitter 页面上源源不断的信息流代表了多少种情绪。

  Rogynskyy 所提及的那种计算机的大脑,可以理解不同语言环境下的辩证差异。要实现这种理解能力,其第一步是构建可以理解人们的意见和感情的算法;然后是建立可以分析人类情绪的算法,即能理解多维度的情感,比如理解一件事情的好与坏。最近,斯坦福大学计算机科学家 Socher 推出了一种可以实现这一点的深层学习算法,而且它比其他方法更好地理解书面语言。目前,已经有好几个创业公司找他接洽有关新算法的事宜。

  今天,即使是最聪明的算法,也无法根据一连串的词句去准确判断个人的想法。这是因为,使用最广泛的情感分析模型一直局限于所谓的“词包”方法——根据词序进行推断的方法。这个系统看到的只是一堆混合的词汇,然后查找词语的意思,最后推论出该句子或段落是否有正面或负面的含义。其他类似的算法可以分析长度不一的句子,其推算出来的结果可能更接近实际的意思。后面这种算法更好,但只是好了一点点。

  如果你有兴趣聆听大众化的声音,这些算法已经能胜任。但是,科技公司真正想要的是要了解个体用户,然后针对这些个人提供个性化的信息和广告。深层学习和情感分析公司 Alchemy API 的首席执行官 Elliot Turner 指出:“如果系统分析的错误率是 30 %,那你可能再也不会相信它对某条推文的理解。”

  这就是为什么 Facebook 和其他公司正在研究深层学习。他们想要一种可以更好地了解个体用户的技术,比如了解他们的感受、互动的偏好和方式,以及其它一切。他们可以使用这些信息来改善用户体验,建立品牌忠诚度,最终向这些用户推销产品——这是目前的技术难以企及的。Turner 说:“深度学习的力量体现在构建高层次的抽象数据表达,从字母到词短语到句子片段到段落。”

  互联网越来越广泛,网络上的信息数据库越来越丰富,比如互联网电影数据库、维基百科、Data.gov、PubMed 文献服务检索系统、CIA Factbook 等——所有这些数据都可以被作为训练数据用到深层学习模式中去。这些数据中有些是公开的,这不仅使 Facebook 有了更多的数据可用,也让那些没有大数据库的公司有了进军深层学习的机会。

发表评论
用户名: 匿名