人工智能在问答方面的表现优于人类

回顾三个获奖的SQuAD系统 在过去的几个月中,您可能遇到过以下新闻和媒体报道: CNET —在斯坦福大学的阅读理解测试中,人工智能击败了人类 彭博社—阿里巴巴的人工智能在阅读测试中胜过人类 Dailymail —阿里巴巴的AI在一项卓越的世界首创的有史以来最艰难的阅读理解测试之一中,表现优于人类 《华盛顿邮报》 —人工智能模型在阅读理解上胜过人类,但他们仍有路要走 有线-AI在阅读时击败人类! 也许不吧 边缘-不,机器的阅读能力不及人类 在本文中,我们将探讨在SQuAD数据集上击败人类的三个系统,同时探索机器学习技术,这些技术可提高其在自动答题和机器理解方面的性能。 基于这些模型的详细比较,我们评估了在线自助服务支持和数字个人协助的背景下它们在满足现实世界消费者需求方面的表现。 我们得出结论,自动问答的领域已经足够成熟,可以处理事实问答,但是,需要进一步的改进来满足消费者在描述性回答,操作指南,故障排除以及其他需要复杂推理的请求类型方面的需求。比简单的单个单词或跨度答案要好。 什么是自动问答? 随着深度学习的进步,自动问答(AQA)和机器理解(MC)聚集了强大的动力,深度学习已成为NLP(自然语言处理)和NLU(自然语言理解)的必备工具。 诸如Apple的Siri和Google…

在亚历克斯的引擎盖下

我们的调度助手Alex在人工智能的支持下,处理了来自客户及其客人的大量调度请求。 Alex经过培训可以理解以自然语言编写的消息并处理请求。 平均而言,在与调度有关的线程中,在最终确定双方方便的时间和地点之前,相关人员之间会交换大约八到十条消息。 通常,与正在讨论的会议相关的信息会分散在线程中的不同消息中。 自然语言的内在复杂性使其难以提取信息。 语言袋模型及其局限性: 作为识别邮件中重要句子的早期方法,我们使用了传统的词袋模型,即以单字组,双字组和三字组为特征。 词袋模型不能利用短语级别和句子级别的句法提示。 例如,考虑句子“本周的会议安排”​​和“本周的会议安排:”。 在这两个示例中,尽管两个句子中的单词相同,但是使用这些单词的上下文不同。 但是,词袋模型将两个句子解释为相同的向量表示形式。 为了完全处理安排会议的请求,模型必须考虑到对话的上下文。 要了解上下文,我们需要对过去发生的事情有一个很好的记忆。 我们人类有能力选择性地记住对以后使用很重要的信息。 基于序列的机器学习算法(例如HMM,CRF)具有理解上下文的能力。 随着该领域的最新进展,最先进的深度学习算法(例如递归神经网络(RNN))已证明在学术界和行业中都优于其他顺序学习模型。 使用序列到序列模型启用上下文: 最简单的神经网络是前馈类型。…