宁德生活圈

网站首页 科技 > 正文

能听懂人类语音的机器:人工智能的对话模式

2021-09-14 05:16:12 科技 来源:
导读 在人工智能发展的早期,研究人员意识到机器的功能和可能性,可以理解人类语音的含义和细微差别。对话和人类语言对计算机来说是特别具有挑战

在人工智能发展的早期,研究人员意识到机器的功能和可能性,可以理解人类语音的含义和细微差别。对话和人类语言对计算机来说是特别具有挑战性的领域,因为不精确的单词和交流。人类语言充满了细微差别、语境、文化和社会的深度和不准确性,这可能导致各种解释。如果计算机能理解我们说话时的意思,然后用我们能理解的方式和我们交流,那么很显然,我们已经达到了人工智能的目的。

交互是AI的一种模式。

AI的会话模式

AI的这种特殊应用如此深刻,以至于构成了AI的七种基本模式之一:对话和人的交互模式。对话模式的基本目标是让机器以人类自然语言模式与人类交流,让机器以自己理解的语言与人类交流。对话模式并不要求人类遵循打字、滑动、点击或使用计算机编程语言等交互机器模式,而是可以以一种交互的方式与机器进行交互:以我们大脑已经理解的方式进行书写和交流。

如今,人工智能的许多狭窄应用集中在人类通信上。如果计算机能够理解人类交流的意义,那么我们就可以创建各种实际应用,从聊天机器人和对话代理,到可以读取我们在文档和电子邮件中所写内容的系统,甚至可以准确翻译一个人的系统。语言,不失意义和语境。

机器对人、机器对机器和人对机器的交互都是人工智能如何交流和理解人类交流的例子。现实生活中的一些例子包括语音助手、内容生成、聊天机器人、情感分析、情感分析和意图分析以及机器驱动翻译。对话模式的应用如此广泛,以至于整个市场都聚焦于使用具有AI功能的对话系统,从对话金融到远程医疗等。AI对话模式的力量除了简单理解书面或口头语言外,还可以通过机器理解情绪、情绪和意图的能力来体现,或者通过视觉手势转化为机器可理解的形式。

自然语言处理:在过去的几十年里,它一直在不断发展。

准确处理和生成人类语言尤其复杂。在过去的60年里,技术一直在不断发展。解决这个问题的一种方法是将音频波形转换成机器可读的文本,这被称为自动语音识别(ARS)。虽然ASR的实现有些复杂,但通常不需要机器学习或AI功能,近几十年也出现了一些相当精准的语音转文本技术。语音转文本不是对自然语言的理解。当计算机记录人类在说什么时,它会获得它能理解的波形,并将其转换成文字。它没有解释听到的数据。

将文本转换为语音的反向功能不需要太多机器学习或AI。文本到语音只是计算机产生的波形,用来说出一个已知的单词。当你只用文字来演讲时,你对这些词的意思一无所知。语音转换技术已经存在很多年了,在电影《战争游戏》 (1983)中可以听到:“你想玩游戏吗?”

然而,即使机器学习帮助文本到语音变得更加人性化,语音到文本更加准确,语音到文本和文本到语音并不是需要人工智能和机器学习的地方。自然语言处理不仅涉及波形转换和音频波形生成。你有文字不代表机器能懂。为了获得这种理解,机器需要能够理解和生成词性,提取和理解实体,确定单词的含义,并使用更复杂的处理活动将概念、短语、概念和语法连接在一起,从而形成更大的画面。意图和意义。

自然语言处理包括自然语言理解和自然语言生成两部分。自然语言理解是指计算机解释人类的输入,如语音或文本,并将其转换成机器可以按预期方式使用的东西。自然语言理解由许多子域组成,这些子域试图从音频波形生成的文本或人类在文本模式交互(如聊天机器人或消息传递界面)中键入的文本中理解意图。AI应用于词汇分析,理解语法规则,将句子分解为结构成分。不管怎样,大多数自然语言理解系统都有一些共同的组成部分。然后,一旦确定了组成部分,每项工作都可以从语义上理解为根据上下文和词序解释单词。进一步的逻辑分析和推理可以利用知识图谱和其他推理方法,根据每个部分所指的内容来确定意义。

自然语言的产生是一个过程,在这个过程中,人工智能可以以任何听起来不像计算机生产的自然方式为人类交流做准备。为了使计算机过程被视为自然语言的生成,计算机必须对内容进行实际的解释和理解,以便进行有效的交流。这涉及到自然语言理解中确定的许多步骤的逆转。这些概念通过机器如何理解人类的交流,采用概念并产生人类可以理解的对话。

为什么机器友好的对话如此重要?

当涉及到人与计算机之间的通信模式时,它引起了极大的关注,因为有时我们与系统的交互可能非常困难。打字或滑动可能需要一些时间,无法正确传达我们的需求,而阅读FAQ等静态内容可能对大多数客户没有帮助。人们希望与机器高效互动。很多用户界面对于人机交互并不理想,需要混乱的菜单交互、过于简单的交互式语音响应系统或者基于规则的聊天机器人,都无法满足用户的需求。

更智能的对话系统的发展可以追溯到几十年前,而ELIZA聊天机器人最早是在1966年研发出来的,这显示了机器介导对话的可能性。如今,用户更熟悉了。

悉语音助手,例如Alexa,Google Assistant,Apple Siri,Microsoft Cortana和基于Web的聊天机器人。但是,如果您最近与他们中的任何一个进行过互动,那么他们仍然缺乏许多重要方式的理解。毫无疑问,人工智能研究人员的许多工作将致力于改善机器能够理解和生成人类语言的方式,从而增强那些利用人工智能对话模式的应用程序的功能。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。 标签:人工智能人类语音

免责声明: 本文由用户上传,如有侵权请联系删除!


标签: