[发明专利]口语对话管理方法及系统有效
申请号: | 202010060660.4 | 申请日: | 2020-01-19 |
公开(公告)号: | CN111128175B | 公开(公告)日: | 2021-04-16 |
发明(设计)人: | 高懿;朱风云;范梓野 | 申请(专利权)人: | 大连即时智能科技有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26;G10L13/04;G06F40/30;G06N20/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 116000 辽宁省大连市高新*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 口语 对话 管理 方法 系统 | ||
本发明公开了一种口语对话管理系统,包括:语音识别器、语言理解单元、对话管理器、语言生成单元、语音合成器、语境指导信息生成器、策略学习单元。此外,本发明还公开了一种口语对话管理方法。采用本发明的技术方案,对话管理器维护对话过程中的对话状态信息,系统根据当前的对话状态信息生成语境指导信息,并动态地指导语音识别器更好地识别当前语境中用户可能会使用的自然语言,大幅提高了语音识别的准确率;语音识别器不需要提前准备特定领域的训练语料并训练领域相关的语言模型,而是根据不同的语境动态调节语言模型,降低了提前训练语言模型的工作量,提高了人机对话系统的生产效率。
技术领域
本发明涉及人机对话技术领域,特别涉及一种口语对话管理方法及系统。
背景技术
口语对话系统(Spoken Dialog System,简称SDS)以语音的形式与用户进行交互,并为用户提供特定的服务;口语对话系统通常由语音识别、语言理解、对话管理、语言生成、语音合成等模块构成。在口语对话系统中,对话管理(Dialog Management,简称DM)和自动语音识别(Automatic Speech Recognition,简称ASR)是两个相互独立的模块。其中,对话管理模块是口语对话系统中的核心模块,其前置模块将用户的输入转化为某种形式化语义表达,对话管理模块在此基础上决定下一步系统输出的形式化语义表达;输出的形式化语义表达在后续模块中被转化为某种输出形式,如图片、语音、文字、链接等。自动语音识别模块将用户语音转化为文字,一般需要声学模型和语言模型(Language Model,简称LM)等资源,其中语言模型负责从自然语言方面为自动语音识别解码器提供线索。发明人经研究发现,现有技术中口语对话系统的自动语音识别的计算过程和对话管理的状态无关。然而事实上,口语对话过程中的任意时刻,用户使用的自然语言都与当前的对话语境密切相关,其中许多信息是在对话过程中才能够动态获取的。
现有技术中,口语对话系统通常包括五个模块,如图1所示:语音识别模块;语言理解模块;对话管理模块;语言生成模块;语音合成模块。其中,语音识别模块主要依赖声学模型和语言模型两种资源,其中声学模型提供将声波识别为语音学建模单元的概率,语言模型提供语音学建模单元组成自然语言句子的概率,语音识别算法根据这两种概率,通过解码得到与输入的声波最匹配的自然语言句子,即语音识别的结果。当前,口语对话系统中语音识别模块的语言模型一般利用领域相关的自然语言数据,经过离线训练过程训练得到,并在执行语言识别任务之前提前加载到系统中。在执行语音识别时,指定使用和当前对话内容相近的特定领域的语言模型,可以有效地提高语音识别的准确率。
然而,经过发明人的研究发现,当前的口语对话系统中的自动语音识别模块和对话管理模块是相对独立的。自动语音识别模块中使用到的语言模型一般由提前收集的语料通过机器学习算法训练获得。从一方面来说,语料一般需要提前准备,并训练定制化模型,导致系统的迭代周期长、生产效率低。另一方面来说,对话过程中,用户使用的语言并非一成不变,而是会随着对话发生的场景、对话的话题、对话题讨论的深入程度、用户的关注点的变化而动态调整。然而提前收集的语料统计规律固定,导致提前训练的语言模型无法应对动态变化的对话语境。从对话管理的角度出发,语境信息也并不会反馈到语音识别模块中帮助其进行更好的识别。目前,尚未有专门解决这一问题的口语对话系统。
发明内容
基于此,为解决现有技术中的技术问题,特提出了一种口语对话管理方法,包括:
语音识别器接收用户输入的语音,利用语言模型及声学模型将用户输入的语音转化生成文字形式的语音识别结果,将语音识别结果输出至与其相连接的语言理解单元。
所述语言理解单元将其接收的语音识别结果转化生成形式化语义表达的语言理解结果,并将语言理解结果输出至与其相连接的对话管理器。
策略学习单元学习得到对话策略信息及语境指导模型,将所述对话策略信息输出至与其相连接的所述对话管理器,将所述语境指导模型输出至与其相连接的语境指导信息生成器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连即时智能科技有限公司,未经大连即时智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010060660.4/2.html,转载请声明来源钻瓜专利网。