[发明专利]针对多段式回复的问答内容标准性检测方法及装置在审
申请号: | 202210993205.9 | 申请日: | 2022-08-18 |
公开(公告)号: | CN115391506A | 公开(公告)日: | 2022-11-25 |
发明(设计)人: | 钱鹰;温道洲;姜美兰;刘歆;王毅峰;伍曾伟;陈雪;熊炜 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/194;G06F40/35 |
代理公司: | 北京同恒源知识产权代理有限公司 11275 | 代理人: | 廖曦 |
地址: | 400065 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 针对 段式 回复 问答 内容 标准 检测 方法 装置 | ||
本发明涉及一种针对多段式回复的问答内容标准性检测方法及装置,属于计算机领域。该方法为:1)构建标准问答对语料库,建立标准提问和标准回答的映射关系;2)对语音进行预处理,利用音色识别和语音识别技术,获得问者和答者的待检测提问文本和待检测回答文本;3)计算待检测提问文本和标准问答对语料库中每个标准提问文本的语义相似度,返回待检测提问文本对应的标准回答文本;4)对待检测回答文本和标准回答文本进行局部语义特征提取,利用多头自注意力机制对文本进行全局语义特征提取,再对融合后的语义特征计算语义相似度。本发明提供了一种服务过程中用户提问所得到的回答内容的标准性检测判断方法,以便提升用户服务的体验感和满意度。
技术领域
本发明属于计算机领域,涉及针对多段式回复的问答内容标准性检测方法及装置。
背景技术
现有技术中的自动问答系统一般是基于问答对语料库的文本对话系统,即用户输入文本,系统通过关键词检索和规则匹配,找到最优的匹配文本作为回答信息返回给用户。针对某些特定的问答交流过程,需要对问答交流整个流程进行跟踪,形成一个具有多段式回复的问答流程。对于多段式回复的问答内容标准性的检测,首先需要提取每个段落的各个语句间的语义特征。现有的技术方法在进行句子相似度识别时将句子的所有词汇作为相似度计算的基本单元,这种方式有两个缺点:其一,在句子中有许多无意义的助词,如“的”,“吧”等,这类词语会严重的干扰相似度的计算;其二,孤立的、单个词的词汇无法充分的表示句子的含义,这样会造成相似度计算的准确率下降。同时在多段式回复文本内容标准性检测中还需要提取各个段落之间的语义特征,每个段落由于在文本中的位置和顺序不同,导致对整个文本相似度的影响不同。并且,在各段落中,相同或相似的语句、用词及词频在不同的段落其语义权重(即表达文本语义的相对重要性)是不一样的。
发明内容
有鉴于此,本发明的目的在于提供一种针对多段式回复的问答内容标准性检测方法及装置,检测待识别语音信息中的多段式回复内容是否符合标准,以便更好的为用户服务,提高用户的服务体验。
为达到上述目的,本发明提供如下技术方案:
针对多段式回复的问答内容标准性检测方法,该方法包括以下步骤:
S1:针对应用场景中问答可能出现的各种提问,构建标准问答对语料库,建立标准提问和标准回答的映射关系;
S2:从设备获取音频信息,并利用音色识别技术对获取的音频进行检测,识别问者和答者,并划分问和答的语音段;然后进行语音识别,得到待检测提问文本和待检测回答文本;
S3:构建待检测提问识别模型,根据S1建立的提问和答案的映射关系,找到该提问的标准回答文本;
S4:针对S2返回的待检测回答文本和S3返回的标准回答文本,利用特征提取模型对两个文本分别进行局部特征提取和全局特征提取;
S5:将S4提取的语义特征输入到相似度计算模型中进行语义相似度计算,判断应用场景下问答内容是否符合标准性规范。
可选的,所述S1包括以下步骤:
S11:列举应用场景下问答过程中可能出现的各种提问,形成一个标准提问文本集合Q={q1,q2,...,qi,...,qn},其中,n为提问数量,qi表示某个提问的文本向量,其中i=1,2,...,n;
S12:针对标准提问文本集合Q中的每一个提问qi,i=1,2,...,n,由专业人员给出标准回答;将这些标准回答的文本组成一个标准回答文本集合A={a1,a2,...,ai,...,an},其中,n为回答文本的数量,ai表示对应的提问文本向量qi所对应的回答文本矩阵;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210993205.9/2.html,转载请声明来源钻瓜专利网。