[发明专利]针对多段式回复的问答内容标准性检测方法及装置在审
申请号: | 202210993205.9 | 申请日: | 2022-08-18 |
公开(公告)号: | CN115391506A | 公开(公告)日: | 2022-11-25 |
发明(设计)人: | 钱鹰;温道洲;姜美兰;刘歆;王毅峰;伍曾伟;陈雪;熊炜 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/194;G06F40/35 |
代理公司: | 北京同恒源知识产权代理有限公司 11275 | 代理人: | 廖曦 |
地址: | 400065 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 针对 段式 回复 问答 内容 标准 检测 方法 装置 | ||
1.针对多段式回复的问答内容标准性检测方法,其特征在于:该方法包括以下步骤:
S1:针对应用场景中问答可能出现的各种提问,构建标准问答对语料库,建立标准提问和标准回答的映射关系;
S2:从设备获取音频信息,并利用音色识别技术对获取的音频进行检测,识别问者和答者,并划分问和答的语音段;然后进行语音识别,得到待检测提问文本和待检测回答文本;
S3:构建待检测提问识别模型,根据S1建立的提问和答案的映射关系,找到该提问的标准回答文本;
S4:针对S2返回的待检测回答文本和S3返回的标准回答文本,利用特征提取模型对两个文本分别进行局部特征提取和全局特征提取;
S5:将S4提取的语义特征输入到相似度计算模型中进行语义相似度计算,判断应用场景下问答内容是否符合标准性规范。
2.根据权利要求1所述的针对多段式回复的问答内容标准性检测方法,其特征在于:所述S1包括以下步骤:
S11:列举应用场景下问答过程中可能出现的各种提问,形成一个标准提问文本集合Q={q1,q2,...,qi,...,qn},其中,n为提问数量,qi表示某个提问的文本向量,其中i=1,2,...,n;
S12:针对标准提问文本集合Q中的每一个提问qi,i=1,2,...,n,由专业人员给出标准回答;将这些标准回答的文本组成一个标准回答文本集合A={a1,a2,...,ai,...,an},其中,n为回答文本的数量,ai表示对应的提问文本向量qi所对应的回答文本矩阵;
S13:通过构造提问和回答的映射关系,建立标准问答对语料库;针对某一特定的服务问题需求,问答对语料库中回答对是包含针对该服务的整个流程,形成一个具有多段式回复的问答流程,回答文本矩阵ai表示的是整个服务流程中的回答文本组成的多段式文本;标准问答对语料库中每个问答对表示为qi,ai,qi∈Q,ai∈A,其含义是第i个服务流程的提问文本qi对应的标准回答ai。
3.根据权利要求2所述的针对多段式回复的问答内容标准性检测方法,其特征在于:所述S2包括以下步骤:
S21:对拾音设备采集的音频进行端点检测,从带有噪声的语音中准确的定位出语音的开始点和结束点,去掉静音的部分和噪声的部分,找出一段语音中真正有效的内容;
S22:利用不同说话人声纹特征的不同,对语音信号进行说话人转折点检测,将语音信号分割成多个语音片段;
S23:利用语音识别技术将语音片段转化成文本,根据每个片段中对应说话人的不同,对每一段转化后的文字片段标注对应的说话角色标签;
S24:根据文本内容确定某项服务开始到结束的整个流程;在每一项服务开始之前,客服需要通过规定的用语来表示该项服务正式启动;同时,在用户服务结束之后,需要通过规定的用语表示该项服务办理完毕;
S25:当客服说完规定的用语,服务正式启动;一般来说,该句之后的说话角色标签变更为用户所对应的文本即为该项服务的具体内容,通过包含提问语义的关键词提取待检测提问文本q′;
S26:根据文本内容确定待检测回答文本a′;当前待检测提问文本q′所对应的下一段说话角色标签变更为工作人员的文本即为工作人员针对该提问文本q′的待检测回答文本a′;在服务结束之前,需要将整个服务流程中针对q′的回答整合成一个具有多段式回复的待检测回答文本a′。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210993205.9/1.html,转载请声明来源钻瓜专利网。