[发明专利]语音识别文本连贯性处理方法和装置有效
申请号: | 202010694673.7 | 申请日: | 2020-07-17 |
公开(公告)号: | CN111832308B | 公开(公告)日: | 2023-09-08 |
发明(设计)人: | 缪庆亮;吴仁守;朱钦佩;朱少华 | 申请(专利权)人: | 思必驰科技股份有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/30;G06F40/211;G10L15/26 |
代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 黄谦;邓婷婷 |
地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 文本 连贯性 处理 方法 装置 | ||
1.一种语音识别文本连贯性处理方法,包括:
通过预设分类模板或者预设分类模型识别出语音识别文本中的至少一个关键信息的起始位置,其中所述预设分类模板或所述预设分类模型均是基于预设关键字形成,所述关键信息为与所述预设关键字对应的内容;
从所述起始位置开始取多个句子,根据每一句子中的每个词或每个词组的第一词嵌入计算与所述每一句子对应的第二词嵌入,根据所述第二词嵌入计算所述多个句子组成的文本片段对应的第三词嵌入,其中,所述第一词嵌入是将所述每一句子中的每个词或每个词组转换为每个词或每个词组的向量表示,所述第二词嵌入是通过所述每个词或所述每个词组的向量表示直接累加获得与所述每一句子对应的向量表示,所述第三词嵌入是通过所述每一句子的向量表示直接累加获得所述多个句子组成的文本片段对应的向量表示;
基于所述第一词嵌入、所述第二词嵌入和所述第三词嵌入计算所述每一句子与其他句子之间的相似度、所述每一句子与起始句子之间的距离衰减以及每一句子与起始句子之间的连贯度;
通过余弦距离衰减计算所述第二词嵌入和所述第三词嵌入的相似度;
基于预设距离衰减公式计算所述每一句子到所述起始句子的距离衰减,其中,所述预设距离衰减公式为:
;
其中,N0=1.0,为预设阈值,l为当前句子到起始句子的距离;
判断所述每一句子与所述其他句子之间是否包含连词或所述每一句子与其他句子是否包含公共的实体词,以计算所述每一句子与所述起始句子的连贯度;
基于所述相似度构建语义图,并根据所述语义图计算所述每一句子的重要程度;
利用图聚类算法获取一个或多个聚类中心,计算每个聚类中心的相似度、连贯度、重要程度与距离衰减的和值,取所述和值排名前n的句子作为连贯句子序列。
2.根据权利要求1所述的方法,其中,所述基于所述相似度构建语义图,并根据所述语义图计算所述每一句子的重要程度包括:
将所述每一句子作为语义图的节点,将所述节点之间的边表示所述每一句子与其他句子之间的相似度;
基于所述相似度利用textrank算法计算每一句子的重要程度。
3.根据权利要求1所述的方法,其中,所述预设分类模板由所述预设关键字和模板组成,所述方法还包括:
用所述模板和预设关键词训练所述预设分类模型,从而让所述预设分类模型能够识别出所述语音识别文本内的关键信息。
4.根据权利要求1所述的方法,其中,所述从所述起始位置开始取多个句子,根据每一句子中的每个词或每个词组的第一词嵌入计算与所述每一句子对应的第二词嵌入,根据所述第二词嵌入计算所述多个句子组成的文本片段对应的第三词嵌入包括:
从所述起始位置开始取多个句子,将每一句子中的每个词或每个词组的第一词嵌入累加,获得与所述每一句子对应的第二词嵌入;
将所述第二词嵌入累加获得所述多个句子组成的文本片段对应的第三词嵌入。
5.根据权利要求1-4中任一项所述的方法,其中,所述方法还包括:
响应于用户的音频输入或者录音,将所述音频输入或者所述录音转换成语音识别文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思必驰科技股份有限公司,未经思必驰科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010694673.7/1.html,转载请声明来源钻瓜专利网。