[发明专利]基于双重匹配的匹配集获取方法、装置和计算机设备在审
申请号: | 202010357579.2 | 申请日: | 2020-04-29 |
公开(公告)号: | CN111708861A | 公开(公告)日: | 2020-09-25 |
发明(设计)人: | 刘晓军 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/247;G06F40/289;G06K9/62;G10L15/02;G10L15/06;G10L15/16 |
代理公司: | 深圳市明日今典知识产权代理事务所(普通合伙) 44343 | 代理人: | 王杰辉 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 双重 匹配 获取 方法 装置 计算机 设备 | ||
1.一种基于双重匹配的匹配集获取方法,其特征在于,包括:
获取输入的语音信息;
根据预设的语音识别方法,对所述语音信息进行语音识别处理,从而得到文字文本;
利用预设的第一匹配算法,使用所述文字文本在预设的数据池中进行匹配处理,从而得到第一匹配集,其中所述第一匹配集由一个或多个第一匹配数据构成;
利用预设的特征提取工具,对所述语音信息进行特征提取处理,从而得到声音特征;
利用预设的第二匹配算法,使用所述声音特征在所述数据池中进行匹配处理,从而得到第二匹配集,其中所述第二匹配集由一个或多个第二匹配数据构成;
根据预设的数据集合并方法,对所述第一匹配集和所述第二匹配集进行合并处理,从而得到与所述输入的语音信息对应的最终匹配集。
2.根据权利要求1所述的基于双重匹配的匹配集获取方法,其特征在于,所述利用预设的第一匹配算法,使用所述文字文本在预设的数据池中进行匹配处理,从而得到第一匹配集的步骤,包括:
对所述文字文本进行分词处理,从而得到由多个词语构成的初始词语序列;
对所述初始词语序列进行同义词转换,从而得到中间词语序列;
从所述中间词语序列中提取出关键词,并利用所述关键词获取所述数据池中的指定数据,其中所述指定数据被标注有所述关键词;
将所述指定数据构成的集合作为所述第一匹配集。
3.根据权利要求2所述的基于双重匹配的匹配集获取方法,其特征在于,所述对所述文字文本进行分词处理,从而得到由多个词语构成的初始词语序列的步骤,包括:
进行第一次分词处理,所述第一次分词处理指将所述文字文本依次输入至所述p个分词工具,从而得到对应的p个第一分词结果,其中所述第一分词结果由第一分词和除所述第一分词之外的第一剩余文本构成;
进行第一次筛选处理,所述第一次筛选处理指,从所述p个第一分词结果中筛选出一个指定第一分词结果,其中所述指定第一分词结果由指定第一分词和指定第一剩余文本构成;
依次进行第二次分词处理和第二次筛选处理、第三次分词处理和第三次筛选处理、...、第t次分词处理和第t次筛选处理,其中所述第t次分词处理指将指定第t-1剩余文本分别输入至所述p个分词工具,以得到对应的p个第t分词结果,所述第t分词结果由第t分词和除所述第t分词之外的第t剩余文本构成,t为大于1的整数;所述第t次筛选处理指从所述p个第t分词结果中筛选出一个指定第t分词结果,其中所述指定第t分词结果由指定第t分词和指定第t剩余文本构成;
判断所述指定第t剩余文本的字或字母的数量是否小于预设的数量阈值;
若所述指定第t剩余文本的字或字母的数量小于预设的数量阈值,则将指定第一分词、...、指定第t分词和所述指定第t剩余文本顺序连接,从而得到初始词语序列。
4.根据权利要求2所述的基于双重匹配的匹配集获取方法,其特征在于,所述数据池中的所有数据均为预先构建设的数据网络中的节点,所述将所述指定数据构成的集合作为所述第一匹配集的步骤S304,包括:
根据预设的词语与倾向程度值的对应关系,获取所述初始词语序列中的多个词语的倾向程度值;
对所述初始词语序列中的多个词语进行倾向程度值加和处理,从而得到倾向程度和值;
判断所述倾向程度和值是否小于预设的程度阈值;
若所述倾向程度和值小于预设的程度阈值,则获取所述数据网络中与所述指定数据直接连接的关联数据;
将所述指定数据和所述关联数据构成的集合作为所述第一匹配集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010357579.2/1.html,转载请声明来源钻瓜专利网。