[发明专利]基于文本处理的匹配方法、装置、计算机设备和存储介质在审
申请号: | 202110448628.8 | 申请日: | 2021-04-25 |
公开(公告)号: | CN113761887A | 公开(公告)日: | 2021-12-07 |
发明(设计)人: | 杨韬 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F40/295;G06F40/30;G06F40/194;G06N20/00 |
代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 李汉亮 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 文本 处理 匹配 方法 装置 计算机 设备 存储 介质 | ||
本申请实施例公开了一种基于文本处理的匹配方法、装置、计算机设备和存储介质;本申请实施例可以获取待处理文本,所述待处理文本包括待匹配的目标分词、以及与所述目标分词在语义层面上具有关联关系的关联分词;确定所述目标分词的候选匹配内容集,所述候选匹配内容集包括所述目标分词的至少一个候选匹配内容,每个所述候选匹配内容具有对应的内容描述信息;基于所述目标分词与所述关联分词之间的关联关系、以及所述候选匹配内容的所述内容描述信息,计算所述目标分词与所述候选匹配内容的语义匹配度;基于所述语义匹配度,从所述候选匹配内容集中确定并输出所述目标分词的目标匹配内容。该方案可以提高针对文本中分词的内容匹配效率。
技术领域
本申请涉及计算机技术领域,具体涉及一种基于文本处理的匹配方法、装置、计算机设备和存储介质。
背景技术
在对文本进行处理的过程中,对文本中的分词进行内容匹配,旨在确定文本中的分词所表征的含义或该分词所指代的内容,这在自然语言处理的众多产品中都具有非常广泛的应用。
在对相关技术的研究和实践过程中,本申请的发明人发现,目前在对待处理文本中的目标分词进行内容匹配时,是通过在待处理文本中聚焦于该目标分词来进行内容匹配的,这会使得针对分词的内容匹配方法还有待提高,例如,匹配效率与准确率均有待提高。
发明内容
本申请实施例提供一种基于文本处理的匹配方法、装置、计算机设备和存储介质,可以提高针对文本中分词的内容匹配效率。
本申请实施例提供一种基于文本处理的匹配方法,包括:
获取待处理文本,其中,所述待处理文本包括待匹配的目标分词、以及与所述目标分词在语义层面上具有关联关系的关联分词;
确定所述目标分词的候选匹配内容集,其中,所述候选匹配内容集包括所述目标分词的至少一个候选匹配内容,每个所述候选匹配内容具有对应的内容描述信息;
基于所述目标分词与所述关联分词之间的关联关系、以及所述候选匹配内容的所述内容描述信息,计算所述目标分词与所述候选匹配内容的语义匹配度;
基于所述语义匹配度,从所述候选匹配内容集中确定并输出所述目标分词的目标匹配内容。
相应的,本申请实施例还提供一种基于文本处理的匹配装置,包括:
获取单元,用于获取待处理文本,其中,所述待处理文本包括待匹配的目标分词、以及与所述目标分词在语义层面上具有关联关系的关联分词;
确定单元,用于确定所述目标分词的候选匹配内容集,其中,所述候选匹配内容集包括所述目标分词的至少一个候选匹配内容,每个所述候选匹配内容具有对应的内容描述信息;
计算单元,用于基于所述目标分词与所述关联分词之间的关联关系、以及所述候选匹配内容的所述内容描述信息,计算所述目标分词与所述候选匹配内容的语义匹配度;
输出单元,用于基于所述语义匹配度,从所述候选匹配内容集中确定并输出所述目标分词的目标匹配内容。
在一实施例中,所述计算单元,包括:
第一计算子单元,用于基于所述目标分词与所述关联分词之间的关联关系,计算所述目标分词与所述候选匹配内容的语义关联度,其中,所述语义关联度表征所述目标分词与所述候选匹配内容在语义层面上的关联程度;
第二计算子单元,用于基于所述候选匹配内容的所述内容描述信息,计算所述目标分词与所述候选匹配内容的语义相似度,其中,所述语义相似度表征所述目标分词与所述候选匹配内容在语义层面上的相似层度;
第三计算子单元,用于基于所述语义关联度与所述语义相似度,计算所述目标分词与所述候选匹配内容的语义匹配度。
在一实施例中,所述第一计算子单元,用于:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110448628.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:新型侧向层析检测卡
- 下一篇:一种寻车方法、装置、设备及计算机可读存储介质