[发明专利]一种利用语义解析结构的文本匹配方法有效

申请号：	201811570080.9	申请日：	2018-12-21
公开（公告）号：	CN109783806B	公开（公告）日：	2023-05-02
发明（设计）人：	倪博溢;邹辉;张永煦	申请（专利权）人：	众安信息技术服务有限公司
主分类号：	G06F40/30	分类号：	G06F40/30;G06F16/35;G06F40/295
代理公司：	北京市万慧达律师事务所 11111	代理人：	黄玉东
地址：	518000 广东省深圳市前海深港合作区前***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种利用语义解析结构的文本匹配方法，该方法包括：定义初始语料集Cqa和补充语料集Cq；利用语义依存解析方法，定义文本对应的语义结构DP‑tree；基于此语义结构，定义文本的核函数，以及文本相似度的度量函数；对文本进行核聚类，得到聚合的文本类函数：i＝1,2,...,M；其中，q′ij为每个聚类中选取的ni个最靠近类中的样本点；通过人工审核，给Ci类核准并标记上特定的标签Ti。本发明采用了以句法结构等语法分析结构为比较基础，结合了卷积核函数理论，以及树核(tree kernel,TK)定义了表示两个树形句法结构间距离的核函数，引入了句法相似性、词向量、词义网等的内、外部知识，能够精确判断文本之间的相似度。
搜索关键词：	一种利用语义解析结构文本匹配方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种利用语义解析结构的文本匹配方法，其特征在于，所述方法包括：步骤1、定义初始语料集C_qa和补充语料集C_q；其中，q为问题，a为对应的答案；步骤2、利用语义依存解析方法，定义文本对应的语法树结构DP‑tree；步骤3、基于此语义结构，定义文本的核函数，以及文本相似度的度量函数；步骤4、基于上述定义的核函数，对文本进行核聚类，得到聚合的文本类如下：其中，q’_ij为每个聚类中选取的n_i个最靠近类中的样本点；步骤5、通过人工审核，给C_i类核准并标记上特定的标签T_i；步骤6、对产生的新的问题q，计算到的距离的平均值，作为新问题到类C_i的距离，返回距离最近的一个或多个类，或对应类中的典型样本点q’_ij，并将该问题和所属类别记录到数据库；步骤7、校验，确定文本匹配的效果是否达到业务需求，如否，则返回步骤3对核函数进行调整直至新数据积累到某一程度，重新触发新的聚类训练。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于众安信息技术服务有限公司，未经众安信息技术服务有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201811570080.9/，转载请声明来源钻瓜专利网。

上一篇：一种网络社区用户识别方法、装置和可读存储介质
下一篇：一种针对APP软件缺陷的用户评论挖掘方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种利用语义解析结构的文本匹配方法有效

专利文献下载