[发明专利]一种利用语义解析结构的文本匹配方法有效
申请号: | 201811570080.9 | 申请日: | 2018-12-21 |
公开(公告)号: | CN109783806B | 公开(公告)日: | 2023-05-02 |
发明(设计)人: | 倪博溢;邹辉;张永煦 | 申请(专利权)人: | 众安信息技术服务有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F16/35;G06F40/295 |
代理公司: | 北京市万慧达律师事务所 11111 | 代理人: | 黄玉东 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: |
本发明公开了一种利用语义解析结构的文本匹配方法,该方法包括:定义初始语料集C |
||
搜索关键词: | 一种 利用 语义 解析 结构 文本 匹配 方法 | ||
【主权项】:
1.一种利用语义解析结构的文本匹配方法,其特征在于,所述方法包括:步骤1、定义初始语料集Cqa和补充语料集Cq;其中,q为问题,a为对应的答案;步骤2、利用语义依存解析方法,定义文本对应的语法树结构DP‑tree;步骤3、基于此语义结构,定义文本的核函数,以及文本相似度的度量函数;步骤4、基于上述定义的核函数,对文本进行核聚类,得到聚合的文本类如下:其中,q’ij为每个聚类中选取的ni个最靠近类中的样本点;步骤5、通过人工审核,给Ci类核准并标记上特定的标签Ti;步骤6、对产生的新的问题q,计算到的距离的平均值,作为新问题到类Ci的距离,返回距离最近的一个或多个类,或对应类中的典型样本点q’ij,并将该问题和所属类别记录到数据库;步骤7、校验,确定文本匹配的效果是否达到业务需求,如否,则返回步骤3对核函数进行调整直至新数据积累到某一程度,重新触发新的聚类训练。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于众安信息技术服务有限公司,未经众安信息技术服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811570080.9/,转载请声明来源钻瓜专利网。