[发明专利]基于动态模型的文本属性提取匹配方法有效
申请号: | 202210478783.9 | 申请日: | 2022-05-05 |
公开(公告)号: | CN114579712B | 公开(公告)日: | 2022-07-15 |
发明(设计)人: | 杨波;王小莉;秦克良 | 申请(专利权)人: | 中科雨辰科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06K9/62 |
代理公司: | 北京锺维联合知识产权代理有限公司 11579 | 代理人: | 黄利萍 |
地址: | 100093 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 动态 模型 文本 属性 提取 匹配 方法 | ||
1.一种基于动态模型的文本属性提取匹配系统,其特征在于,包括:通信连接的处理器、存储器和数据库,所述存储器中存储有N类目标对象的文本数据,所述数据库的第i行包括(Ci,A0i,Di,R0i),Ci为第i类目标对象的ID,A0i为Ci对应的文本数据Ti的当前属性名集,A0i的初始值为Null;Di=(Di1,Di2,…,Dimi),Dij为Ti对应的数据元集Di中的第j个数据元;R0i为与A0i对应的匹配结果集,R0i∈Di,R0i的初始值为Null;
对于任一目标对象i的文本数据Ti,所述处理器用于执行计算机程序,以实现如下步骤:
S10,基于Ti,从数据库中获取对应的当前属性名集A0i;如果A0i不为Null,执行S20,否则,执行S30;
S20,基于A0i提取Ti中的属性名,得到Ti的属性名集Ai;
S30,基于设定的提取规则提取Ti中的属性,得到Ti的属性名集Ai;
S40,基于Ti,对Ai进行修正,得到修正后的属性名集Aci=(Aci1,Aci2,…,Acini),Acir为Aci中的第r个属性名,r的取值为1到ni,ni为Aci中的属性名数量;利用Aci更新A0i;
S50,如果Acir∈A0i,则将A0i中与Acir相同的属性名对应的数据元作为Acir的匹配结果;否则,执行S60;
S60,获取Dcir=max(Dcir1,Dcir2,…,Dcirmi),Dcirs为Acir与文本数据Ti对应的数据元集Di中的数据元Dis的相似度,s的取值为1到mi;
S70,如果Dcir>D,则将Dcir对应的数据元作为Acir的匹配结果; D为设定阈值;
S80,基于S60~S70得到Aci的匹配结果集Ri;对Ri进行修正,得到修正后的匹配结果集Rci,并利用Rci更新R0i。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科雨辰科技有限公司,未经中科雨辰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210478783.9/1.html,转载请声明来源钻瓜专利网。