[发明专利]基于互联网的术语定义辨析方法有效

申请号：	201310206190.8	申请日：	2013-05-29
公开（公告）号：	CN104216880B	公开（公告）日：	2017-06-16
发明（设计）人：	吕学强;吴瑞红	申请（专利权）人：	北京信息科技大学
主分类号：	G06F17/30	分类号：	G06F17/30;G06F17/27
代理公司：	暂无信息	代理人：	暂无信息
地址：	100192 北京市海淀***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	基于互联网的术语定义辨析方法，涉及自然语言处理领域。本发明主要解决一个术语多条定义，且定义规范性、准确性欠佳的问题。提出的技术方案要点包括待辨析术语定义和参考释义获取、术语定义表示和相似度计算、术语定义模板获取、术语定义可信度计算和辨析结果选取。构建的参考释义兼顾术语定义准确性和专业性的特点，应用术语定义的五元组表示方法进行术语定义相似度计算，考虑了术语定义特征词之间的相似度和定义间语义相似度，更好地描绘了术语定义间的相似性；通过归纳术语定义的匹配模板以调整术语定义间相似度，使术语定义可信度更准确。本发明取得了很好的辨析效果，能够解决术语定义不规范、不准确的问题。
搜索关键词：	基于互联网术语定义辨析方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于互联网的术语定义辨析方法，其特征在于，包括步骤：A待辨析术语定义获取；B基于互联网的参考释义获取；C术语定义的表示；D术语定义相似度计算；E术语定义模板获取；F术语定义可信度计算和辨析结果选择；从术语定义相似度矩阵D12中，选取矩阵D12的一行中的最大值Smax1，并将该值所在的行列删除；继续选取余下矩阵的第二行最大值Smax2，并将该值所在的行列删除，以此类推，直至矩阵中元素个数为零；得到新的最大值矩阵：Smax＝(Smax1,Smax2,...,Samxn)；则术语定义def和ref之间的基于句序的语义相似度为：ParaSim(def,ref)=1nΣi=1i=nSmaxi;]]>其中，句序是指在一段文本中，句子出现的先后顺序；术语定义def＝(u11,u12,...u1n)和ref＝(u21,u22,...u2m)之间相似度的特征矩阵D12由句子间相似度构成，可形式化表示为：其中：u1i(1≤i≤n)为术语定义def中第i个出现的句子，u2j(1≤j≤m)为术语定义ref中第j个出现的句子；u2j×u1i表示句子u2j与句子u1i间的相似度，即u2j×u1i＝SenSim(u2j,u1i)。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京信息科技大学，未经北京信息科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201310206190.8/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于互联网的术语定义辨析方法有效

专利文献下载