[发明专利]评估文件的特殊性无效
申请号: | 03154624.2 | 申请日: | 2003-07-04 |
公开(公告)号: | CN1495644A | 公开(公告)日: | 2004-05-12 |
发明(设计)人: | T·卡瓦塔尼 | 申请(专利权)人: | 惠普开发有限公司 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 中国专利代理(香港)有限公司 | 代理人: | 王岳;王勇 |
地址: | 美国德*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 在自然语言处理中比较两个文件组,并通过以下手段估算一个文件组的每一个组成元素(例如一个句子,项或短语)的特殊性:将目标文件和对比文件分为文件段,构造每一个文件段的句子矢量,其分量是在文件段中出现的项的出现频率,在一个投影轴上投影两个文件的所有句子矢量以发现一个投影轴,该投影坐标轴使等于(起源于目标文件的投影值的平方和)/(起源于对比文件的投影值的平方和)的比率最大化。通过在投影轴上投影句子矢量来获取投影值,并在投影值的基础上计算目标文件的单独句子的特殊性等级。 | ||
搜索关键词: | 评估 文件 特殊性 | ||
【主权项】:
1.一种相对于包括至少一个文件段的对比文件估算包含在包括至少一个 文件段的目标文件中的每一个文件段的特殊性等级并且识别特殊文件段的方 法,该方法包括: (a)为包含在对比文件和目标文件中的每一个文件段确定相应的文件段矢 量,每一个文件段矢量具有与在它相应的文件段中出现的项的的出现频率相关 的分量值; (b)根据上述文件段矢量,计算分别对应于对比文件和目标文件的平方和 矩阵; (c)根据上述对应于对比文件和目标文件的平方和矩阵,计算目标文件的 主体差异因子矢量的预定的阶号; (d)根据上述对应的文件段矢量和上述相应阶的主体差异因子矢量,计算 上述相应阶的相应特殊性等级和对于目标文件的每一个文件段的总的特殊性等 级;和 (e)基于上述相应的阶的特殊性等级或根据目标文件的总的特殊性等级, 在目标文件中识别一个特殊文件段。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于惠普开发有限公司,未经惠普开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/03154624.2/,转载请声明来源钻瓜专利网。
- 上一篇:目标内容结构的管理及显示方法和记录媒体
- 下一篇:中华笔多媒体汉字教学系统