[发明专利]评估文件的特殊性无效

专利信息
申请号: 03154624.2 申请日: 2003-07-04
公开(公告)号: CN1495644A 公开(公告)日: 2004-05-12
发明(设计)人: T·卡瓦塔尼 申请(专利权)人: 惠普开发有限公司
主分类号: G06F17/28 分类号: G06F17/28
代理公司: 中国专利代理(香港)有限公司 代理人: 王岳;王勇
地址: 美国德*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要: 在自然语言处理中比较两个文件组,并通过以下手段估算一个文件组的每一个组成元素(例如一个句子,项或短语)的特殊性:将目标文件和对比文件分为文件段,构造每一个文件段的句子矢量,其分量是在文件段中出现的项的出现频率,在一个投影轴上投影两个文件的所有句子矢量以发现一个投影轴,该投影坐标轴使等于(起源于目标文件的投影值的平方和)/(起源于对比文件的投影值的平方和)的比率最大化。通过在投影轴上投影句子矢量来获取投影值,并在投影值的基础上计算目标文件的单独句子的特殊性等级。
搜索关键词: 评估 文件 特殊性
【主权项】:
1.一种相对于包括至少一个文件段的对比文件估算包含在包括至少一个 文件段的目标文件中的每一个文件段的特殊性等级并且识别特殊文件段的方 法,该方法包括: (a)为包含在对比文件和目标文件中的每一个文件段确定相应的文件段矢 量,每一个文件段矢量具有与在它相应的文件段中出现的项的的出现频率相关 的分量值; (b)根据上述文件段矢量,计算分别对应于对比文件和目标文件的平方和 矩阵; (c)根据上述对应于对比文件和目标文件的平方和矩阵,计算目标文件的 主体差异因子矢量的预定的阶号; (d)根据上述对应的文件段矢量和上述相应阶的主体差异因子矢量,计算 上述相应阶的相应特殊性等级和对于目标文件的每一个文件段的总的特殊性等 级;和 (e)基于上述相应的阶的特殊性等级或根据目标文件的总的特殊性等级, 在目标文件中识别一个特殊文件段。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于惠普开发有限公司,未经惠普开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/03154624.2/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top