[发明专利]调查对象文件的文件特征分析单元无效
申请号: | 200480027223.1 | 申请日: | 2004-10-13 |
公开(公告)号: | CN1856787A | 公开(公告)日: | 2006-11-01 |
发明(设计)人: | 增山博昭;佐藤晴正 | 申请(专利权)人: | 株式会社IPB |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中原信达知识产权代理有限责任公司 | 代理人: | 陆锦华;谢丽娜 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种索引语抽取单元,具有:输入调查对象文件(d)和比较对象文件群(P)的输入装置(1);抽取调查对象文件(d)内的索引语的索引语抽取装置(120);算出所述被抽取了的索引语在比较对象文件群(P)中的出现频度的函数值(IDF(P))的第1出现频度算出装置;基于调查对象文件(d)的数据,从比较对象文件群(P)中选出与调查对象文件(d)类似的类似文件群(S)的类似文件群选出装置(160);算出所述被抽取了的索引语在类似文件群(S)中的出现频度的函数值(IDF(S))的第2出现频度算出装置(171);以及基于与各索引语有关的在所述算出了的比较对象文件群和类似文件群中的出现频度的函数值的组合,输出各索引语及其位置关系数据的输出装置。由此就能正确地把握调查对象文件的性格。 | ||
搜索关键词: | 调查 对象 文件 特征 分析 单元 | ||
【主权项】:
1.一种索引语抽取单元,具有:输入调查对象文件、与所述调查对象文件进行比较的比较对象文件群、成为与所述调查对象文件类似的类似文件群的选出元的选出源文件群的输入装置;抽取所述调查对象文件内的索引语的索引语抽取装置;算出所述被抽取了的索引语在所述比较对象文件群中的出现频度的函数值的第1出现频度算出装置;基于所述调查对象文件的数据,从所述选出源文件群中选出所述类似文件群的类似文件群选出装置;算出所述被抽取了的索引语在所述类似文件群中的出现频度的函数值的第2出现频度算出装置;以及基于与各索引语有关的在所述算出了的所述比较对象文件群中的出现频度的函数值和在所述类似文件群中的出现频度的函数值的组合,输出各索引语及其位置关系数据的输出装置。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社IPB,未经株式会社IPB许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200480027223.1/,转载请声明来源钻瓜专利网。
- 上一篇:一种评估宽带网络质量的方法
- 下一篇:一种用于无线发射机的预失真器