[发明专利]信息解析报告书自动生成装置、信息解析报告书自动生成程序以及信息解析报告书自动生成方法无效
申请号: | 200680022916.0 | 申请日: | 2006-04-25 |
公开(公告)号: | CN101208694A | 公开(公告)日: | 2008-06-25 |
发明(设计)人: | 增山博昭;吉野令晃 | 申请(专利权)人: | 株式会社IPB |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F19/00 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 | 代理人: | 曲瑞 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息 解析 报告书 自动 生成 装置 程序 以及 方法 | ||
1.一种信息解析报告书自动生成装置,在调查对象文件的信息解析中,生成表示调查对象文件相对比较对象文件的特征的报告书,其特征在于包括:
输入单元,其至少接收上述调查对象文件的输入;
选出单元,其根据上述输入的调查对象文件,从存储在数据库中的比较对象文件群的信息中选出与该调查对象文件类似的母集团文件的集合、即母集团文件群;
提取单元,其提取上述调查对象文件相对上述母集团文件的具有特征的索引词;
生成单元,其根据上述母集团文件以及上述索引词,生成表示上述调查对象文件的特征的信息解析报告书;以及
输出单元,其将上述信息解析报告书向显示单元、记录单元、或通信单元进行输出。
2.根据权利要求1记载的信息解析报告书自动生成装置,其特征在于,
进一步具有计算相对上述比较对象文件的相似率的计算单元,
上述选出单元根据上述计算单元的结果选出母集团文件。
3.根据权利要求2记载的信息解析报告书自动生成装置,其特征在于,
上述计算单元基于各文件的每个索引词的出现频率和文件频率的函数值计算相似率。
4.根据权利要求2记载的信息解析报告书自动生成装置,其特征在于,进一步具有:
地图生成单元,其分布上述母集团或上述索引词并形成为地图状;
输出数据取入单元,其取入上述母集团或上述索引词的数据的一部分;
固定评注取入单元,其取入与上述地图以及数据内容相对应的固定的评注;以及
记入自由的评注的评注记入单元中的至少一个,
上述生成单元合成上述地图、上述数据以及/或者上述评注,生成表示上述调查对象文件的特征的信息解析报告书。
5.根据权利要求1至4中任意一项记载的信息解析报告书自动生成装置,其特征在于,
上述生成单元进行作为上述索引词或者母集团文件中的每个预定项目的累计的关键词累计、表示关键词或者母集团文件中的预定项目的时序的推移的时序累计、以及/或者母集团文件中的多个预定项目的矩阵累计,生成包含累计结果的信息解析报告书。
6.根据权利要求5记载的信息解析报告书自动生成装置,其特征在于,
上述生成单元在上述时序累计中生成由关键词或母集团文件中的预定项目的累计结果、以及该累计结果的时序的延伸率的矩阵所表示的组合,并生成包含该组合的信息解析报告书。
7.根据权利要求1至6中任意一项记载的信息解析报告书生成装置,其特征在于,上述生成单元具有:
计算上述提取的索引词在上述比较对象文件群中的出现频率的函数值的第一出现值频率计算单元;
计算上述提取的索引词在上述母集团文件群中的出现频率的函数值的第二出现值频率计算单元;以及
根据上述计算出的各索引词在比较对象文件群中的出现频率的函数值和在上述母集团文件群中的出现频率的函数值的组合、生成包含各索引词和其定位数据的频率散布图的频率散布图生成单元。
8.根据权利要求1至7中任意一项记载的信息解析报告书生成装置,其特征在于,上述生成单元包括:
提取单元,其提取上述母集团文件、或者上述调查对象文件以及母集团文件的内容数据以及时间数据;
树状图生成单元,其根据上述各文件的内容数据,生成表示上述多个文件的相关性的树状图;
聚类单元,其根据预定规则切断上述树状图,并提取集群;以及
集群内排列单元,其根据上述各文件的时间数据,决定属于上述各集群的文件群在该集群内的排列。
9.根据权利要求8记载的信息解析报告书生成装置,其特征在于,
上述聚类单元切断上述树状图并提取父集群,根据属于上述父集群的各文件的内容数据生成表示属于上述父集群的文件群的相关性的部分树状图,根据预定规则切断该生成的部分树状图并提取子孙集群。
10.根据权利要求9记载的信息解析报告书生成装置,其特征在于,
为了生成上述部分树状图,上述聚类单元从各文件向量中除去在属于上述父集群的多个文件间的偏差值比按预定方法确定的值小的向量分量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社IPB,未经株式会社IPB许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200680022916.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:双频光纤激光器
- 下一篇:基于星座扩展和空余子载波降低OFDM中峰均比的方法
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置