[发明专利]用于在文本数据流中包括的项目之中标识具有最高出现频率的项目的方法和设备有效
申请号: | 201310132171.5 | 申请日: | 2013-04-16 |
公开(公告)号: | CN103377147A | 公开(公告)日: | 2013-10-30 |
发明(设计)人: | R·H·鲁迪;小柳光生;恐神贵行 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F12/08 | 分类号: | G06F12/08 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 酆迅;李峥宇 |
地址: | 美国纽*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及用于在文本数据流中包括的项目之中标识具有最高出现频率的项目的方法和设备。具体地,涉及有效地在大量文本数据流中包括的项目之中标识具有最高出现频率的项目的方法、设备和计算机程序。将标识项目的标识信息和项目的计数存储在存储器的较高级中,以及仅将标识信息存储在低于存储器的较高级的存储器的较低级中。接收文本数据流输入,响应于将从所接收的文本数据流输入划分出的桶中包括的项目的标识信息存储在存储器的较高级中,增加项目的计数的增量,响应于存储在存储器的较低级中,向存储器的较高级传送项目的标识信息以及初始计数,响应于没有存储在任何级中,将项目的标识信息以及初始计数新存储在存储器的较高级中。 | ||
搜索关键词: | 用于 文本 数据流 包括 项目 之中 标识 具有 最高 出现 频率 方法 设备 | ||
【主权项】:
一种用于使用具有多个级的存储器的计算机系统来在文本数据流中包括的项目之中标识具有高出现频率的项目的方法,其将用于标识项目的标识信息以及项目的计数存储在所述具有多个级的存储器的存储器的较高级中,以及仅将标识信息存储在所述具有多个级的存储器中的低于所述存储器的较高级的存储器的较低级中,所述方法包括步骤:接收文本数据流输入,以及响应于将从所接收的文本数据流输入划分出的桶中包括的项目的标识信息存储在所述存储器的较高级中,增加项目的计数的增量,响应于存储在所述存储器的较低级中,向所述存储器的较高级传送所述项目的标识信息以及初始计数,以及响应于没有存储在任何级中,将所述项目的标识信息与所述初始计数一起新存储在所述存储器的较高级中。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310132171.5/,转载请声明来源钻瓜专利网。
- 上一篇:网页中插入影音广告的方法
- 下一篇:可摄像的电视机