[发明专利]组形成方法、数据采集方法和数据采集设备有效
申请号: | 201510094420.5 | 申请日: | 2015-03-03 |
公开(公告)号: | CN104899238B | 公开(公告)日: | 2019-03-08 |
发明(设计)人: | 古川忠延;冈本美纪 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06F16/953 | 分类号: | G06F16/953;G06Q10/10;G06Q30/02 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王萍;尹莹莹 |
地址: | 日本神*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 形成 方法 数据 采集 设备 | ||
提供了一种组形成方法、数据采集方法和数据采集设备。所述数据采集方法执行对由调查目标向公众开放的数据进行采集的处理,其中所述调查目标的属性相对于时间的推移进行改变。由计算机通过实行执行下述处理的程序来执行所述方法,所述处理包括:基于与第一属性不同的第二属性的分布来创建用于搜索所述调查目标的所述数据的关键词,其中所述调查目标具有关于所述调查目标的群不足的所述第一属性;对使用所述关键词采集的所述数据的所述调查目标的所述第一属性进行估算;以及通过被估算为具有不足的第一属性的调查目标来补充要被补充在所述群中的调查目标。
技术领域
本文中论述的实施方式涉及数据采集技术。
背景技术
近年来,比如学生、家庭主妇、从业人员等的各种阶层中的许多用户使用网(万维网)来学习日常生活中想到的事情和考虑事情的方式,或者来与其他用户交换各种领域中的信息。由于大量用户使用网,所以存在下述情况:通过使用网来执行市场研究,以将市场研究的结果用在开发商业产品中。
为了提取作为调查目标的用户,提出一种技术来提取如下用户:用户的信息包含用于在用户属性和搜索日志中进行搜索的条件。还建议了下述技术:通过使用与用户的投稿活动相关的数字信息来计算表明分析中的优越性的程度。
下面的专利文献公开了背景技术。
专利文献1:日本公开特许公报第2010-108119号
专利文献2:日本公开特许公报第2012-216168号
博客(网博)是网的用户将他们的观点向公众开放的实例。会存在下述情况:网上博客的内容用于产品开发的调查。在产品开发的调查中,通过下述方式创建群:通过对属于所创建群的每个用户的博客进行分析,来采样每个预定属性的适当数量人员以取得作为消费者或者顾客的每个用户的实际状况。
群中每个用户的属性随时间的推移而改变,而使得例如从学生变成从业人员。另外,可能存在下述情况:用户停止更新博客或者终止博客本身。
另一方面,在调研产品市场的情况下,除非维持属性比率恒定,否则无法作出与过去调研结果的准确比较。因此,为了对应于上述改变,从群中略去属性已经改变的用户以维持群中的属性比率恒定,并且将属性一样的新用户添加至群。
然而,如果使用在作调查时有效提取用户的上述常规技术,则难以响应于用户属性随时间推移的改变将群中的属性比率维持在固定值。
因此,期望通过考虑群比率中的属性比率来创建调查目标群。
发明内容
根据实施方式的一方面,提供了一种组形成方法,所述组形成方法由计算机执行程序以实施处理来实施,所述方法包括:从包括贡献者的第一组贡献者的公开信息中提取多个关键词,其中针对所包括的贡献者将关于第一属性的属性值计算为与预定属性值相对应,所述第一属性是相对于所述公共信息的每个贡献者的属性,并且所述第一属性的属性值相对于时间的推移而改变;通过形成所述公共信息的贡献者组来形成第一贡献者组集合,其中所述公共信息包含相对于在所述多个关键词中包含的每个关键词的对应关键词;相对于新公共信息通过形成所述新公共信息的贡献者组来形成第二贡献者组集合,其中所述新公共信息包含基于在所述多个关键词中包含的每个关键词的对应关键词;从所述第二贡献者组集合中包含的贡献者组之中识别贡献者组,其中所识别的贡献者组的属性的属性值的分布与所述第一分布不同,指示预定相似度关系,所述第二贡献者组集合中包含的贡献者组是通过使用与所述第一贡献者组集合中包含的每个贡献者组的关键词相同的关键词来形成的;以及通过使用来自在所识别的贡献者组中包含的贡献者之中的贡献者来形成与所述第一贡献者组相对应的新贡献者组,其中所使用的贡献者的关于估算的第一属性的属性值被计算为与所述预定属性值相对应。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510094420.5/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置