[发明专利]一种基于多种检索模型的实时微博分类器在审
申请号: | 201610900560.1 | 申请日: | 2016-10-17 |
公开(公告)号: | CN106649515A | 公开(公告)日: | 2017-05-10 |
发明(设计)人: | 范科峰;高林;刘贤刚;李琳;王凯;姚相振;周睿康 | 申请(专利权)人: | 中国电子技术标准化研究院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62;G06N99/00;G06Q50/00 |
代理公司: | 北京国坤专利代理事务所(普通合伙)11491 | 代理人: | 郭伟红 |
地址: | 100007*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多种 检索 模型 实时 分类 | ||
1.一种基于多种检索模型的实时微博分类器,其特征在于,包括:
(1)用户在指定网站下载指定电脑版微博检索软件或者手机版微博检索软件;
(2)用户在微博检索软件注册成功后,使用手机或者电脑向微博检索软件信息统计处理中心发送检索信息内容;
(3)信息统计处理中心接收到用户发出的检索内容后,首先采用布尔模型信息检索模型,文字、数字或者单词等用户查询的内容由其包含的单词集合来表示,两者的相似性则通过布尔代数运算来进行判定,随后得出初级检索结果。
2.根据权利要求1所述的一种基于多种检索模型的实时微博分类器,其特征在于:得出的初级检索结果后由处理器将用户输入的搜索内容编辑成由t维特征组成的一个向量,同时处理器将得出的初级检索结果编辑成若干个t维特征组成的若干个个向量,进而检索内容向量与初级检索结果向量相互对比,得出更进一步的匹配结果。
3.根据权利要求2所述的一种基于多种检索模型的实时微博分类器,其特征在于:随后系统根据进一步的匹配结果与谷歌搜索引擎向结合,将用户所需要搜索的内容与谷歌网实时进行相似度计算,得到不同的相似度计算结果,每种相似度作为一个高级特征,这样将一条博文转换为高级特征向量,还有一些其他高级特征包括词性统计,重合单词统计、博文客观度,博文极性等,再根据有标注的训练集对分类器进行训练,分类器选择了以上所有分类器进行测试,通过训练测试找出最佳分类器,分类特征综合话题、话题扩展和上述各种检索模型计算得出进一步结果。
4.根据权利要求3所述的一种基于多种检索模型的实时微博分类器,其特征在于:后中央处理器将上述得出更进一步的匹配结果与谷歌搜索引擎分类得出的结果进行对比排除,进而得出具有实时意义的匹配结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子技术标准化研究院,未经中国电子技术标准化研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610900560.1/1.html,转载请声明来源钻瓜专利网。