[发明专利]话题名称的提取方法及装置有效
申请号: | 201510697984.8 | 申请日: | 2015-10-23 |
公开(公告)号: | CN106610931B | 公开(公告)日: | 2019-12-31 |
发明(设计)人: | 朱波 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 11348 北京鼎佳达知识产权代理事务所(普通合伙) | 代理人: | 王伟锋;刘铁生 |
地址: | 100083 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种话题名称的提取方法及装置,涉及信息技术领域,解决了话题名称可读性低的问题。本发明的主要技术方案为:获取文本数据中各个共现词分别对应的互信息值,从所述共现词中提取互信息值大于预置互信息值的目标共现词,分别获取所述目标共现词与所述文本数据的话题词簇的相似度值,将相似度值大于预置阈值的目标共现词确定为所述文本数据的话题名称。本发明主要用于从文本数据中提取话题名称。 | ||
搜索关键词: | 话题 名称 提取 方法 装置 | ||
【主权项】:
1.一种话题名称的提取方法,其特征在于,包括:/n获取文本数据中各个共现词分别对应的互信息值;/n从所述共现词中提取互信息值大于预置互信息值的目标共现词;/n分别获取所述目标共现词与所述文本数据的话题词簇的相似度值;/n将相似度值大于预置阈值的目标共现词确定为所述文本数据的话题名称。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510697984.8/,转载请声明来源钻瓜专利网。