[发明专利]一种领域词识别方法和装置有效
申请号: | 200910241287.6 | 申请日: | 2009-11-27 |
公开(公告)号: | CN102081601A | 公开(公告)日: | 2011-06-01 |
发明(设计)人: | 于亮;张宇峰 | 申请(专利权)人: | 北京金山软件有限公司;北京金山数字娱乐科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 逯长明;王宝筠 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例公开了一种领域词识别方法和装置。本发明实施例所提供的方案以搜索引擎为基础,从搜索引擎对待识别领域词的搜索结果中确定待识别领域词可能归属领域的领域关键词,并根据预先确定的这些领域关键词的信息结合搜索结果计算出所述待识别领域词属于该领域的得分,将该得分与该领域的领域符合度阈值比较,根据比较结果确定待识别领域词是否属于该领域。本发明实施例所提供的方案利用搜索引擎本身的特点获得与待识别领域词相关度很大的语料,极大地提高了领域词识别的速度和准确度。 | ||
搜索关键词: | 一种 领域 识别 方法 装置 | ||
【主权项】:
一种领域词识别方法,其特征在于,包括:在搜索引擎中搜索待识别领域词,获取搜索结果中的子结果并记录各个子结果出现位置;结合预先确定的领域关键词信息确定所述搜索结果的子结果中出现的领域关键词,所述领域关键词信息包括领域关键词以及该领域关键词在其所属领域的权值;根据所述领域关键词的参数计算所述待识别领域词属于所述领域关键词对应领域的得分,所述领域关键词的参数包括所述领域关键词在各个子结果中出现的位置和出现次数;比较在所述得分与预先确定的领域符合度阈值,根据比较结果确定所述待识别领域词属于所述领域关键词对应的领域。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金山软件有限公司;北京金山数字娱乐科技有限公司,未经北京金山软件有限公司;北京金山数字娱乐科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200910241287.6/,转载请声明来源钻瓜专利网。