[发明专利]一种关键短语抽取方法和装置有效
申请号: | 201710737275.7 | 申请日: | 2017-08-24 |
公开(公告)号: | CN107577663B | 公开(公告)日: | 2021-01-12 |
发明(设计)人: | 王亮 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种关键短语抽取方法和装置,涉及文本处理技术领域。本发明提供的关键短语抽取方法和装置,在确定关键短语的时候,能够确定词对的共现信息并根据词对的共现信息,确定文本的关键短语。共现信息能够体现组成词对的各个分词之间的关系,对应短语多为固定搭配以及专有名词的特点,以共现信息作为确定关键短语的依据,能够提高关键短语抽取的准确率,提高了关键短语抽取的精度。 | ||
搜索关键词: | 一种 关键 短语 抽取 方法 装置 | ||
【主权项】:
一种关键短语抽取方法,其特征在于,所述方法包括:对文本进行预处理,得到多个分词;将所述多个分词中每两个相邻的分词组合,得到多个词对;通过预设的成词搭配特征表,确定所述多个词对中每个词对的共现信息;根据所述每个词对的共现信息,确定所述文本的关键短语。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710737275.7/,转载请声明来源钻瓜专利网。
- 上一篇:面向中文文本的语义理解系统及方法
- 下一篇:用于显示信息的方法和装置