[发明专利]文本主题提取方法和装置在审
申请号: | 201911261471.7 | 申请日: | 2019-12-10 |
公开(公告)号: | CN111061877A | 公开(公告)日: | 2020-04-24 |
发明(设计)人: | 陈诚;郭弘;张辉极 | 申请(专利权)人: | 厦门市美亚柏科信息股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06K9/62 |
代理公司: | 厦门福贝知识产权代理事务所(普通合伙) 35235 | 代理人: | 陈远洋 |
地址: | 361000 福建省厦门市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请实施例公开了文本主题提取方法和装置。该方法的一具体实施方式包括:待处理文本并对待处理文本进行分词,得到词语序列;利用预先训练的词向量模型,确定词语序列中的每个词语的词向量;对所得到的词向量进行聚类,得到至少一个主题簇;对于至少一个主题簇中的每个主题簇,基于该主题簇包括的词向量,确定该主题簇的主题向量;基于词语序列中的每个词语的词向量,确定待处理文本的文本向量;确定每个主题向量与文本向量的相似度;基于所确定的相似度,确定表征待处理文本的主题。该实施方式实现了对诸如聊天文本等主题数量较多、主题交叉严重等特点的文本,通过确定各个主题的主题向量与整个文本进行相似度计算,提高主题提取的准确性。 | ||
搜索关键词: | 文本 主题 提取 方法 装置 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门市美亚柏科信息股份有限公司,未经厦门市美亚柏科信息股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911261471.7/,转载请声明来源钻瓜专利网。
- 上一篇:一种螺杆膨胀机
- 下一篇:一种用于ios系统的安全防护方法和系统