[发明专利]短文本主题识别方法和系统有效
申请号: | 201911116869.1 | 申请日: | 2019-11-15 |
公开(公告)号: | CN111090995B | 公开(公告)日: | 2023-03-31 |
发明(设计)人: | 姜元春;李怡;钱洋;刘业政;梁瑞成;孙见山;朱婷婷;汪文娟;刘畅;刘心语 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F40/258;G06F16/31;G06V30/19 |
代理公司: | 北京久诚知识产权代理事务所(特殊普通合伙) 11542 | 代理人: | 余罡 |
地址: | 230009 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种短文本主题识别方法和系统,涉及数据处理领域。本发明首先基于预训练的主题识别模型,获取待测短文本集合的短文本‑主题分布和主题‑词分布,词包括背景词和主题词;然后基于短文本‑主题分布和主题‑词分布,计算各主题词在短文本下所占权重;最后基于主题词在短文本下所占权重,选取焦点主题。本发明将短文本中词的做了区分,认为词包括背景词和主题词,除去在主题识别过程中背景词的影响,提高主题识别的准确率,从而准确的识别出焦点主题,为后续的个性化营销、推荐和信息检索等实际场景提供准确的数据支持。 | ||
搜索关键词: | 文本 主题 识别 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911116869.1/,转载请声明来源钻瓜专利网。