[发明专利]一种基于对比学习的新闻文本与评论相关性分析方法在审
申请号: | 202210507391.0 | 申请日: | 2022-05-10 |
公开(公告)号: | CN115146629A | 公开(公告)日: | 2022-10-04 |
发明(设计)人: | 王红斌;张卓;李辉;文永华;线岩团 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F40/289;G06F40/30;G06F40/194;G06N3/08 |
代理公司: | 昆明合盛知识产权代理事务所(普通合伙) 53210 | 代理人: | 王丹丹 |
地址: | 650093 云南省*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于对比学习的新闻文本与评论相关性分析方法,首先对文本进行分词和词性标注等处理,生成候选关键词,计算候选关键词与文本的相似度,提取关键词;文本的关键词序列与标题进行拼接得到新闻文本的表示;关键词和标题序列传递给BERT预训练模型的encoder两次,通过应用独立采样的dropoutmask获得两个作为正样本的嵌入,同时同一个batch里剩余新闻的两次嵌入作为负样本;交叉熵和相对熵损失函数对预训练模型进行微调。本发明提出的方法对于新闻文本与评论的相似度计算有很好的效果,通过合适的关键词数量与标题拼接可以提高相似度计算的准确率;在公共数据集上实验验证,该方法不仅适用于新闻文本与评论数据集,而且也具有一定的泛化能力。 | ||
搜索关键词: | 一种 基于 对比 学习 新闻 文本 评论 相关性 分析 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202210507391.0/,转载请声明来源钻瓜专利网。