[发明专利]一种基于图模型的无监督自动文摘提取方法有效
申请号: | 201911321569.7 | 申请日: | 2019-12-20 |
公开(公告)号: | CN111177365B | 公开(公告)日: | 2022-08-02 |
发明(设计)人: | 赵卫东;陈晓露;王铭 | 申请(专利权)人: | 山东科技大学 |
主分类号: | G06F16/34 | 分类号: | G06F16/34;G06F40/30;G06K9/62 |
代理公司: | 青岛智地领创专利代理有限公司 37252 | 代理人: | 种艳丽 |
地址: | 266590 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: |
本发明公开了一种基于图模型的无监督自动文摘提取方法,属自然语言处理领域。本发明使用TF‑IDF模型得到样本特征词的IDF值,输入到PV‑IDF模型训练得到样本句子向量;利用关键词和句子位置等信息得到句子初始权重,生成惩罚矩阵;将句子初始权重输入图模型中初始化节点权重,句子向量相似度作为节点连线权重,迭代图模型得到句子得分并排序;将得分前n个候选文摘句利用惩罚矩阵筛选,得到文摘句;使用PV‑IDF模型训练句子向量计算相似度,初始化图模型节点权重,并使用惩罚矩阵对文摘句进行筛选,解决了现有无监督自动文摘方法语义相关度低,冗余度高的问题,在R |
||
搜索关键词: | 一种 基于 模型 监督 自动 文摘 提取 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东科技大学,未经山东科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911321569.7/,转载请声明来源钻瓜专利网。
- 上一篇:一种面向数字字符的数据编码方法、解析方法及系统
- 下一篇:一种智慧旅游系统