[发明专利]一种个性化自动文摘算法在审

专利信息
申请号: 202110497850.7 申请日: 2021-05-08
公开(公告)号: CN113420142A 公开(公告)日: 2021-09-21
发明(设计)人: 蒋健 申请(专利权)人: 广东恒宇信息科技有限公司
主分类号: G06F16/34 分类号: G06F16/34;G06F16/35;G06F16/9535;G06K9/62;G06N3/04;G06N3/08
代理公司: 暂无信息 代理人: 暂无信息
地址: 516600 广东省汕尾*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 个性化 自动 文摘 算法
【说明书】:

发明涉及自动文摘算法技术领域,且公开了一种个性化自动文摘算法,基于模糊聚类算法建模用户兴趣;根据数据建模、模糊三元聚类算法对社交标签网络中的三类节点(文档,用户和标签)进行协同聚类;实验结果与分析;基于卷积神经网络为句子打分;对使用卷积神经网络架构进行文本进行摘要抽取;实验结果与分析;本发明通过利用计算机从原文中自动抽取摘要的方法可以使读者在最短的时间内获取原文主要思想,使阅读变得更加高效,从而避免现有的自动摘要系统为不同的用户生成相同的摘要,而未考虑到读者的兴趣点。这些“千篇一律”的摘要具有通用性,但无法很好地满足用户的个人需求。

技术领域

本发明涉及自动文摘算法技术领域,具体为一种个性化自动文摘算法。

背景技术

随着互联网的迅速发展,人们被大量的在线信息和文本所淹没,互联网正处于高速发展时期,网络信息出现了爆炸式地增长,网络环境中的信息资源数量巨大且杂乱无章,如何使得人们更加快速、准确地从网络上获取有价值的信息,是目前被积极研究的一个热点领域从大量文本信息中提取重要内容已成为我们的一个迫切需求,而自动文本摘要则提供了一个高效的解决方案。这种利用计算机从原文中自动抽取摘要的方法可以使读者在最短的时间内获取原文主要思想,使阅读变得更加高效。近年来,自动文摘系统作为一种强大的辅助工具,在网络信息检索、新闻、邮件和会议记录等各个领域发挥了重要作用。然而大多数现有的自动摘要系统为不同的用户生成相同的摘要,而未考虑到读者的兴趣点。这些“千篇一律”的摘要具有通用性,但无法很好地满足用户的个人需求,为此提出一种个性化自动文摘算法,来解决此问题。

发明内容

本发明的目的在于提供一种个性化自动文摘算法,具备利用计算机从原文中自动抽取摘要的方法可以使读者在最短的时间内获取原文主要思想,使阅读变得更加高效的优点,解决了现有的自动摘要系统为不同的用户生成相同的摘要,而未考虑到读者的兴趣点。这些“千篇一律”的摘要具有通用性,但无法很好地满足用户的个人需求的问题。

为实现上述目的,本发明提供如下技术方案:一种个性化自动文摘算法,包括以下步骤:

步骤1:基于模糊聚类算法建模用户兴趣;

步骤2:根据数据建模、模糊三元聚类算法对社交标签网络中的三类节点(文档,用户和标签)进行协同聚类;

步骤3:实验结果与分析;

步骤4:基于卷积神经网络为句子打分;

步骤5:对使用卷积神经网络架构进行文本进行摘要抽取;

步骤6:实验结果与分析;

步骤7:获取用户兴趣点发现;

步骤8:生成个性化自动摘要;

步骤9:实验结果与分析。

优选的,所述在步骤1中,根据用户兴趣为目标文档生成摘要,工作研究如何利用社会标签系统的三元网络来增强网络聚类,从而推断用户兴趣,能产生包括用户和标签的聚类结构以及不同实体的聚类之间的关系等信息。

优选的,所述在步骤2中,用户节点和标签节点可以同样建模,通过这种表示模型,通过任何基于矢量空间模型(VSM)的聚类方法将社交标记网络的三种类型的节点分别聚类。分别对这三种类型的节点进行聚类,可忽略了不同类型的节点之间的影响。在一个典型的社交标签系统中,语义相关的标签通常被分配给具有相似主题的文档以及具有相似兴趣的用户;同样,具有共同兴趣的用户通常使用语义相关的标签来标注与局部相关的网页,利用不同类型节点的类结构之间的关系,该算法将聚类的数量作为输入,并且随机初始化模糊分类矩阵。基于每个类的committee计算其质心向量,并通过计算每一轮迭代中对象与各类的质心间的余弦相似度,更新对象的成员隶属度。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东恒宇信息科技有限公司,未经广东恒宇信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110497850.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top