[发明专利]一种应用于阅读机器人的摘要生成方法及系统有效

申请号：	202011264506.5	申请日：	2020-11-12
公开（公告）号：	CN112347753B	公开（公告）日：	2022-05-27
发明（设计）人：	关勇;李茹;郭少茹;谭红叶;张虎	申请（专利权）人：	山西大学
主分类号：	G06F40/194	分类号：	G06F40/194;G06F16/34;G06F40/289;G06F40/30;G06N3/04
代理公司：	太原申立德知识产权代理事务所(特殊普通合伙) 14115	代理人：	郭海燕
地址：	030006***	国省代码：	山西;14
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种应用于阅读机器人摘要生成方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种应用于阅读机器人的摘要生成方法，其特征在于，包括如下步骤：

步骤1：针对文章D，在训练集中查找与当前文章D最相似的一篇文章D_can，文章D_can的摘要作为候选摘要S_can；

步骤2：使用汉语框架网标注工具分别抽取文章D和候选摘要S_can中的框架场景和其中，表示文章D的第m个框架，表示候选摘要S_can的第n个框架，并筛选出与候选摘要框架F^s相关的文章D中的框架F＇；

步骤3：将步骤2筛选出的文章框架F＇＝{F₁＇,F₂＇,…,F_k＇}融合成一个框架序列F^*后，输入预训练模型BERT，获取框架的向量表示H^f；

步骤4：将文章D＝{x₁,x₂,…,x_l}输入预训练模型BERT，获取文章的向量表示H^d，其中，l表示文章的长度；

步骤5：将步骤4生成的文章表示H^d和步骤3生成的框架表示H^f进行融合，获取最终的文章表示C；

步骤6：将步骤5生成的文章表示C生成摘要；

所述步骤3中文章框架F＇融合成框架序列F^*的具体过程包括：首先，对F＇中所有框架按框架覆盖度从大到小排序，框架覆盖度最大的框架作为基准框架F^tmp；然后，遍历剩余的框架，如果当前位置F_i是框架元素，且在F^tmp中与其对应的位置不是框架元素，则用F_i替换其中指F^tmp中第i个位置的信息；最终得到一个框架序列F^*＝F^tmp；

所述步骤5中文章表示H^d和框架表示H^f融合的具体过程包括：首先，计算框架表示H^f对文章表示H^d的影响，具体公式如下：

其中，α_tj是t时刻框架对文章的注意力权重，H^f(j＇)指框架表示H^f第j＇个隐藏状态，N指文章的长度，exp指以e为底的指数函数，同理，计算出文章表示H^d对框架表示H^f的影响C^d2f；然后，设计一个门控H^gate用来融合C^f2d和C^d2f的信息，具体公式如下：

其中，θ表示一个非线性函数，C为最终的文章表示。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于山西大学，未经山西大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202011264506.5/1.html，转载请声明来源钻瓜专利网。

上一篇：基于红外光栅的鱼类智能检测方法
下一篇：一株能拮抗多种病原菌的季也蒙毕赤酵母菌株及其应用

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种应用于阅读机器人的摘要生成方法及系统有效

专利文献下载