[发明专利]使用深度学习对长文档进行抽象概要在审
申请号: | 201811361333.1 | 申请日: | 2018-11-15 |
公开(公告)号: | CN110309292A | 公开(公告)日: | 2019-10-08 |
发明(设计)人: | A·科汉;W·W·常;T·H·布依;F·德农考特;D·S·金 | 申请(专利权)人: | 奥多比公司 |
主分类号: | G06F16/34 | 分类号: | G06F16/34;G06F17/22 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 酆迅;姚杰 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 公开了用于概要包括长文档的文档的抽象概要过程的技术。文档是使用具有注意解码的编码器‑解码器架构进行编码的。特别地,用于建模文档的编码器生成文档的词级别和部分级别表示。然后,话语感知解码器捕获来自文档的所有话语部分的信息流。为了扩展生成的概要的稳健性,神经注意机制考虑文档的词级别和部分级别表示两者。神经注意机制可以利用应用于词级别表示和部分级别表示的权重集合。 | ||
搜索关键词: | 文档 编码器 长文档 抽象 话语 神经 感知解码器 解码器架构 解码 稳健性 建模 权重 信息流 捕获 集合 应用 学习 | ||
【主权项】:
1.一种用于生成包括多个部分的结构化文档的概要的方法,所述方法包括:使用相应的第一递归神经网络来处理在部分中包括的多个词中的每个词,以生成相应的词级别表示;由第二递归神经网络来处理每个相应的词级别表示,以生成部分级别表示;通过对所述第一递归神经网络的一个或多个隐藏状态以及所述第二递归神经网络的一个或多个隐藏状态执行神经注意过程,来生成上下文向量;以及基于所述概要中的先前预测词和所述上下文向量,生成所述概要中的下一预测词。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于奥多比公司,未经奥多比公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811361333.1/,转载请声明来源钻瓜专利网。
- 上一篇:一种面向时序文献数据分析的方法及装置
- 下一篇:文本推荐方法和装置