[发明专利]基于人工智能的新闻摘要生成和显示方法、装置及系统有效
申请号: | 201710016480.4 | 申请日: | 2017-01-10 |
公开(公告)号: | CN106844340B | 公开(公告)日: | 2020-04-07 |
发明(设计)人: | 闭玮;刘志慧;曹宇慧;周古月;石磊;何径舟 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F16/34 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人工智能 新闻 摘要 生成 显示 方法 装置 系统 | ||
1.一种基于人工智能的新闻摘要生成方法,其特征在于,包括以下步骤:
识别新闻稿的逻辑结构;
利用各逻辑结构所对应的识别网络,对相应逻辑结构所包含的各段落进行识别,得到每一个段落中属于段落摘要的目标句子;所述识别网络,用于输入各段落中句子的特征向量,其中,所述特征向量包括所述句子所属段落的向量、所述句子的向量、表征所述句子在所属段落中的语义重要程度的向量、表征所述句子在所属段落中位置的向量和/或表征所述句子相对于已确定出的目标句子的冗余性的向量;
依据所识别出的各目标句子在所述新闻稿中所属的逻辑结构,生成所述各逻辑结构的新闻摘要,并在各逻辑结构的新闻摘要之间插入对应的引导语。
2.根据权利要求1所述的基于人工智能的新闻摘要生成方法,其特征在于,所述逻辑结构包括事件内容、事件背景和事件分析;所述依据所识别出的各目标句子在所述新闻稿中所属的逻辑结构,生成所述各逻辑结构的新闻摘要,并在各逻辑结构的新闻摘要之间插入对应的引导语之后,还包括:
在显示事件内容的新闻摘要之后,显示用于引导用户阅读事件背景的引导语或者显示用于引导用户阅读事件分析的引导语;
当探测到用户点击所述引导语时,继续显示所述引导语所引导用户阅读的事件背景的新闻摘要,或者事件分析的新闻摘要。
3.根据权利要求1所述的基于人工智能的新闻摘要生成方法,其特征在于,所述利用各逻辑结构所对应的识别网络,对相应逻辑结构所包含的各段落进行识别,得到每一个段落中属于段落摘要的目标句子,包括:
针对所述段落中的每一个句子进行特征提取,得到所述句子的特征向量;
将所述句子的特征向量拼接后输入全连接层,得到输出结果;所述输出结果用于指示所述句子是否属于段落摘要中的目标句子。
4.根据权利要求3所述的基于人工智能的新闻摘要生成方法,其特征在于,所述针对所述段落中的每一个句子进行特征提取,得到所述句子的特征向量,包括:
将所述段落进行切词,得到所述段落的词序列,并对所述词序列中的每一个词进行映射得到所述词的向量;
根据所述段落中每一个句子所含词的向量,计算得到各句子的向量。
5.根据权利要求4所述的基于人工智能的新闻摘要生成方法,其特征在于,所述计算得到各句子的向量之后,还包括:
将所述段落中每一个句子的向量输入双向RNN模型中,得到所述段落的向量。
6.根据权利要求1-5任一项所述的基于人工智能的新闻摘要生成方法,其特征在于,所述利用各逻辑结构所对应的识别网络,对相应逻辑结构所包含的各段落进行识别,得到每一个段落中属于段落摘要的目标句子之前,还包括:
获取已标注各段落所属逻辑结构的样本新闻稿;所述样本新闻稿为在网络中抓取到的新闻稿;
利用标注为同一逻辑结构的各段落,对所述逻辑结构所对应的识别网络进行训练。
7.根据权利要求1-5任一项所述的基于人工智能的新闻摘要生成方法,其特征在于,所述识别新闻稿的逻辑结构包括:
针对所述新闻稿中每一段落,将段落的字数、位于所述新闻稿中的位置和/或关键词作为所述段落的特征,输入经过训练的多分类器,得到所述段落所属的逻辑结构。
8.根据权利要求1-5任一项所述的基于人工智能的新闻摘要生成方法,其特征在于,所述依据所识别出的各目标句子在所述新闻稿中所属的逻辑结构,生成所述各逻辑结构的新闻摘要,包括:
将同属于一个逻辑结构的各目标句子,按照在所述新闻稿中出现的先后顺序进行拼接,生成所述逻辑结构的新闻摘要。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710016480.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种条烟贴标装置
- 下一篇:一种自动化贴合出标机