[发明专利]新闻要素的提取方法、装置、计算机设备和存储介质在审
申请号: | 202010560759.0 | 申请日: | 2020-06-18 |
公开(公告)号: | CN111753197A | 公开(公告)日: | 2020-10-09 |
发明(设计)人: | 文敏;陈运文;侯聪;桂洪冠;白良俊;纪达麒;罗巧梅 | 申请(专利权)人: | 达而观信息科技(上海)有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9538;G06F16/335;G06F16/338 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 201203 上海市浦东新区中国(上海)自*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 新闻 要素 提取 方法 装置 计算机 设备 存储 介质 | ||
本发明公开了一种新闻要素的提取方法、装置、计算机设备和存储介质,该方法包括:获取至少一个目标类型的新闻文本,并将各新闻文本输入至预先训练的要素提取模型中,所述要素提取模型使用多个目标类型的新闻训练样本训练得到;获取所述要素提取模型输出的,与各所述新闻文本分别对应的至少一个要素的要素信息值;响应于用户输入的展示要素,获取与所述展示要素匹配的展示界面;根据各所述新闻文本中与所述展示要素对应的要素信息值,将与各所述新闻文本分别对应的至少一个要素的要素信息值填充于所述展示界面中进行展示。使用本发明的技术方案,可以实现自动、准确的识别特定类型新闻事件中的各要素,并提高新闻事件要素的可视化展示效果。
技术领域
本发明实施例涉及数据处理技术,尤其涉及一种新闻要素的提取方法、装置、计算机设备和存储介质。
背景技术
随着信息时代的来临,各种类型的新闻数量呈爆炸性增长,新闻事件中通常包括时间、地点、人物、主语、触发词以及宾语等要素,如何准确提取新闻事件中的各要素,对整合新闻资源,提供趋势分析和预测具有重要的意义。
现有技术中,提取新闻事件的各要素,一般通过提取特征词或者训练提取模型的方式实现。发明人在实现本发明的过程中,发现现有技术存在以下缺陷:采用提取特征词的方式提取要素,提取结果不准确,且容易遗漏;采用训练提取模型的方式进行要素提取,对不同类型新闻的针对性不强,要素提取结果的展示效果较差。
发明内容
本发明实施例提供一种新闻要素的提取方法、装置、计算机设备和存储介质,以实现自动、准确的识别特定类型新闻事件中的各要素,并提高新闻事件要素的可视化展示效果。
第一方面,本发明实施例提供了一种新闻要素的提取方法,该方法包括:
获取至少一个目标类型的新闻文本,并将各新闻文本分别输入至预先训练的要素提取模型中,所述要素提取模型使用多个目标类型的新闻训练样本训练得到;
获取所述要素提取模型输出的,与各所述新闻文本分别对应的至少一个要素的要素信息值;
响应于用户输入的展示要素,获取与所述展示要素匹配的展示界面;
根据各所述新闻文本中与所述展示要素对应的要素信息值,将与各所述新闻文本分别对应的至少一个要素的要素信息值填充于所述展示界面中进行展示。
第二方面,本发明实施例还提供了一种新闻要素的提取装置,该装置包括:
新闻文本获取模块,用于获取至少一个目标类型的新闻文本,并将各新闻文本分别输入至预先训练的要素提取模型中,所述要素提取模型使用多个目标类型的新闻训练样本训练得到;
要素信息值获取模块,用于获取所述要素提取模型输出的,与各所述新闻文本分别对应的至少一个要素的要素信息值;
展示界面获取模块,用于响应于用户输入的展示要素,获取与所述展示要素匹配的展示界面;
要素信息值展示模块,用于根据各所述新闻文本中与所述展示要素对应的要素信息值,将与各所述新闻文本分别对应的至少一个要素的要素信息值填充于所述展示界面中进行展示。
第三方面,本发明实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本发明实施例中任一所述的新闻要素的提取方法。
第四方面,本发明实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如本发明实施例中任一所述的新闻要素的提取方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于达而观信息科技(上海)有限公司,未经达而观信息科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010560759.0/2.html,转载请声明来源钻瓜专利网。