[发明专利]基于自然语言的体育新闻写作方法、装置及电子设备在审

专利信息
申请号: 201911336569.4 申请日: 2019-12-23
公开(公告)号: CN111191434A 公开(公告)日: 2020-05-22
发明(设计)人: 周金娟;沈艺;倪合强;齐康;梁诗雯 申请(专利权)人: 苏宁云计算有限公司
主分类号: G06F40/186 分类号: G06F40/186
代理公司: 北京市万慧达律师事务所 11111 代理人: 盛安平
地址: 210000 江苏省南*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 自然语言 体育新闻 写作 方法 装置 电子设备
【说明书】:

发明提供基于自然语言的体育新闻写作方法、装置及电子设备,所述方法包括步骤:获取待处理语料、事件集合、槽位及每一所述槽位对应的槽位取值;根据所述事件集合内每一事件、所述槽位及所述槽位取值,在所述语料中标注事件模板;对每一所述事件进行权重赋值;对每一所述事件及所述事件模板中所述槽位的种类和个数进行编码;根据每一所述事件的所述权重,对所述事件和所述事件模板进行筛选;对筛选后的所述事件和所述事件模板进行匹配和填充,生成新闻内容;对所述新闻内容进行再处理,以得到最终的所述新闻内容。该装置采用上述方法,提升了文章句式的多样性,使得文章信息量最大化;实现高效自动撰写体育新闻文章,减少了人力成本投入。

技术领域

本发明属于自然语言处理技术领域,具体涉及基于自然语言的体育新闻写作方法、装置及电子设备。

背景技术

现有的模板遍历匹配策略在对事件数据和模板进行匹配时,需要逐一比较模板中槽位和槽位个数,直到找到合适的模板。比如进球事件的一条数据为:{ORG_NEU:纽卡斯尔联,PER_ACT:舍尔,EVEINF_LOC_FROM:禁区外中央,EVEINF_BODY:右脚,EVEINF_LOC_TO:球门右上角},这条数据中包含五个槽位,当匹配模板时,假设进球事件有如下部分模板:

{ORG_NEU}收获进球!{PER_ACT}射门,球从{EVEINF_LOC_TO}飞进球门

{ORG_NEU}收获进球!{PER_ACT}{EVEINF_LOC_FROM}{EVEINF_BODY}射门,皮球划出一道漂亮的弧线从{EVEINF_LOC_TO}飞进球门。

遍历每个模板,根据正则匹配计算当前模板中包含的槽位集合,以及每个槽位出现的次数信息,如果当前模板的槽位集合是数据中槽位集合的子集,则成功匹配到一个模板。可以发现,遍历策略每次需要计算模板的槽位信息,再和数据的槽位信息进行集合运算比较耗时,因为线上系统有性能要求,所以往往匹配成功即返回,不会去匹配所有的模板。这样会带来另一个问题,通常成功匹配到的第一个符合条件的模板并不是最优的模板,即槽位种类和槽位个数并没有满足最大化要求。比如上面,匹配第一个模板时就能成功匹配,但是采用第一个模板会导致EVEINF_LOC_FROM和EVEINF_BODY信息不会被填充,进而生成的文章信息量较少。所以,遍历匹配策略不仅效率低,匹配结果的多样性也较差。

发明内容

本申请的目的之一在于针对现有技术的不足之处,提供一种基于自然语言的体育新闻写作方法,以提升文章句式的多样性,使得文章信息量最大化,所述方法包括步骤:

获取待处理语料、事件集合、槽位及每一所述槽位对应的槽位取值;

根据所述事件集合内每一事件、所述槽位及所述槽位取值,在所述语料中标注事件模板;

对每一所述事件进行权重赋值;

对每一所述事件及所述事件模板中所述槽位的种类和个数进行编码;

根据每一所述事件的所述权重,对所述事件和所述事件模板进行筛选;

对筛选后的所述事件和所述事件模板进行匹配和填充,生成新闻内容;

对所述新闻内容进行再处理,以得到最终的所述新闻内容。

优选地,所述获取事件集合、槽位及每一所述槽位对应的槽位取值包括步骤:

获取预设数量的体育新闻语料;

对所述体育新闻语料进行处理,以获取所有的所述事件、所述槽位和每一所述槽位对应的所述槽位取值;

将所有的所述事件放入同一集合内,以得到所述事件集合。

优选地,在所述对所述体育新闻语料进行处理,以获取所有的所述事件、所述槽位和每一所述槽位对应的所述槽位取值之后还包括步骤:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏宁云计算有限公司,未经苏宁云计算有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911336569.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top