[发明专利]基于自然语言的体育新闻写作方法、装置及电子设备在审
申请号: | 201911336569.4 | 申请日: | 2019-12-23 |
公开(公告)号: | CN111191434A | 公开(公告)日: | 2020-05-22 |
发明(设计)人: | 周金娟;沈艺;倪合强;齐康;梁诗雯 | 申请(专利权)人: | 苏宁云计算有限公司 |
主分类号: | G06F40/186 | 分类号: | G06F40/186 |
代理公司: | 北京市万慧达律师事务所 11111 | 代理人: | 盛安平 |
地址: | 210000 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 自然语言 体育新闻 写作 方法 装置 电子设备 | ||
1.一种基于自然语言的体育新闻写作方法,其特征在于,所述方法包括步骤:
获取待处理语料、事件集合、槽位及每一所述槽位对应的槽位取值;
根据所述事件集合内每一事件、所述槽位及所述槽位取值,在所述语料中标注事件模板;
对每一所述事件进行权重赋值;
对每一所述事件及所述事件模板中所述槽位的种类和个数进行编码;
根据每一所述事件的所述权重,对所述事件和所述事件模板进行筛选;
对筛选后的所述事件和所述事件模板进行匹配和填充,生成新闻内容;
对所述新闻内容进行再处理,以得到最终的所述新闻内容。
2.根据权利要求1所述的体育新闻写作方法,其特征在于,所述获取事件集合、槽位及每一所述槽位对应的槽位取值包括步骤:
获取预设数量的体育新闻语料;
对所述体育新闻语料进行处理,以获取所有的所述事件、所述槽位和每一所述槽位对应的所述槽位取值;
将所有的所述事件放入同一集合内,以得到所述事件集合。
3.根据权利要求2所述的体育新闻写作方法,其特征在于,在所述对所述体育新闻语料进行处理,以获取所有的所述事件、所述槽位和每一所述槽位对应的所述槽位取值之后还包括步骤:
判断每一所述事件、每一所述槽位和每一所述槽位取值是否符合预设范围;
若符合,保留所述事件、所述槽位和所述槽位取值;
若不符合,删除所述事件、所述槽位或所述槽位取值。
4.根据权利要求1所述的体育新闻写作方法,其特征在于,所述事件包括标题、摘要和正文。
5.根据权利要求1所述的体育新闻写作方法,其特征在于,所述对每一所述事件进行权重赋值包括步骤:
根据所有的所述事件,对所述语料进行划分,以得到若干部分;
针对每一所述事件,构建所述事件与每一所述部分之间的映射;
针对每一所述映射,设置所述映射相对应的所述事件的权重。
6.根据权利要求1所述的体育新闻写作方法,其特征在于,所述对每一所述事件及所述事件模板中所述槽位的种类和个数进行编码包括步骤:
获取待编码的所述事件模板和所述事件;
根据正则匹配统计所述事件模板和所述事件中所述槽位的种类和个数;
确定所有的所述槽位总个数m和每个所述事件模板中所述槽位出现的最大次数n;
根据所述槽位出现的最大次数,确定每个所述槽位需分配n个二进制位以进行表示;其中,n为64的约数;
根据所述槽位总数和每个所述槽位分配的二进制位个数,确定采用的编码类型long类型和编码个数x;其中,x=[(m*n)/64]+1;
遍历所述事件模板中每个所述槽位,对当前所述槽位的槽位个数进行二进制编码;
根据当前所述槽位的索引地址i,确定当前所述槽位在第y个所述long类型上进行编码;其中,y=i/(64/n)+1;
将所述槽位个数的二进制表示向左移动p次;其中,p=(i-(y-1)*(64/n))*n;
将所有的所述long类型的编码拼接,以得到最终的所述编码。
7.根据权利要求1所述的体育新闻写作方法,其特征在于,所述对所述事件进行筛选包括步骤:
获取每一所述事件的对应权重;
将每一所述权重逐一与预设阈值比较;
保留所述权重大于所述预设阈值所对应的所述事件,剔除其他所有的所述事件。
8.根据权利要求1所述的体育新闻写作方法,其特征在于,所述对所述事件模板进行筛选包括步骤:
获取筛选后的所述事件及其对应的所述编码以及所述事件中所有所述事件模板对应的所述编码;
挑选所述槽位的个数最多的一个或多个所述事件模板作为候选事件模板模板;
从所述候选事件模板中随机选择一个所述事件模板作为待填充的所述事件模板。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏宁云计算有限公司,未经苏宁云计算有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911336569.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种气泡羽流湍流闭合的方法
- 下一篇:一种基于预算角度的高值耗材管理方法