[发明专利]一种用于新闻稿件标注的事件分割方法及系统有效
申请号: | 202211294322.2 | 申请日: | 2022-10-21 |
公开(公告)号: | CN115600577B | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | 宋永生;王楠 | 申请(专利权)人: | 文灵科技(北京)有限公司 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F40/30;G06F16/35 |
代理公司: | 无锡苏元专利代理事务所(普通合伙) 32471 | 代理人: | 张剑锋 |
地址: | 102200 北京市昌平区未来科*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 新闻 稿件 标注 事件 分割 方法 系统 | ||
本发明提供了一种用于新闻稿件标注的事件分割方法及系统,应用于新闻稿件标注技术领域,该方法包括:通过采集获得新闻稿件数据。构建初始分级特征,对新闻稿件数据的识别划分,获得初始层级拆分结果。通过新闻稿件数据的拆分前排布构建层级关联关系。对初始层级拆分结果进行逐层级特征词识别,生成层级特征词标识集合,对初始层级拆分结果进行结构化关联评价,生成结构化关联评价结果。通过层级关联关系、层级特征词标识集合和结构化关联评价结果进行所述初始层级拆分结果的关联度评价。通过关联度评价结果进行事件划分聚合标注。解决了现有技术新闻稿件标注采取人工标注的方式进行,导致标注效率较低且需要耗费大量的时间和人力资源的技术问题。
技术领域
本发明涉及新闻稿件标注技术领域,具体涉及一种用于新闻稿件标注的事件分割方法及系统。
背景技术
新闻稿件用于体现新闻的客观事实,一般由题目、引言、主题、背景和结论五个部分组成。在完成新闻稿件后,需要通过计算机根据标注内容生成知识图谱,对稿件中的主旨部分进行标注,使得计算机可以清楚快速的获知稿件的主旨内容。在现有技术中,新闻稿件的标注多为工作人员按照标注经验进行新闻稿件的标注,标注效率较低且需要耗费大量的时间和人力资源。
因此,在现有技术中新闻稿件标注采取人工标注的方式进行,导致标注效率较低,且需要耗费大量的时间和人力资源的技术问题。
发明内容
本申请提供一种用于新闻稿件标注的事件分割方法及系统,用于针对解决现有技术中新闻稿件标注采取人工标注的方式进行,导致标注效率较低且需要耗费大量的时间和人力资源的技术问题。
鉴于上述问题,本申请提供了一种用于新闻稿件标注的事件分割方法及系统。
本申请的第一个方面,提供了一种用于新闻稿件标注的事件分割方法,所述方法包括:采集获得新闻稿件数据;构建初始分级特征,基于所述初始分级特征进行所述新闻稿件数据的识别划分,获得初始层级拆分结果;通过所述新闻稿件数据的拆分前排布构建层级关联关系;对所述初始层级拆分结果进行逐层级特征词识别,生成层级特征词标识集合;基于结构化特征进行所述初始层级拆分结果的结构化关联评价,生成结构化关联评价结果;通过所述层级关联关系、所述层级特征词标识集合和所述结构化关联评价结果进行所述初始层级拆分结果的关联度评价;通过关联度评价结果进行事件划分聚合标注,将事件划分聚合标注结果反馈至标注用户。
本申请的第二个方面,提供了一种用于新闻稿件标注的事件分割系统,所述系统包括:新闻稿件数据采集模块,用于采集获得新闻稿件数据;初始层级拆分模块,用于构建初始分级特征,基于所述初始分级特征进行所述新闻稿件数据的识别划分,获得初始层级拆分结果;层级关联关系构建模块,用于通过所述新闻稿件数据的拆分前排布构建层级关联关系;层级特征词标识集合获取模块,用于对所述初始层级拆分结果进行逐层级特征词识别,生成层级特征词标识集合;关联评价结果获取模块,用于基于结构化特征进行所述初始层级拆分结果的结构化关联评价,生成结构化关联评价结果;关联度评价模块,用于通过所述层级关联关系、所述层级特征词标识集合和所述结构化关联评价结果进行所述初始层级拆分结果的关联度评价;标注结果反馈模块,用于通过关联度评价结果进行事件划分聚合标注,将事件划分聚合标注结果反馈至标注用户。
本申请中提供的一个或多个技术方案,至少具有如下技术效果或优点:
本申请实施例提供的方法通过采集获得新闻稿件数据。构建初始分级特征,对新闻稿件数据的识别划分,获得初始层级拆分结果。通过新闻稿件数据的拆分前排布构建层级关联关系。对初始层级拆分结果进行逐层级特征词识别,生成层级特征词标识集合,对初始层级拆分结果进行结构化关联评价,生成结构化关联评价结果。通过层级关联关系、层级特征词标识集合和结构化关联评价结果进行所述初始层级拆分结果的关联度评价。通过关联度评价结果进行事件划分聚合标注。实现了对新闻稿件的自动化标注,提高了标注的工作效率,减少新闻稿件标注的耗费时间,并进一步减少了对人力资源的浪费。解决了现有技术新闻稿件标注采取人工标注的方式进行,导致标注效率较低且需要耗费大量的时间和人力资源的技术问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于文灵科技(北京)有限公司,未经文灵科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211294322.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种化学药品存放钢制柜
- 下一篇:一种车位检测器