[发明专利]一种新闻事件中人物观点抽取方法在审
申请号: | 201810635449.3 | 申请日: | 2018-06-20 |
公开(公告)号: | CN108984521A | 公开(公告)日: | 2018-12-11 |
发明(设计)人: | 赵忠华;孙小宁;李欣;万欣欣;袁钟怡;张小明 | 申请(专利权)人: | 国家计算机网络与信息安全管理中心 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 北京慧泉知识产权代理有限公司 11232 | 代理人: | 李娜 |
地址: | 100029*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 抽取 检索 数据库 检索结果 新闻事件 检索请求 评价对象 新闻文本 有效识别 构建 去重 排序 存储 查询 合并 返回 响应 | ||
本发明公开了一种新闻事件中人物观点抽取方法,包括观点抽取、人物观点数据库、观点检索3个部分;观点抽取部分负责对原始的新闻文本进行清理,并提取其中的观点要素包括观点持有者、观点评价对象、观点情感强度等;人物观点数据库负责存储人物、观点以及情感,以便检索和查询;观点检索部分负责响应用户的检索请求,对检索结果进行去重和合并,并返回排序的检索结果;本发明方法能够有效识别新闻中的人物观点并构建可供检索的人物观点数据库,提供了一种准确高效的人物观点抽取方法。
技术领域
本发明涉及一种新闻事件中人物观点抽取方法,适用于从新闻文本中抽取人物观点并提供观点检索,属于计算机科学与技术领域。
背景技术
随着互联网媒体的迅速发展,新闻事件的记载和传播越来越倾向于网络媒体的形式;新闻作为记录社会、传播信息、反映时代的一种文体,具有真实性、简明性、及时性的特点;新闻如实记录了新闻人物针对某些话题的观点表达,如发言、评论、表态等;而新闻中出现的人物,例如世界主要政治、经济、体育等领域人物,往往在现实社会中具有较大的影响力;从新闻文本中识别人物观点,为研究这些人物的观点态度,为舆情分析、政策分析等提供了重要的作用;
新闻事件中人物观点抽取是指从原始的新闻文本中,识别表达了人物观点的句子,并从中抽取出观点要素,如观点持有者、观点评价对象、观点发表时间、观点持有者对评价对象的情感态度等,并将这些识别出的观点消歧存入数据库中,进行去重和合并,向用户提供便捷的检索功能;用户可以检索指定人物针对于某个或某些话题的所有观点表达;系统需要返回有序的搜索结果序列,用户更期望的搜索目标排在靠前的位置;
尽管许多的研究学者在人物观点挖掘方面做出了大量工作,提出了各种观点挖掘的方法,但这些方法都存在着一定的局限性;比如通常仅限于从评论性文本,如商品评论、微博等,中挖掘人物观点;不能进行情感强度分析等;
发明内容
本发明要解决的技术问题:克服现有技术的不足,提供一种新闻事件中人物观点抽取方法;该方法从新闻文本中抽取人物观点,并能够以较高的系统性能提供高可用度的观点检索服务;
本发明的技术解决方案:一种新闻事件中人物观点抽取方法,包括观点抽取、人物观点数据库、观点检索3个部分;
(一)观点抽取部分负责对原始的新闻文本进行清理,并提取其中的观点要素;
其中,所述的观点要素包括:
(1)观点持有者:发表观点的人物,通过人名消歧将其对应到人物数据库中的唯一人物;
(2)观点评价对象:在观点表达中,观点持有者所提及的带有情感色彩的事物;
(3)观点发布时间:观点持有者发表观点的时间;
(4)人物观点情感极性和强度:观点持有者对观点评价对象的情感态度(支持、中立、反对)和情感强度;
其中,提取观点要素包含以下步骤:
(1)文本清理:对原始新闻文本进行预处理,将文本标准化;
(2)基础语法分析:对新闻文本进行基础语法分析,包括分词、词性标注、依存关系分析;
(3)观点识别:识别新闻本文中哪些句子中包含了人物观点表达;
(4)观点要素抽取:从人物观点表达中提取观点要素;
(5)观点持有者消歧:对人物重名、人名描述不规范的观点持有者进行人名消歧;
(6)人物观点情感强度分析:计算观点持有者对于观点评价对象的情感极性和情感强度;
(二)人物观点数据库负责存储人物、观点以及情感,以便检索和查询;具体包括如下步骤:构建人物数据库;构建观点数据库;构建人物观点情感数据库;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心,未经国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810635449.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:层次化文本主题分割方法
- 下一篇:一种智能看护系统