[发明专利]一种疫情新闻信息提取方法及系统有效
申请号: | 202010824197.6 | 申请日: | 2020-08-17 |
公开(公告)号: | CN111966879B | 公开(公告)日: | 2023-08-08 |
发明(设计)人: | 陈佳珊;黄景浩;杨坦 | 申请(专利权)人: | 华南师范大学 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/9537;G06F16/958;G06F40/284;G06F40/289 |
代理公司: | 广东捷凯创新专利代理有限公司 44974 | 代理人: | 何金芳 |
地址: | 510000 *** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出一种疫情新闻信息提取方法,针对疫情新闻网页这一特定场景将其中的新闻文本中相关信息进行抽取,并转化为结构化数据,继而对数据进行存储与可视化展示;其特征在于,包括以下步骤:数据爬取步骤;数据处理步骤;路径信息提取步骤;居住地/常住地信息提取步骤;交通搭乘信息提取步骤;信息输出展示步骤;通过爬虫工具加载网页获取新闻文本,构建了句子拼接与文本分割算法,其中结合疫情文本特点,综合运用实体命名识别、地图API等工具,构建路径信息、居住地/常住地信息、交通搭乘信息三大提取模块,最后将系统部署为用户友好的网页,为用户自主提取信息提供便利。 | ||
搜索关键词: | 一种 疫情 新闻 信息 提取 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南师范大学,未经华南师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010824197.6/,转载请声明来源钻瓜专利网。
- 上一篇:基于实测数据的台区线损动态计算方法及装置
- 下一篇:一种薄膜卷取机
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置