[发明专利]一种面向中文网络论坛文本的事件地点归属省份识别方法在审
申请号: | 201911101388.3 | 申请日: | 2019-11-12 |
公开(公告)号: | CN111090994A | 公开(公告)日: | 2020-05-01 |
发明(设计)人: | 陈进东;刘琳琳;杜雨璇;张健;齐林 | 申请(专利权)人: | 北京信息科技大学 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F40/247;G06F16/332;G06F16/35;G06F16/36 |
代理公司: | 北京卫平智业专利代理事务所(普通合伙) 11392 | 代理人: | 张新利;谢建玲 |
地址: | 100089 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种面向中文网络论坛文本的事件地点归属省份识别方法,步骤一、文本分词:1、构建地名归属省份查询词典;2、基于jieba工具的中文分词;步骤二、事件地点识别:1、特征值的提取与构建;2、文本事件地点识别;3、多个事件地点去重;步骤三、归属省份确定:针对识别的论坛中帖子文本的事件地点,直接利用地名归属省份查询词典,查询确定论坛中帖子文本的事件地点归属省份。本发明在应对复杂文本分词,尤其是在事件地点识别的基础上对多个事件地点去重以及事件地点归属省份识别等方面给出了明确的思路。本发明实现简单,易于泛化,相较传统的地名识别在精细度和准确度上有了显著提高。 | ||
搜索关键词: | 一种 面向 中文 网络 论坛 文本 事件 地点 归属 省份 识别 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京信息科技大学,未经北京信息科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911101388.3/,转载请声明来源钻瓜专利网。