[发明专利]非结构文本处理方法、装置、计算机设备、存储介质在审
申请号: | 201911065653.7 | 申请日: | 2019-11-04 |
公开(公告)号: | CN111046135A | 公开(公告)日: | 2020-04-21 |
发明(设计)人: | 王海波;李志保 | 申请(专利权)人: | 智器云南京信息科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332;G06F16/36 |
代理公司: | 上海硕力知识产权代理事务所(普通合伙) 31251 | 代理人: | 杨用玲 |
地址: | 210022 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种非结构文本数据处理方法,包括:对待处理的文本文件进行格式和编码转换,所述待处理的文本文件中包含非结构文本数据;对进行了格式和编码转换后的文件的文本内容进行预处理,所述预处理包括分词、词性标注、停用词去除、和/或多义词消歧义;通过知识抽取器对预处理后的文本内容进行相应的知识抽取;对知识抽取获得的知识进行结构化转换,并生成可图谱化展示的结构化的数据结构,所述数据结构以预定义的序列化格式表征,所述序列化格式包含包含结构化后的知识对应的文件编号。本发明实施例可以实现对非结构化文本中提取知识并图谱化展现,从而实现提取文件中的关键情报要素、快速处理非结构化文本文件。 | ||
搜索关键词: | 结构 文本 处理 方法 装置 计算机 设备 存储 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于智器云南京信息科技有限公司,未经智器云南京信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911065653.7/,转载请声明来源钻瓜专利网。