[发明专利]文本结构化方法、装置、系统和非易失性存储介质有效
申请号: | 202010477190.1 | 申请日: | 2017-09-19 |
公开(公告)号: | CN111680090B | 公开(公告)日: | 2023-03-21 |
发明(设计)人: | 梁会营;郑永升;戎术 | 申请(专利权)人: | 广州市妇女儿童医疗中心;杭州依图医疗技术有限公司 |
主分类号: | G06F16/25 | 分类号: | G06F16/25;G06F40/103 |
代理公司: | 上海华诚知识产权代理有限公司 31300 | 代理人: | 徐颖聪 |
地址: | 510623 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种文本结构化方法、装置、系统和非易失性存储介质,该方法包括:获取非结构化文本,对非结构化文本进行预处理,并将预处理后的非结构化文本分解成多个分句;获取结构化文本中的结构化条目与对应结构化条目的问答数据库;根据问答数据库中的问题提问,将分句的内容分别匹配至对应的结构化条目,以得到分句结构化结果;根据分句结构化结果,得到结构化文本。本发明提供的文本结构化方法、装置、系统和非易失性存储介质,结合问答数据库,能将非结构化的文本信息完全转化为结构化信息,转化效果好,准确率高,并通过两个LSTM网络进行分句结构化处理,能处理自由文本中多样的表达方式,具有良好的健壮性。 | ||
搜索关键词: | 文本 结构 方法 装置 系统 非易失性 存储 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州市妇女儿童医疗中心;杭州依图医疗技术有限公司,未经广州市妇女儿童医疗中心;杭州依图医疗技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010477190.1/,转载请声明来源钻瓜专利网。