[发明专利]基于多主题语义标签信息映射的结构化处理方法及装置在审
申请号: | 201710464294.7 | 申请日: | 2017-06-19 |
公开(公告)号: | CN107315798A | 公开(公告)日: | 2017-11-03 |
发明(设计)人: | 曹晓;张青;程剑华;蒋宏飞;晋耀红;杨凯程 | 申请(专利权)人: | 北京神州泰岳软件股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京弘权知识产权代理事务所(普通合伙)11363 | 代理人: | 逯长明,许伟群 |
地址: | 100089 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请提供一种基于多主题语义标签信息映射的结构化处理方法及装置,所述方法通过在非结构化文本中提取关键词,将关键词与预置语料进行匹配,确定至少一个包括标签内容、标签值以及标签描述的语义标签信息,再通过判断语义标签信息的类型,根据预设规则建立名称标签与状态标签间的映射关系,生成结构化文本。本申请实施例提供的所述方法,能够将非结构化文本转化成可识别的语义标签信息,并确定名称标签标签值和状态标签标签内容下标签值之间的映射关系,以解决传统方法不能正确确定映射关系的问题。 | ||
搜索关键词: | 基于 主题 语义 标签 信息 映射 结构 处理 方法 装置 | ||
【主权项】:
一种基于多主题语义标签信息映射的结构化处理方法,其特征在于,包括:获取非结构化文本;从所述非结构化文本中提取关键词;将所述关键词与预置语料进行匹配,确定至少一个语义标签信息,所述语义标签信息包括:与所述预置语料对应的标签内容、标签值以及标签描述;将所述语义标签信息进行分类,所述语义标签信息的类别包括:名称标签和状态标签;根据预设规则,建立名称标签与状态标签间的映射关系,生成结构化文本。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京神州泰岳软件股份有限公司,未经北京神州泰岳软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710464294.7/,转载请声明来源钻瓜专利网。