[发明专利]文本数据处理方法、装置、电子设备和存储介质在审
申请号: | 202011631883.8 | 申请日: | 2020-12-31 |
公开(公告)号: | CN112765330A | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | 谢韬;秦昌博;高倩;邵长东 | 申请(专利权)人: | 科沃斯商用机器人有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36;G06F40/295 |
代理公司: | 北京太合九思知识产权代理有限公司 11610 | 代理人: | 刘戈;孙明子 |
地址: | 215104 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 数据处理 方法 装置 电子设备 存储 介质 | ||
本发明实施例提供一种文本数据处理方法、装置、电子设备和存储介质,该方法包括:获取待处理语句以及该语句中包含的第一命名实体,再根据预设的语句模板生成包含第一命名实体的模板语句,并由待处理语句和模板语句构成一个语句对。再根据此语句对生成包含第一命名实体的三元组关系。上述方法是一种基于开放域的三元组关系生成方法,其能够同时得到待处理语句中第一命名实体对应的显性三元组关系和隐含三元组关系。同时,构造的语句对中都包含第一命名实体,这样能够对三元组关系的生成起到限定作用,即生成单一命名实体的三元组关系,并且生成的三元组关系的数量有限,保证生成三元组关系的准确性。
技术领域
本发明涉及自然语言处理领域,尤其涉及一种文本数据处理方法、装置、电子设备和存储介质。
背景技术
自然语言处理(Natural Language Processing,简称,NLP)是人工智能领域中的一个研究热点,也是实现人机交互的核心。
在人机交互过程中,智能设备需要先对用户输入的语句进行理解,再基于对语句的理解产生应答,从而实现人机交互,并且智能设备对于语句的理解可以借助知识图谱实现。因此,知识图谱的建立的准确性会直接影响到人机交互的效果。其中,知识图谱可以通过对文本数据进行知识抽取后建立,并且知识抽取可以在限定域或者开放域内进行。
发明内容
本发明实施例提供一种文本数据处理方法、装置、电子设备和存储介质,用以保证三元组关系生成的准确性。
本发明实施例提供一种文本数据处理方法,包括:
获取待处理语句中包含的第一命名实体;
由所述待处理语句和包含所述第一命名实体的模板语句,构成所述第一命名实体对应的语句对;
根据所述语句对,生成包含所述第一命名实体的三元组关系。
本发明实施例提供一种文本数据处理装置,包括:
获取模块,用于获取待处理语句中包含的第一命名实体;
构建模块,用用由所述待处理语句和包含所述第一命名实体的模板语句,构成所述第一命名实体对应的语句对;
生成模块,用于根据所述语句对,生成包含所述第一命名实体的三元组关系。
本发明实施例提供一种电子设备,包括:处理器和存储器;其中,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现:
获取待处理语句中包含的第一命名实体;
由所述待处理语句和包含所述第一命名实体的模板语句,构成所述第一命名实体对应的语句对;
根据所述语句对,生成包含所述第一命名实体的三元组关系。
本发明实施例提供了一种存储计算机指令的计算机可读存储介质,当所述计算机指令被一个或多个处理器执行时,致使所述一个或多个处理器至少执行以下的动作:
获取待处理语句中包含的第一命名实体;
由所述待处理语句和包含所述第一命名实体的模板语句,构成所述第一命名实体对应的语句对;
根据所述语句对,生成包含所述第一命名实体的三元组关系。
本发明实施例提供另一种文本数据处理方法,包括:
获取样本语句中包含的样本命名实体;
由所述样本语句和包含所述样本命名实体的模板语句,构成所述命名实体对应的样本语句对;
将所述样本语句对输入生成模型,以由所述生成模型输出所述样本命名实体对应属性关系序列以及所述属性关系序列对应的预测概率矩阵;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科沃斯商用机器人有限公司,未经科沃斯商用机器人有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011631883.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种有效解决晶圆干燥颗粒数干燥后二次污染的结构
- 下一篇:一种玻璃纤维