[发明专利]问句语料生成方法、装置、设备及计算机可读存储介质在审
申请号: | 202010772241.3 | 申请日: | 2020-08-04 |
公开(公告)号: | CN111767387A | 公开(公告)日: | 2020-10-13 |
发明(设计)人: | 周磊;冯波 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/335;G06F16/36;G06F40/30 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 刘晖铭;张颖玲 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 问句 语料 生成 方法 装置 设备 计算机 可读 存储 介质 | ||
本申请提供了一种问句语料生成方法、装置、设备及计算机可读存储介质;方法包括:获取关键词组;关键词组包括至少两个关键词;获取关键词组对应的至少一个目标问句表达式;目标问句表达式用于根据至少一个连接符号连接至少两个关键词;根据关键词组和至少一个目标问句表达式生成对应的至少一个问句语料。通过本申请,能够提升问句语料生成效率,扩大问句语料的问法覆盖范围。
技术领域
本申请涉及数据处理技术,尤其涉及一种问句语料生成方法、装置、设备及计算机可读存储介质。
背景技术
人工智能(AI,Artificial Intelligence)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。其中,智能问答系统是人工智能的一个重要分支,为了建立一个理想的智能问答系统,需要大量的问句语料作为测试集对其进行测试。
在建立测试集时需要人工编写问句语料,不仅费时费力,编写效率低,由于人工编写严重依赖于个人的先验知识,往往会陷入一个自身的知识体系里,无法编写出一个问法全,覆盖广的问句语料。
发明内容
本申请实施例提供一种问句语料生成方法、装置、设备及计算机可读存储介质,能够提升了问句语料的生成效率,扩大问句语料的问法覆盖范围。
本申请实施例的技术方案是这样实现的:
本申请实施例提供一种问句语料生成方法,包括:
获取关键词组,关键词组包括至少两个关键词;
获取关键词组对应的至少一个目标问句表达式;目标问句表达式用于根据至少一个连接符号连接至少两个关键词;
根据关键词组和至少一个目标问句表达式生成对应的至少一个问句语料。
在一些实施例中,所述关键词的关键词类别包括以下至少之一:主语类别、关系类别和宾语类别。
在一些实施例中,所述获取关键词组对应的至少一个目标问句表达式,包括:获取关键词组的词组信息;词组信息包括以下至少之一:关键词信息和连接符号信息;关键词信息包括关键词组中关键词类别数量和每一关键词类别对应的关键词数量;连接符号信息包括关键词组中至少一个关键词类别对应的连接符号类别;根据词组信息在预设的问句表达式集中获取至少一个目标问句表达式;问句表达式集包括多个问句表达式。
在一些实施例中,所述在词组信息包括关键词信息的情况下,获取关键词组的词组信息,包括:获取关键词组中每一关键词的关键词类别;根据每一关键词的关键词类别确定关键词类别数量和每一关键词类别对应的关键词数量。
在一些实施例中,所述在词组信息包括连接符号信息的情况下,获取关键词组的词组信息,包括:在主语类别对应的关键词数量为至少两个的情况下,根据主语类别对应的关键词的属性信息确定主语类别对应的连接符号类别;主语类别对应的连接符号类别包括以下至少之一:并列类别和修饰类别;在关系类别对应的关键词数量为至少两个的情况下,根据关系类别对应的关键词的属性信息确定关系类别对应的连接符号类别;关系类别对应的连接符号类别包括以下至少之一:并列类别和修饰类别;在宾语类别对应的关键词数量为至少一个的情况下,根据宾语类别对应的关键词的属性信息确定宾语类别对应的连接符号类别;宾语类别对应的连接符号类别包括以下至少之一:单元素类别、集合元素类别和域类别。
在一些实施例中,所述根据词组信息在预设的问句表达式集中获取至少一个目标问句表达式,包括:在词组信息包括关键词信息的情况下,确定多个问句表达式中每一问句表达式对应的表达式信息;表达式信息包括问句表达式中关键词类别数量和每一关键词类别对应的关键词数量;根据关键词组中关键词类别数量和每一关键词类别对应的关键词数量在每一问句表达式对应的表达式信息中进行匹配,以获取至少一个目标问句表达式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010772241.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种冷套膜机
- 下一篇:一种分区采样的氨逃逸测量系统及方法