[发明专利]问句语料生成方法、装置、设备及计算机可读存储介质在审
申请号: | 202010772241.3 | 申请日: | 2020-08-04 |
公开(公告)号: | CN111767387A | 公开(公告)日: | 2020-10-13 |
发明(设计)人: | 周磊;冯波 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/335;G06F16/36;G06F40/30 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 刘晖铭;张颖玲 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 问句 语料 生成 方法 装置 设备 计算机 可读 存储 介质 | ||
1.一种问句语料生成方法,其特征在于,包括:
获取关键词组;所述关键词组包括至少两个关键词;
获取所述关键词组对应的至少一个目标问句表达式;所述目标问句表达式用于根据至少一个连接符号连接所述至少两个关键词;
根据所述关键词组和所述至少一个目标问句表达式生成对应的至少一个问句语料。
2.根据权利要求1所述的方法,其特征在于,所述关键词的关键词类别包括以下至少之一:主语类别、关系类别和宾语类别。
3.根据权利要求2所述的方法,其特征在于,所述获取所述关键词组对应的至少一个目标问句表达式,包括:
获取所述关键词组的词组信息;所述词组信息包括以下至少之一:关键词信息和连接符号信息;
所述关键词信息包括所述关键词组中关键词类别数量和每一关键词类别对应的关键词数量;所述连接符号信息包括所述关键词组中至少一个关键词类别对应的连接符号类别;
根据所述词组信息在预设的问句表达式集中获取所述至少一个目标问句表达式;所述问句表达式集包括多个问句表达式。
4.根据权利要求3所述的方法,其特征在于,在所述词组信息包括关键词信息的情况下,所述获取所述关键词组的词组信息,包括:
获取所述关键词组中每一所述关键词的关键词类别;
根据每一所述关键词的关键词类别确定所述关键词类别数量和所述每一关键词类别对应的关键词数量。
5.根据权利要求4所述的方法,其特征在于,在所述词组信息包括连接符号信息的情况下,所述获取所述关键词组的词组信息,包括:
在所述主语类别对应的关键词数量为至少两个的情况下,根据主语类别对应的关键词的属性信息确定所述主语类别对应的连接符号类别;所述主语类别对应的连接符号类别包括以下至少之一:并列类别和修饰类别;
在所述关系类别对应的关键词数量为至少两个的情况下,根据关系类别对应的关键词的属性信息确定所述关系类别对应的连接符号类别;所述关系类别对应的连接符号类别包括以下至少之一:并列类别和修饰类别;
在所述宾语类别对应的关键词数量为至少一个的情况下,根据宾语类别对应的关键词的属性信息确定所述宾语类别对应的连接符号类别;所述宾语类别对应的连接符号类别包括以下至少之一:单元素类别、集合元素类别和域类别。
6.根据权利要求3至5任一项所述的方法,其特征在于,所述根据所述词组信息在预设的问句表达式集中获取所述至少一个目标问句表达式,包括:
在所述词组信息包括关键词信息的情况下,确定所述多个问句表达式中每一问句表达式对应的表达式信息;所述表达式信息包括问句表达式中关键词类别数量和每一关键词类别对应的关键词数量;
根据所述关键词组中关键词类别数量和每一关键词类别对应的关键词数量在每一所述问句表达式对应的表达式信息中进行匹配,以获取所述至少一个目标问句表达式。
7.根据权利要求3至5任一项所述的方法,其特征在于,所述根据所述词组信息在预设的问句表达式集中获取所述至少一个目标问句表达式,包括:
在所述词组信息包括关键词信息和连接符号信息的情况下,确定所述多个问句表达式中每一问句表达式对应的表达式信息;所述表达式信息包括问句表达式中关键词类别数量、每一关键词类别对应的关键词数量和至少一个关键词类别对应的连接符号类别;
根据所述关键词组中关键词类别数量、每一关键词类别对应的关键词数量和至少一个关键词类别对应的连接符号类别在每一所述问句表达式对应的表达式信息中进行匹配,以获取所述至少一个目标问句表达式。
8.一种问句语料生成装置,其特征在于,包括:
第一获取模块,用于接获取关键词组,所述关键词组包括至少两个关键词;
第二获取模块,用于获取所述关键词组对应的至少一个目标问句表达式;所述目标问句表达式用于根据至少一个连接符号连接所述至少两个关键词;
生成模块,用于根据所述关键词组和所述至少一个目标问句表达式生成对应的至少一个问句语料。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010772241.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种冷套膜机
- 下一篇:一种分区采样的氨逃逸测量系统及方法