[发明专利]用户问题获得方法、装置及电子设备有效
申请号: | 202110033442.6 | 申请日: | 2021-01-12 |
公开(公告)号: | CN112364149B | 公开(公告)日: | 2021-04-23 |
发明(设计)人: | 黄诗雅 | 申请(专利权)人: | 广州云趣信息科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/35;G06F40/211;G06F40/289;G06K9/62 |
代理公司: | 北京博雅睿泉专利代理事务所(特殊普通合伙) 11442 | 代理人: | 马铁良 |
地址: | 510665 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 问题 获得 方法 装置 电子设备 | ||
1.一种用户问题获得方法,其特征在于,包括:
获取原始文本对话数据;
从所述原始文本对话数据中,获取目标文本数据,其中,所述目标文本数据为与目标角色类别对应的文本数据;
根据所述目标文本数据,获得目标用户问题,其中,所述目标用户问题为目标用户在所述原始文本对话数据中提问的问题,所述目标用户的用户角色为所述目标角色类别;
其中,所述从所述原始文本对话数据中,获取目标文本数据,包括:对所述原始文本对话数据执行数据预处理,获得预处理文本数据;将所述预处理文本数据输入到目标角色分类模型中,获得所述目标文本数据,其中,所述目标角色分类模型用于预测语句属于目标角色类别的概率;
所述目标角色分类模型通过以下步骤训练获得:
获取训练数据集,其中,所述训练数据集包括多个样本文本数据,并且每一样本文本数据对应唯一的角色类别;
根据所述训练数据集,计算每一角色类别对应的先验概率作为第一概率;
在基于特征之间相互独立的设定下,统计所述训练数据集中的词汇在其他角色类别对应的样本文本数据中出现的概率作为第二概率,其中,所述其他角色类别为所述目标角色类别以外的角色类别;
根据所述第一概率和所述第二概率,获得所述目标角色分类模型。
2.根据权利要求1所述的方法,其特征在于,所述将所述预处理文本数据输入到目标角色分类模型中,获得所述目标文本数据,包括:
根据所述目标角色分类模型,预测所述预处理文本数据中语句分别对应的概率;
从所述预处理文本数据中提取对应概率不小于预设概率阈值的语句,以获得所述目标文本数据。
3.根据权利要求1所述的方法,其特征在于,所述根据所述目标文本数据,获得目标用户问题,包括:
使用预设文本摘要抽取算法从所述目标文本数据的语句中,获得第一待确定语句,其中,所述第一待确定语句为对应语句权重满足预设条件的语句;
获取预设关键词汇,其中,所述预设关键词汇用于确定语句是否为用户问题;
从所述第一待确定语句中,获取包含所述预设关键词汇中的任一词汇的语句作为第二待确定语句;
从所述第二待确定语句中,获取语句位置排序满足预设位置条件的语句作为所述目标用户问题,其中,所述语句位置为对应语句在所述目标文本数据中的位置。
4.根据权利要求3所述的方法,其特征在于,所述使用预设文本摘要抽取算法从所述目标文本数据的语句中,获得第一待确定语句,包括:
通过分别计算所述目标文本数据中任意两个语句之间的相似性,构建语句相似性矩阵;
根据所述语句相似性矩阵,构建语句权重图,其中,所述语句权重图中相邻两个语句间的边的权重为所述两个语句之间的相似度;
根据所述语句权重图,获得所述目标文本数据中语句的权重;
通过对所述目标文本数据中全部语句的权重进行排序,获得满足所述预设条件的语句作为所述第一待确定语句。
5.根据权利要求1所述的方法,其特征在于,所述第二概率通过以下步骤获得:
从所述训练数据集中的词汇中,获取任一词汇作为第一词汇;
在基于所述第一词汇至少在所述其他角色类别对应的样本文本数据中出现一次的设定下,使用预设特征值提取算法计算所述第一词汇在所述样本文本数据中的特征权值,并将所述特征权值作为所述第一词汇对应的第二子概率;
根据所述第二子概率,获得所述第二概率。
6.根据权利要求1所述的方法,其特征在于,所述对所述原始文本对话数据执行数据预处理,获得预处理文本数据,包括:
对所述原始文本对话数据中的语句执行分词处理和词汇词性标注处理,获得第一文本数据,其中,所述词汇词性标注处理为标注所述分词处理后得到的词汇的词性的处理;
使用预设数据清洗规则对所述第一文本数据执行数据清洗处理,获得第二文本数据,其中,所述预设数据清洗规则为过滤语句中的以下至少一项内容:预设停用词汇、预设词性、预设数值以及预设符号;
根据所述第二文本数据中语句的句末词汇的词性,对所述第二文本数据执行文本对齐处理,获得所述预处理文本数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州云趣信息科技有限公司,未经广州云趣信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110033442.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多轮次砾石充填工具
- 下一篇:一种低输出纹波功率因数校正变换器