[发明专利]用户问题获得方法、装置及电子设备有效
申请号: | 202110033442.6 | 申请日: | 2021-01-12 |
公开(公告)号: | CN112364149B | 公开(公告)日: | 2021-04-23 |
发明(设计)人: | 黄诗雅 | 申请(专利权)人: | 广州云趣信息科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/35;G06F40/211;G06F40/289;G06K9/62 |
代理公司: | 北京博雅睿泉专利代理事务所(特殊普通合伙) 11442 | 代理人: | 马铁良 |
地址: | 510665 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 问题 获得 方法 装置 电子设备 | ||
本申请公开了一种用户问题获得方法、装置及电子设备,该方法包括:获取原始文本对话数据;从所述原始文本对话数据中,获取目标文本数据,其中,所述目标文本数据为与目标角色类别对应的文本数据;根据所述目标文本数据,获得目标用户问题,其中,所述目标用户问题为目标用户在所述原始文本对话数据中提问的问题,所述目标用户的用户角色为所述目标角色类别。该方法可以方便、准确的获得原始文本对话数据中目标用户提问的问题。
技术领域
本公开涉及自然语言处理技术领域,更具体地,涉及一种用户问题获得方法、装置及电子设备。
背景技术
在日常生活中,用户一般可以通过语音通话方式向企业客服咨询产品售前、售后等问题;而语音通话过程中,通常需要企业客服快速、准确的回答用户问题。
在实际中,为了使得企业客服可以快速、准确的回答用户问题,通常是在获得用户授权使用其通话语音的情况下,由人工针对用户历史通话语音进行复听、手动标注和整理,以提取出用户经常提问的问题,并通过构建用户问题库和基于该用户问题库对企业客服进行培训的方式,使得企业客服可以可快速、准确的回答用户问题。
在实现本申请的过程中,发明人方发现现有的提取用户问题的方法一方面是主要依赖于人工,存在费时费力的问题;另一方面,由于人工标注可能出错,所以还可能导致提取结果不够准确的问题,因此,有必要提供一种用户问题获得方法,以解决上述问题。
发明内容
本公开的第一方面,提供了一种用户问题获得方法,包括:
获取原始文本对话数据;
从所述原始文本对话数据中,获取目标文本数据,其中,所述目标文本数据为与目标角色类别对应的文本数据;
根据所述目标文本数据,获得目标用户问题,其中,所述目标用户问题为目标用户在所述原始文本对话数据中提问的问题,所述目标用户的用户角色为所述目标角色类别。
可选地,所述从所述原始文本对话数据中,获取目标文本数据,包括:
对所述原始文本对话数据执行数据预处理,获得预处理文本数据;
将所述预处理文本数据输入到目标角色分类模型中,获得所述目标文本数据,其中,所述目标角色分类模型用于预测语句属于目标角色类别的概率。
可选地,所述将所述预处理文本数据输入到目标角色分类模型中,获得所述目标文本数据,包括:
根据所述目标角色分类模型,预测所述预处理文本数据中语句分别对应的概率;
从所述预处理文本数据中提取对应概率不小于预设概率阈值的语句,以获得所述目标文本数据。
可选地,所述根据所述目标文本数据,获得目标用户问题,包括:
使用预设文本摘要抽取算法从所述目标文本数据的语句中,获得第一待确定语句,其中,所述第一待确定语句为对应语句权重满足预设条件的语句;
获取预设关键词汇,其中,所述预设关键词汇用于确定语句是否为用户问题;
从所述第一待确定语句中,获取包含所述预设关键词汇中的任一词汇的语句作为第二待确定语句;
从所述第二待确定语句中,获取语句位置排序满足预设位置条件的语句作为所述目标用户问题,其中,所述语句位置为对应语句在所述目标文本数据中的位置。
可选地,所述使用预设文本摘要抽取算法从所述目标文本数据的语句中,获得第一待确定语句,包括:
通过分别计算所述目标文本数据中任意两个语句之间的相似性,构建语句相似性度矩阵;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州云趣信息科技有限公司,未经广州云趣信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110033442.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多轮次砾石充填工具
- 下一篇:一种低输出纹波功率因数校正变换器