[发明专利]一种问题提取方法及电子设备有效
申请号: | 201810319432.7 | 申请日: | 2018-04-11 |
公开(公告)号: | CN108509638B | 公开(公告)日: | 2023-06-27 |
发明(设计)人: | 缪庆亮;胡长建 | 申请(专利权)人: | 联想(北京)有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/30;G06F40/247 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 问题 提取 方法 电子设备 | ||
1.一种问题提取方法,其特征在于,包括:
提取用户输入的与客服对话中的不少于两个输入文本;
从所述用户输入的不少于两个输入文本中提取关键特征,确定所述关键特征的权重值,所述关键特征包括:语义特征及结构特征;所述结构特征包括:用户输入的输入文本在语义图中的重要度以及在多轮对话中出现的位置信息;
根据所述关键特征的权重值确定所述用户输入的不少于两个输入文本中每个输入文本的权重值;
根据所述用户输入的不少于两个输入文本中每个输入文本的权重值确定第一文本,将所述第一文本确定为真实问题文本;
所述从所述用户输入的不少于两个输入文本中提取关键特征,确定所述关键特征的权重值,包括:
从所述用户输入的不少于两个输入文本中提取关键特征,并确定所述关键特征的特征值;
从对话语料中确定与预设模式文本匹配的输入文本,确定为正样本,构建正样本集合,所述对话语料包括:所述用户输入的与客服对话中的不少于一个输入文本,以及与所述用户进行对话的客服输入的不少于一个输入文本;
从所述对话语料中确定与所述预设模式文本不匹配的输入文本,确定为负样本,构建负样本集合;
对所述正样本集合及所述负样本集合进行训练,确定所述关键特征的权重值。
2.根据权利要求1所述的方法,其特征在于,所述根据所述关键特征的权重值确定所述用户输入的不少于两个输入文本中每个输入文本的权重值,包括:
确定所述用户输入的不少于两个输入文本中每个输入文本所包括的关键特征;
将所述每个输入文本所包括的关键特征的权重值进行线性组合,确定所述每个输入文本的权重值。
3.根据权利要求1所述的方法,其特征在于,所述根据所述用户输入的不少于两个输入文本中每个输入文本的权重值确定第一文本,将所述第一文本确定为真实问题文本,包括:
从所述用户输入的不少于两个输入文本中确定第一文本,所述第一文本的权重值大于所述用户输入的不少于两个输入文本中除所述第一文本外的其他输入文本的权重值,将所述第一文本确定为真实问题文本。
4.根据权利要求1所述的方法,其特征在于,所述根据所述用户输入的不少于两个输入文本中每个输入文本的权重值确定第一文本,将所述第一文本确定为真实问题文本,包括:
从所述用户输入的不少于两个输入文本中确定所述用户输入的不少于两个输入文本中权重值大于第一阈值的第一文本,将所述第一文本确定为真实问题文本。
5.根据权利要求1所述的方法,其特征在于,所述根据所述用户输入的不少于两个输入文本中每个输入文本的权重值确定第一文本,将所述第一文本确定为真实问题文本,包括:
从所述用户输入的不少于两个输入文本中确定第一输入文本,所述第一输入文本的权重值大于所述用户输入的不少于两个输入文本中除所述第一输入文本外的其他输入文本的权重值;
确定所述第一输入文本的语义要素是否完备,所述语义要素包括:问题的意图,完成意图要进行的操作,操作的对象及条件或限制;
当所述第一输入文本的语义要素不完备时,从所述用户与客服的对话文本中确定所述第一输入文本缺少的语义要素;
将补全所述语义要素的第一输入文本确定为第一文本,将所述第一文本确定为真实问题文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810319432.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:数据表关联查询方法及装置
- 下一篇:表信息管理方法、装置及可读存储介质