[发明专利]一种提升人机交互对话语料质量与多样性的对话语料库生成方法有效
申请号: | 201911271656.6 | 申请日: | 2019-12-12 |
公开(公告)号: | CN111026884B | 公开(公告)日: | 2023-06-02 |
发明(设计)人: | 张献涛;张猛;暴筱;林小俊 | 申请(专利权)人: | 上海益商网络科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F18/22;G06F18/214 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 司立彬 |
地址: | 200441 上海市宝山*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种提升人机交互对话语料质量与多样性的对话语料库生成方法。本方法为:1)对所选对话语料进行同义句扩展,形成一候选集合;2)对该候选集合中的每一对话语料进行异常检测,得到各对话语料的异常值;3)将异常值低于设定打分阈值的对话语料保存到提升后的对话语料库中;4)对异常值高于或等于该打分阈值的对话语料进行语义分析:如果是错误的对话数据,则直接丢弃;如果是多样性的对话数据,则执行步骤5);否则将当前对话语料保存到提升后的对话语料库中;5)将判定为多样性的对话数据重新作为输入,执行步骤1~4)直到达到暂停条件,停止迭代。本发明实现了对原始对话语料进行质量的控制和多样性的扩充。 | ||
搜索关键词: | 一种 提升 人机交互 对话 语料 质量 多样性 语料库 生成 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海益商网络科技有限公司,未经上海益商网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911271656.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种车用尿素溶液用搅拌装置
- 下一篇:一种脱脂率高的松木脱脂方法