[发明专利]一种基于句法结构和重排序的对话生成方法有效
申请号: | 201910791111.1 | 申请日: | 2019-08-26 |
公开(公告)号: | CN110489529B | 公开(公告)日: | 2021-12-14 |
发明(设计)人: | 张海军;崔啸霆 | 申请(专利权)人: | 哈尔滨工业大学(深圳) |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332;G06F40/211;G06F40/289;G06N3/08;G06N20/00 |
代理公司: | 深圳市迪斯卓越专利代理事务所(普通合伙) 44443 | 代理人: | 闵华明;李小艳 |
地址: | 518055 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于句法结构和重排序的对话生成方法,包括:A、词性序列生成:通过使用词性标注工具将中文对话语料转化成词性序列,然后使用编码器‑解码器架构训练出词性序列生成模型,输入一段词性序列,生成出符合规则的新的词性序列;B、词性转移矩阵生成:通过词性序列生成模型,利用BeamSearch方法得到生成序列集合,然后对集合内序列进行统计,得到当前词性序列生成的相应词性转移矩阵;C、训练过程中的目标函数改进:根据词性转移矩阵,对原始对话生成过程中的目标函数进行改进以提高生成质量;D、重排序步骤:对训练得到的对话生成模型,在预测过程中计算所有生成候选序列的句法结构混乱度,根据得分进行重排序,返回重排序后的序列作为生成结果。 | ||
搜索关键词: | 一种 基于 句法 结构 排序 对话 生成 方法 | ||
【主权项】:
1.一种基于句法结构和重排序的对话生成方法,包括以下步骤:/nA、词性序列生成:通过使用词性标注工具将中文对话语料转化成词性序列,然后使用编码器-解码器架构训练出词性序列生成模型,输入一段词性序列,生成出符合规则的新的词性序列;/nB、词性转移矩阵生成:通过词性序列生成模型,利用BeamSearch方法得到生成序列集合,然后对集合内序列进行统计,得到当前词性序列相应的词性转移矩阵;/nC、SequenceToSequence对话生成模型的loss函数改进:根据词性转移矩阵,对原始对话生成过程中的SequenceToSequence模型loss函数进行改进,以达到提高生成质量的效果;/nD、重排序步骤:对训练得到的SequenceToSequence对话生成模型,在预测过程中计算所有生成候选序列的句法结构混乱度,根据得分进行重排序,返回重排序后的序列作为生成结果。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学(深圳),未经哈尔滨工业大学(深圳)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910791111.1/,转载请声明来源钻瓜专利网。