[发明专利]用于在对话中提供答复语句的方法及装置有效
申请号: | 202010092082.2 | 申请日: | 2020-02-14 |
公开(公告)号: | CN111259130B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 王子豪;崔恒斌 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/211;G06F40/289;G06N20/00 |
代理公司: | 北京永新同创知识产权代理有限公司 11376 | 代理人: | 林锦辉;刘景峰 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 对话 提供 答复 语句 方法 装置 | ||
1.一种用于在对话中提供答复语句的方法,包括:
获取用户的当前对话语句以及上下文对话语句,以作为查询语句;
从对话日志中搜索与所述查询语句匹配的至少一条对话记录,以作为回答语料,每条对话记录包括该次对话的完整对话内容;
对所述查询语句和所述回答语料分别进行向量化处理,以得到查询语句向量矩阵和回答语料向量矩阵,其中,所述查询语句向量矩阵和所述回答语料向量矩阵中的各个词语所对应的向量至少包括该词语的词向量和上下文向量;
将所述查询语句向量矩阵和所述回答语料向量矩阵提供给机器阅读理解模型,以从所述回答语料中确定所述当前对话语句的答复语句的起始词语位置和结束词语位置;
基于所确定的起始词语位置和结束词语位置,从所述回答语料中获取所述答复语句;以及
将所获取的答复语句提供给所述用户。
2.如权利要求1所述的方法,其中,所述上下文对话语句包括设定轮对话所涉及的上下文语句。
3.如权利要求1所述的方法,其中,所述当前对话语句以及所述上下文对话语句是经过无用信息去除后的对话语句,和/或
所述回答语料是经过无用信息去除后的回答语料。
4.如权利要求1到3中任一所述的方法,其中,获取用户的当前对话语句以及上下文对话语句,以作为查询语句包括:
获取用户的当前对话语句以及上下文对话语句;以及
基于对话语句的时间发生顺序,对所获取的当前对话语句以及上下文对话语句进行拼接,以生成所述查询语句。
5.如权利要求1所述的方法,其中,各个词语所对应的向量包括经过拼接后的该词语的词向量和上下文向量。
6.如权利要求1所述的方法,其中,所述回答语料包括经过拼接的至少一条对话记录。
7.如权利要求1所述的方法,其中,所述查询语句向量矩阵和所述回答语料向量矩阵中的每个词语的词向量是通过查询词向量表而获得的。
8.如权利要求7所述的方法,其中,所述词向量表是使用下述向量化模型中的一种向量化模型得到的:
Word2vec模型;
cw2vec模型;
GloVe模型;以及
Fasttext模型。
9.如权利要求1所述的方法,其中,所述查询语句和所述回答语料中的每个词语的上下文向量是使用下述向量化模型中的一种向量化模型得到的:
BERT模型;
ELMo模型;以及
OpenAI GPT模型。
10.如权利要求1所述的方法,其中,基于所确定的起始词语位置和结束词语位置,从所述回答语料中获取所述答复语句包括:
在所确定的起始词语位置和/或结束词语位置包括多个位置时,基于起始词语位置与结束词语位置的任意组合,从所述回答语料中获取答复语句。
11.如权利要求10所述的方法,其中,基于起始词语位置与结束词语位置的任意组合,从所述回答语料中获取答复语句之后,还包括:
利用评分系统对所获取的各个答复语句进行评分;
将评分最高的答复语句确定为提供给所述用户的答复语句。
12.如权利要求1所述的方法,其中,每个词语还具有注意力向量,所述方法还包括:
使用注意力模型,对所述查询语句和所述回答语料进行向量化处理,以得到所述查询语句和所述回答语料中的各个词语的注意力向量,
其中,所述查询语句向量矩阵和所述回答语料向量矩阵中的各个词语所对应的向量包括该词语的词向量、上下文向量和注意力向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010092082.2/1.html,转载请声明来源钻瓜专利网。