[发明专利]用户意图识别方法及系统在审
申请号: | 201711364768.7 | 申请日: | 2017-12-18 |
公开(公告)号: | CN109933779A | 公开(公告)日: | 2019-06-25 |
发明(设计)人: | 史少峥;王峰;周亮 | 申请(专利权)人: | 苏宁云商集团股份有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京市万慧达律师事务所 11111 | 代理人: | 黄玉东 |
地址: | 210042 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 向量 用户意图 词向量 知识库 替换 分类模型 向量化 分类模型训练 数据分析技术 输入意图 用户提问 词转换 相似词 构建 客服 语料 | ||
本发明公开一种用户意图识别方法及系统,涉及数据分析技术领域,能够将用户提问的0项词转换为词向量数据中现有的相似词进行表达,进而提高用户意图识别的准确性。该方法包括整理客服问答语料得到知识库,知识库包括多个问句和与问句对应的意图类别;分别对每个问句进行向量化计算,得到每个问句的向量;对每个问句的向量及对应的意图类别进行分类模型训练,获取意图分类模型;从知识库中获取关键词,对关键词进行训练构建词向量模型;对当前问句进行向量化计算得到当前问句向量,利用词向量模型将当前问句向量中的0项词替换成与词向量模型中最相似的词;计算替换后的问句向量,将替换后的问句向量输入意图分类模型,得到当前问句的用户意图。
技术领域
本发明涉及数据分析技术领域,尤其涉及一种用户意图识别方法及系统。
背景技术
随着通讯技术的发展和电子商务的普及,越来越多的人们开始习惯在网上购物。在电子商务环境上,商家在线上提供的商品种类和数量越来越多,在给予用户丰富的选择同时,也增加了用户在众多商品中准确搜寻到感兴趣的产品的困难度。因此,迫切需要一种智能导购来主动地帮助用户选购商品,并能根据用户的兴趣和爱好,个性化地给每个用户推荐他可能感兴趣且满意的产品,使用户能够方便、快捷的购买到自己心仪的商品,提高用户线上购物的体验。
智能导购的技术基础就是人机交互技术,而人机交互的关键在于用户的意图识别。现有的用户意图识别多采用多分类模型来实现,通过大量的标注了意图的用户问句来训练模型,然后利用训练模型识别用户问句以理解用户意图,由于用户的问句多种多样,因此只有训练模型中的词向量数据足够大,才能保证对用户问句意图理解的准确性,即训练模型中的词向量数据与理解用户问句意图的准确性存在正比例关系。
但是,由于人工标注的用户问句数据量有限,因此通过这些问句训练得到的训练模型,其中的词向量数据不能够完全涵盖所有用户问句,这样就会导致即使用户问句中出现了与词向量数据中意思相似的词,但因两词语不同而造成的将用户的意图识别错的情况发生,从而降低了用户意图识别的准确性。
发明内容
本发明的目的在于提供一种用户意图识别方法及系统,能够将用户提问的新词转换为词向量数据中现有的相似词进行表达,进而提高用户意图识别的准确性。
为了实现上述目的,本发明的第一方面提供一种用户意图识别方法,包括:
整理客服问答语料得到知识库,所述知识库包括多个问句和与问句对应的意图类别;
分别对每个问句进行向量化计算,得到每个问句的向量;
对每个问句的向量及对应的意图类别进行分类模型训练,获取意图分类模型;
从所述知识库中获取关键词,对所述关键词进行训练构建词向量模型;
对当前问句进行向量化计算得到当前问句向量,利用所述词向量模型将当前问句向量中的0项词替换成与所述词向量模型中最相似的词;
计算替换后的问句向量,将所述替换后的问句向量输入所述意图分类模型,得到当前问句的用户意图。
优选地,所述整理客服问答语料得到知识库的方法包括:
从所述客服问答语料中提取用户对商品信息的各种问法,整理后得到多个问句;
对各问句一一进行标注,得到与所述问句对应的意图类别。
优选地,所述分别对每个问句进行向量化计算,得到每个问句的向量的方法包括:
对问句进行预处理和文本处理以提取问句中的多个关键词;
计算各关键词的TF-IDF值,生成问句向量;
依次重复上述步骤对其他问句进行计算,得到每个问句的向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏宁云商集团股份有限公司,未经苏宁云商集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711364768.7/2.html,转载请声明来源钻瓜专利网。