[发明专利]闲聊识别方法、装置、电子设备及存储介质有效

申请号：	202110688766.3	申请日：	2021-06-22
公开（公告）号：	CN113254595B	公开（公告）日：	2021-10-22
发明（设计）人：	吕向楠	申请（专利权）人：	北京沃丰时代数据科技有限公司
主分类号：	G06F16/33	分类号：	G06F16/33;G06F16/332;G06F16/35;G06F40/284;G06F40/289;G06K9/62;G06N3/04;G06N3/08
代理公司：	北京路浩知识产权代理有限公司 11002	代理人：	郭亮
地址：	100160 北京市丰台区***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	闲聊识别方法装置电子设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供一种闲聊识别方法、装置、电子设备及存储介质。所述方法包括：基于客服领域关键词信息，对待识别文本进行预识别；在所述待识别文本的预识别结果为闲聊文本时，基于文本特征提取模型，对所述待识别文本进行特征提取，得到所述待识别文本的字向量和词向量；将所述字向量和所述词向量输入训练好的分类模型，得到最终的闲聊识别结果，其中，所述训练好的分类模型是基于携带有闲聊类别标识的样本字向量和携带有闲聊类别标识的样本词向量训练得到的，本发明的识别速度快，占用资源少，而且准确率较高。

技术领域

本发明涉及数据处理技术领域，具体涉及一种闲聊识别方法、装置、电子设备及存储介质。

背景技术

目前，人机对话，是人工智能领域的子方向，通俗的讲就是让人可以通过人类的语言即自然语言与计算机进行交互，随着技术的不断发展，越来越多的商家开始使用智能客服，来缓解客户服务的压力。

但是在实际的交互过程中，可能会收到很多来自用户的闲聊语句，而闲聊问答具有非常强的发散性与无目的性，难以构建有效且全面的知识库。且闲聊与业务场景无关，无需人工构建知识库，因此这些闲聊语句会影响最终智能客服的回复准确率，而识别出闲聊文本并剔除，就能很好的解决的这个问题。

因此如何从用户的文本中识别出闲聊文本，已经成为业界亟待解决的问题。

发明内容

本发明提供一种闲聊识别方法、装置、电子设备及存储介质，用以解决识别出闲聊文本的技术问题。

第一方面，本发明提供一种闲聊识别方法，包括：

基于客服领域关键词信息，对待识别文本进行预识别；

在所述待识别文本的预识别结果为闲聊文本时，基于文本特征提取模型，对所述待识别文本进行特征提取，得到所述待识别文本的字向量和词向量；

将所述字向量和所述词向量输入训练好的分类模型，得到最终的闲聊识别结果，其中，所述训练好的分类模型是基于携带有闲聊类别标识的样本字向量和携带有闲聊类别标识的样本词向量训练得到的。