[发明专利]数据处理方法及装置、存储介质、电子设备在审
申请号: | 202110906879.6 | 申请日: | 2021-08-09 |
公开(公告)号: | CN113627161A | 公开(公告)日: | 2021-11-09 |
发明(设计)人: | 王炜;姚澜;孙翠荣;解忠乾;罗川江 | 申请(专利权)人: | 杭州网易云音乐科技有限公司 |
主分类号: | G06F40/253 | 分类号: | G06F40/253;G06F40/284;G06F40/289;G06K9/62;G06N3/04;G06F16/953 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 王辉;阚梓瑄 |
地址: | 310052 浙江省杭州市萧山区钱江世*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 存储 介质 电子设备 | ||
本公开的实施方式涉及计算机技术领域,更具体地,本公开的实施方式涉及数据处理方法及装置,存储介质和电子设备。所述方法包括:获取搜索文本;基于所述搜索文本确定对应的第一意图评分结果;其中,所述第一意图评分结果以离线方式获取;以及根据所述搜索文本对应的语法向量的编码特征和词向量的编码特征进行聚合处理,以根据聚合处理结果确定第二意图评分结果;结合所述第一意图评分结果和所述第二意图评分结果确定所述搜索文本的泛搜意图识别结果。本公开的方案在保证意图识别结果准确性的前提下,可以进一步的保证意图识别的效率,提升针对搜索文本的意图识别的速度。
技术领域
本公开的实施方式涉及计算机技术领域,更具体地,本公开的实施方式涉及数据处理方法及装置,存储介质和电子设备。
背景技术
本部分旨在为权利要求中陈述的本公开的实施方式提供背景或上下文,此处的描述不因为包括在本部分中就承认是现有技术。
在目前的技术中,用户可以通过在搜索引擎中输入搜索请求来得到期望得到的数据内容。在音乐搜索场景中,用户可以在搜索框中输入搜索请求,例如文字内容;音乐搜索引擎可以根据用户输入的文字进行搜索并提供相应的搜索结果。音乐搜索引擎或者后台服务器在根据用户输入的内容进行数据搜索时,可以根据意图识别来判断用户输入的文字是否属于泛搜索意图。
发明内容
但是,在一些技术中,对于用户输入的搜索请求,意图识别通常只能给出精准的搜索请求意图的识别结果。对于并不明确的搜索请求,搜索引擎根据意图识别结果做召回排序,对于这类泛意图搜索并不能提供准确的搜索结果。
为此,非常需要一种改进的数据处理方法及装置、存储介质和电子设备,以提供一种能够为准确识别用户的搜索请求是否为泛搜意图的方案。
在本上下文中,本发明的实施方式期望提供一种数据处理方法和装置、存储介质和电子设备。
根据本公开的一个方面,提供一种数据处理方法,包括:获取搜索文本;
基于所述搜索文本确定对应的第一意图评分结果;其中,所述第一意图评分结果以离线方式获取;以及
根据所述搜索文本对应的语法向量的编码特征和词向量的编码特征进行聚合处理,以根据聚合处理结果确定第二意图评分结果;
结合所述第一意图评分结果和所述第二意图评分结果确定所述搜索文本的泛搜意图识别结果。
在本公开的一种示例性实施例中,所述方法还包括:
基于预先构建的实体词典确定所述搜索文本对应的热度信息及意图信息,并根据所述热度信息和意图信息确定第三意图识别结果;以用于结合所述第一意图评分结果、所述第二意图评分结果和所述第三意图识别结果确定所述搜索文本的泛搜意图识别结果。
在本公开的一种示例性实施例中,基于所述搜索文本确定对应的第一意图评分结果,包括:
基于所述搜索文本查询所述搜索文本历史数据以获取相匹配的历史搜索文本,并将所述历史搜索文本对应的第一意图评分结果配置为当前的所述搜索文本对应的第一意图评分结果。
在本公开的一种示例性实施例中,所述基于所述搜索文本对应的语法向量和词向量对应的编码特征进行聚合处理,以根据聚合处理结果确定第二意图评分结果,包括:
对所述搜索文本进行第二预处理;
对第二预处理结果进行切词处理,利用预设的单字词典为各切词结果配置对应的标识,并利用各切词结果对应的映射值构建所述词向量;以及
按预设粒度对所述第二预处理结果进行拆分,利用预设的语法词典配置各拆分结果对应的标识,并利用拆分结果对对应的映射值构建所述语法向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州网易云音乐科技有限公司,未经杭州网易云音乐科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110906879.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:触控模组以及触控显示装置
- 下一篇:一种基于形象识别启发原理的无线互动教具