[发明专利]直播间的搜索方法、装置、服务器及存储介质在审
申请号: | 202010644565.9 | 申请日: | 2020-07-07 |
公开(公告)号: | CN113918803A | 公开(公告)日: | 2022-01-11 |
发明(设计)人: | 杜辉 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/951 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 谢曲曲 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 直播 搜索 方法 装置 服务器 存储 介质 | ||
本公开关于一种直播间的搜索方法、装置、服务器及存储介质,所述方法包括:获取输入文本;对输入文本进行意图分析,得到至少一个搜索意图;若搜索意图包括直播搜索意图,则从与直播搜索意图对应的直播索引数据中检索得到目标直播间标识,直播索引数据中包括合并后的与目标直播间标识对应的静态数据流和动态数据流。该方法通过根据直播间标识对应的动态数据流和静态数据流构建直播索引数据,利用直播间数据的实时动态变化的特点,可以有效提高直播间搜索的准确性,进而极大地提高了用户的搜索量。
技术领域
本公开涉及互联网技术领域,尤其涉及一种直播间的搜索方法、装置、服务器及存储介质。
背景技术
随着直播技术的发展,各类直播应用中的直播间数量快速增加。为了使用户从海量的直播间中查找感兴趣的直播间,很多直播应用提供了直播间的搜索入口。
相关技术中,直播搜索通常基于主播相关信息、直播间标签等静态数据建立索引数据库。索引数据库用于对用户提出的直播间的搜索请求作出响应,提供用户想要获取的直播间信息。当获取观众客户端的输入文本时,根据输入文本从索引数据库中查询与输入文本匹配的直播间,并将匹配的直播间发送至观众客户端。但是,由于直播间数据的动态变化特点,采用上述直播间的搜索方式存在搜索不够精确的问题。
发明内容
本公开提供一种播间的搜索方法、装置、服务器及存储介质,以至少解决相关技术中直播间的搜索不够精确的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种直播间的搜索方法,包括:
获取输入文本;
对输入文本进行意图分析,得到至少一个搜索意图;
若搜索意图包括直播搜索意图,则从与直播搜索意图对应的直播索引数据中检索得到目标直播间标识,直播索引数据中包括合并后的与目标直播间标识对应的静态数据流和动态数据流。
在其中一个实施例中,若搜索意图包括直播搜索意图,则从与直播搜索意图对应的直播索引数据中检索得到目标直播间标识,包括:
若搜索意图包括直播搜索意图,则将输入文本与根据直播索引数据构建的索引数据块中的分词单元进行匹配,获取与输入文本匹配的目标分词单元,分词单元根据直播索引数据进行分词处理得到;
将与目标分词单元对应的直播间标识,作为目标直播间标识。
在其中一个实施例中,若搜索意图包括直播搜索意图,则从与直播搜索意图对应的直播索引数据中检索得到目标直播间标识,包括:
若搜索意图包括直播搜索意图,则根据输入文本,从直播索引数据中检索得到原始直播间标识;
获取与原始直播间标识对应的直播间关联信息;
对直播间关联信息进行过滤,获取过滤后的直播间关联信息对应的原始直播间标识,作为目标直播间标识。
在其中一个实施例中,在若搜索意图包括直播搜索意图,则从与直播搜索意图对应的直播索引数据中检索得到目标直播间标识之后,还包括:
当目标直播间标识的数量为多个时,采用预先配置的排序模型对目标直播间标识进行排序,得到排序后的目标直播间标识。
在其中一个实施例中,直播索引数据的生成方式,包括:
接收多路数据流,数据流携带直播间标识,数据流包括静态数据流和动态数据流;
将同一直播间标识对应的静态数据流和动态数据流进行合并,得到与直播间标识对应的直播索引数据。
在其中一个实施例中,在接收多路数据流之后,还包括:
对静态数据流和动态数据流进行清洗处理,得到清洗后的静态数据流和清洗后的动态数据流;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010644565.9/2.html,转载请声明来源钻瓜专利网。