[发明专利]相关词推荐方法和装置有效
申请号: | 201911341008.3 | 申请日: | 2019-12-23 |
公开(公告)号: | CN111125344B | 公开(公告)日: | 2023-09-05 |
发明(设计)人: | 王九硕;张丹;贾丹丹;于琳琳 | 申请(专利权)人: | 新方正控股发展有限责任公司;北京北大方正电子有限公司 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06F16/36 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 罗英;刘芳 |
地址: | 519030 广东省珠海市横琴*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 相关 推荐 方法 装置 | ||
本申请实施例提供的一种相关词推荐方法和装置,该方法包括:获取用户输入的输入语句;获取所述输入语句对应的至少一种维度属性信息;再分别获取每种所述维度属性信息对应的多个语料语句;通过根据所获取的用户所输入的输入语句的地域信息、时间信息以及所述输入语句所属的领域信息对应的多个语料语句,确定每种维度属性信息对应的与所述输入语句相关的推荐词,然后将所述至少一种维度属性信息中每种维度属性信息对应的与所述输入语句相关的推荐词显示输出,使得用户可以从大量的输入语句数据中获取更多符合用户需求的相关词,提高了相关词推荐的准确性。
技术领域
本申请实施例涉及计算机技术领域,尤其涉及一种相关词推荐方法和装置。
背景技术
随着社会的发展,我们逐渐迈入大数据时代,尤其是社交网络备受关注,其中最为突出的是微博,越来越多的人利用微博这一平台来发表自己对突发事件、群体事件、灾害事件、娱乐事件等的看法,转发或者评论微博信息等,进而使得微博中也积累了海量的、动态变化的微博用户时空行为数据(包括发布时间、发布地点及发布方式等)、内容数据(包括文本内容、用户Tag标签等)与关系数据(包括关注关系、粉丝列表等)。因此,对大数据进行分析与挖掘数据中的价值成为了大部分研究人员的目标。用户如何从大量数据中获取用户关注的信息是亟需解决的问题。
发明内容
本申请实施例提供一种相关词推荐方法和装置,以解决用户如何从大量数据中获取用户关注的信息的问题。
第一方面,本申请实施例提供一种相关词推荐方法,包括:
获取用户输入的输入语句;
获取所述输入语句对应的至少一种维度属性信息,所述至少一种维度属性信息包括:用户输入所述输入语句的地域信息、时间信息以及所述输入语句所属的领域信息中的至少一种;
分别获取每种所述维度属性信息对应的多个语料语句;
根据每种维度属性信息对应的多个语料语句,确定每种维度属性信息对应的与所述输入语句相关的推荐词;
输出所述至少一种维度属性信息中每种维度属性信息对应的与所述输入语句相关的推荐词。
可选地,所述根据每种维度属性信息对应的多个语料语句,确定每种维度属性信息对应的与所述输入语句相关的推荐词,包括:
提取所述每种维度属性信息对应的多个语料语句中的关键词;
根据所述每种维度属性信息对应的所述关键词,确定每种维度属性信息对应的与所述输入语句相关的推荐词。
可选地,所述提取所述每种维度属性信息对应的多个语料语句中的关键词,包括:
对每种维度属性信息对应的多个语料语句进行预处理,获得预处理后的多个语料语句,所述预处理包括:去重处理;
对所述预处理后的多个语料语句进行分词处理,获得多个词语;
根据所述多个词语,获得所述关键词。
可选地,所述根据所述多个词语,获得所述关键词,包括:
获取所述多个语料语句中语料语句的第一数量;
获取每个词语在所述多个语料语句中出现的次数;
根据每个词语,获取所述多个语料语句中包括该词句的语料语句的第二数量;
根据所述第一数量、所述次数、所述第二数量,获取每个词语的权重值;
根据所述多个词语中每个词语的权重值,获得所述关键词。
可选地,所述根据所述多个词语中每个词语的权重值,获得所述关键词,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新方正控股发展有限责任公司;北京北大方正电子有限公司,未经新方正控股发展有限责任公司;北京北大方正电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911341008.3/2.html,转载请声明来源钻瓜专利网。