[发明专利]医学标签推荐方法及装置在审
申请号: | 201810685806.7 | 申请日: | 2018-06-28 |
公开(公告)号: | CN108984656A | 公开(公告)日: | 2018-12-11 |
发明(设计)人: | 杨寻;何楠;曾柏毅 | 申请(专利权)人: | 北京春雨天下软件有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 王涛 |
地址: | 100083 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 医学 相似词 标签推荐 预设 标签 处理数据量 分词处理 历史查询 目标用户 用户推荐 预设规则 输出 | ||
本发明提供了一种医学标签推荐方法及装置,医学标签推荐方法包括:对目标用户的历史查询信息进行分词处理,得到至少一个医学类原词;获取所述医学类原词对应的多个相似词,并在多个所述相似词中选取医学类相似词,组成医学类相似词集;以及,根据预设规则在所述医学类相似词集中选取第一预设数量的医学类相似词,并将该第一预设数量的医学类相似词作为各个医学标签进行输出。本发明能够准确地向用户推荐医学标签,医学标签推荐过程快速且可靠,且有效降低医学标签推荐过程中的处理数据量。
技术领域
本发明涉及信息搜索技术领域,具体涉及一种医学标签推荐方法及装置。
背景技术
为了提高用户体验,在搜索引擎所在页面的关键词推荐功能已成为各类具有搜索功能的网站页面和终端应用APP等的重要功能。其中,由于医学类词汇存在专业化程度高及难以记忆等特性,因此,在医学类网站页面和终端应用中为用户推荐医学类关键词,就显得尤为重要。
现有技术中,为用户推荐关键词的方式一般为过滤式的查询query推荐方式或基于CTR预估的query推荐方式,其中,过滤式的关键词推荐方式主要通过从querylog中挖掘出大量的候选query,之后下拉推荐要求保持前缀相同,且相关推荐要求候选query和输入query具备某种相关性。基于CTR(Click-Through-Rate)预估的query推荐方式可以为利用Logistic回归模型来预估query的CTR,在模型中用到的特征至少包括搜索词与推荐query相关的特征、搜索词与推荐query的类目相关特征、候选query静态分相关特征、推荐query的词性特征和推荐query对应的结果页面特征。
然而,现有技术中的关键词推荐方法均存在需要训练的数据量过大而造成的关键词推荐耗时长和处理功能要求高的问题,以及,产品初期数据为空或者数据量太少而导致所需的数据量达不到要求的冷启动问题。
发明内容
针对现有技术中的问题,本发明提供一种医学标签推荐方法及装置,能够准确地向用户推荐医学标签,医学标签推荐过程快速且可靠,且有效降低医学标签推荐过程中的处理数据量。
为解决上述技术问题,本发明提供以下技术方案:
第一方面,本发明提供一种医学标签推荐方法,所述医学标签推荐方法包括:
对目标用户的历史查询信息进行分词处理,得到至少一个医学类原词;
获取所述医学类原词对应的多个相似词,并在多个所述相似词中选取医学类相似词,组成医学类相似词集;
以及,根据预设规则在所述医学类相似词集中选取第一预设数量的医学类相似词,并将该第一预设数量的医学类相似词作为各个医学标签进行输出。
一实施例中,所述医学标签推荐方法还包括:
接收触发指令,其中,所述触发指令中包含有对应用户的唯一标识;
以及,根据所述唯一标识在历史用户数据库中提取对应用户的历史查询信息,其中,所述历史用户数据库中存储有各个用户的唯一标识与历史查询信息之间的对应关系。
一实施例中,所述对目标用户的历史查询信息进行分词处理,得到至少一个医学类原词,包括:
对目标用户的历史查询信息进行分词处理,得到组成该历史查询信息的全部词汇;
应用医学词数据库对所述组成该历史查询信息的全部词汇进行筛选,在该历史查询信息的全部词汇中提取得到至少一个医学类原词;
以及,确定提取的各个所述医学类原词各自对应的医学词类型。
一实施例中,所述获取所述医学类原词对应的多个相似词,并在多个所述相似词中选取医学类相似词,组成医学类相似词集,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京春雨天下软件有限公司,未经北京春雨天下软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810685806.7/2.html,转载请声明来源钻瓜专利网。