[发明专利]信息输出方法和装置在审
申请号: | 201611077280.1 | 申请日: | 2016-11-30 |
公开(公告)号: | CN108132934A | 公开(公告)日: | 2018-06-08 |
发明(设计)人: | 林浩;祝恒书;朱琛;熊辉 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q10/10 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征向量 向量 话题 评分信息 方法和装置 权限信息 信息输出 预测模型 客户端 权限 职位 预处理 信息查询请求 发送权限 获取目标 预测目标 预设 发送 响应 申请 | ||
1.一种信息输出方法,其特征在于,所述方法包括:
响应于接收到客户端发送的对目标公司的目标职位的信息查询请求,获取所述目标公司的目标职位的至少一条点评信息,其中,每条点评信息中包括至少一个话题;
将所述至少一条点评信息进行预处理得到点评向量;
将所述点评向量输入预设的预测模型以获取话题比例以及权限特征向量和评分特征向量,其中,所述预测模型用于表征点评向量、权限特征向量、评分特征向量、话题比例之间的对应关系,所述话题比例为点评向量中各话题的数量与话题总数之比构成的向量;
向所述客户端发送权限信息和评分信息,其中,所述权限信息为所述话题比例与所述权限特征向量之积,所述评分信息为所述话题比例与所述评分特征向量之积。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将所述点评信息中的话题与预设的优点词集合和预设的缺点词集合进行匹配;
将与预设的优点词集合相匹配的话题组成优点话题集合;
将与预设的缺点词集合相匹配的话题组成缺点话题集合;
从所述优点话题集合中按照词频由大到小的顺序选择预定数目的优点话题;
从所述缺点话题集合中按照词频由大到小的顺序选择预定数目的缺点话题;
向所述客户端发送所选择的优点话题和所选择的缺点话题。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括建立预测模型的步骤,包括:
采集各公司的各职位的点评信息、各公司的各职位的权限信息和各公司的各职位的评分信息;
将所述点评信息、所述权限信息和所述评分信息进行预处理得到点评矩阵、权限矩阵和评分矩阵;
将所述点评矩阵、所述权限矩阵和所述评分矩阵作为样本求解话题比例、权限特征向量和评分特征向量。
4.根据权利要求1所述的方法,其特征在于,所述将所述至少一条点评信息进行预处理得到点评向量,包括:
解析每条点评信息以提取话题,并对每条点评信息进行文本预处理,所述文本预处理包括以下至少一项:分词、移除停用词、移除无意义的高频词和移除低频词;
将经文本预处理后的点评信息转化为数学表达式;
将所述数学表达式进行聚合得到点评向量。
5.根据权利要求3所述的方法,其特征在于,所述将所述点评矩阵、所述权限矩阵和所述评分矩阵作为样本训练出话题比例、权限特征向量和评分特征向量,包括:
将所述权限矩阵分解成公司职位特征矩阵和权限特征向量,其中,所述公司职位特征矩阵为话题比例加上高斯偏移,所述权限特征向量与职位的权限相关联;
将所述评分矩阵分解成所述公司职位特征矩阵和评分特征向量,其中,所述评分特征向量与职位的评分相关联;
将所述权限矩阵、所述评分矩阵、所述话题比例、所述公司职位特征矩阵、所述权限特征向量、所述评分特征向量组合成概率模型;
基于求解算法进行参数迭代求解所述概率模型中的所述话题比例、所述公司职位特征矩阵、所述权限特征向量、所述评分特征向量。
6.根据权利要求5所述的方法,其特征在于,所述建立预测模型的步骤还包括:
根据预设的优点词集合和预设的缺点词集合将所述点评矩阵中的话题分成优点话题集合和缺点话题集合;
对于每个职位生成与所述优点话题集合对应的话题的优点词分布和与所述缺点话题集合对应的话题的缺点词分布;
将所述权限矩阵、所述评分矩阵、所述话题比例、所述公司职位特征矩阵、所述权限特征向量、所述评分特征向量、所述话题的优点词分布和所述话题的缺点词分布组合成概率模型;
基于求解算法进行参数迭代求解所述概率模型中的所述话题比例、所述公司职位特征矩阵、所述权限特征向量、所述评分特征向量、所述话题的优点词分布和所述话题的缺点词分布。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611077280.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种跨语言分析报告的生成方法
- 下一篇:图像分类方法及图像展示方法