[发明专利]相似企业推荐方法、装置、计算机设备及存储介质有效
申请号: | 201811106479.1 | 申请日: | 2018-09-21 |
公开(公告)号: | CN109299362B | 公开(公告)日: | 2023-04-14 |
发明(设计)人: | 吴壮伟 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/35;G06F16/36 |
代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 林燕云 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 相似 企业 推荐 方法 装置 计算机 设备 存储 介质 | ||
1.一种相似企业推荐方法,其特征在于,包括:
若接收到用户所输入的网址信息,根据预设的信息爬取程序对所述网址信息对应网页中的数据信息进行采集并保存至预设数据库中;
若接收到用户所输入的图谱构建信息,根据所述图谱构建信息中的特征提取模型对数据库中所保存的数据信息进行提取以得到所述数据信息中所包含语句的特征向量值;
根据所述图谱构建信息中的匹配概率计算模型对所得到的语句的特征向量值与匹配概率计算模型中多个预设类别之间的匹配概率进行计算,以得到该语句与多个预设类别之间的匹配概率;
根据所述图谱构建信息中的分类阈值以及所得到的数据信息中所有语句与多个预设类别之间的匹配概率对所述数据信息中所有语句进行分类以得到语句分类结果;
根据所得到的语句的分类结果结合所述图谱构建信息中的企业图谱构建规则构建得到企业关系图谱;
若接收到用户所输入的企业信息,根据预设的企业筛选规则从所述企业关系图谱中筛选出与企业信息相类似的企业实体以得到目标推荐企业;
所述根据所得到的语句的分类结果结合所述图谱构建信息中的企业图谱构建规则构建得到企业关系图谱,包括:
根据企业图谱构建规则中的目标类别获取相应预设类别所包含的语句;
根据企业图谱构建规则中的词性标注规则对所有语句中单词的词性进行标注以得到语句的词性标注信息;
根据企业图谱构建规则中的信息提取规则及所得到的语句的词性标注信息对所有语句中所包含的主体、客体、关联信息、时间信息进行提取;
根据企业图谱构建规则中的关系图谱构建规则以及语句中所包含的主体、客体、关联信息构建企业关系图谱。
2.根据权利要求1所述的相似企业推荐方法,其特征在于,所述根据预设的信息爬取程序对所述网址信息对应网页中的数据信息进行采集并保存至预设数据库中,包括:
将所述网址信息作为待爬取列表添加至预设的信息爬取程序中;
将已添加待爬取列表的信息爬取程序通过预设的管理服务器发送至与所述管理服务器建立网络连接的多台信息采集终端;
通过管理服务器接收多台信息采集终端所采集得到的数据信息并保存至预设的数据库中。
3.根据权利要求1所述的相似企业推荐方法,其特征在于,所述根据所述图谱构建信息中的特征提取模型对数据库中所保存的数据信息进行提取以得到所述数据信息中所包含语句的特征向量值,包括:
根据所述特征提取模型中的语句分段规则对所述数据信息进行分段得到该数据信息中所包含的语句;
根据所述特征提取模型中的词向量提取规则对每一段语句中单词的特征向量进行提取以得到该段语句中所有单词的特征向量;
根据所述特征提取模型中的拼接规则对每一段语句中所有单词的特征向量进行横向拼接以得到该语句的特征向量值;
所述横向拼接是指:
当所有单词的特征向量的维度均相等时,将所有单词的特征向量进行横向相加。
4.根据权利要求1所述的相似企业推荐方法,其特征在于,所述根据预设的企业筛选规则从所述企业关系图谱中筛选出与企业信息相类似的企业实体以得到目标推荐企业,包括:
根据用户所输入的企业信息与所构建的企业关系图谱中的企业实体进行匹配以得到目标企业实体;
获取企业关系图谱中与目标企业实体之间存在关联信息的多个关联企业实体;
对企业关系图谱中除目标企业实体外其他企业实体与所得到的多个关联企业实体之间存在关联关系的数量进行统计以得到所有企业实体的统计结果;
根据所述企业筛选规则及所得到的企业实体的统计结果对企业实体进行筛选以得到目标推荐企业。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811106479.1/1.html,转载请声明来源钻瓜专利网。