[发明专利]数据源搜索方法、装置和电子设备在审

专利信息
申请号: 202010649115.9 申请日: 2020-07-07
公开(公告)号: CN111782898A 公开(公告)日: 2020-10-16
发明(设计)人: 戴曦 申请(专利权)人: 华青融天(北京)软件股份有限公司
主分类号: G06F16/903 分类号: G06F16/903;G06F16/906
代理公司: 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 代理人: 张磊
地址: 100083 北京市海*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 数据源 搜索 方法 装置 电子设备
【权利要求书】:

1.一种数据源搜索方法,其特征在于,包括:

获取目标专家业务领域树和目标机器业务领域树,其中,所述目标专家业务领域树为基于初始专家业务领域树结合多分类训练得到的树状的数据业务化解释,所述目标机器业务领域树为基于用户的数据搜索行为得到的网状的数据业务化解释;

利用所述目标专家业务领域树和目标机器业务领域树对目标数据源进行搜索,得到所述目标数据源的搜索结果。

2.根据权利要求1所述的方法,其特征在于,获取目标专家业务领域树和目标机器业务领域树,包括:

获取初始专家业务领域树、所述初始专家业务领域树的所有初始标注对象和用户的数据搜索行为;

基于所述初始专家业务领域树和预设数量个初始标注对象构建基础数据分类模型;

基于所述基础数据分类模型、目标初始标注对象和专家意见确定目标专家业务领域树,其中,所述目标初始标注对象为所述所有初始标注对象中除所述预设数量个初始标注对象之外的初始标注对象;

基于所述用户的数据搜索行为将点击跳转关系转换为数据对象之间的直接相似度;

基于所述数据对象之间的直接相似度构建目标机器业务领域树。

3.根据权利要求2所述的方法,其特征在于,基于所述初始专家业务领域树和预设数量个初始标注对象构建基础数据分类模型,包括:

基于所述初始专家业务领域树的索引结构中的特征项计算不同数据分类之间的区别特征和相同数据分类的固有特征;

基于所述区别特征和所述固有特征对所述初始专家业务领域树的所有树杈节点进行特征标注,得到标注后的专家业务领域树;

利用所述标注后的专家业务领域树和预设数量个初始标注对象对初始多分类的逻辑回归模型进行训练,得到目标多分类的逻辑回归模型,其中,所述目标多分类的逻辑回归模型用于确定树杈节点的特征和权重;

基于所述树杈节点的特征和权重构建每个数据分类的基础数据分类模型。

4.根据权利要求2所述的方法,其特征在于,基于所述基础数据分类模型、目标初始标注对象和专家意见确定目标专家业务领域树,包括:

利用所述基础数据分类模型对所述目标初始标注对象进行特征提取并预测分类,统计每个数据分类条件的命中次数;

基于所述每个数据分类条件的命中次数对每个树杈节点的权重进行调整,得到第一数据分类模型;

将所述基础数据分类模型和所述第一数据分类模型进行合并,得到第二数据分类模型;

基于所述第二数据分类模型中每个树杈节点权重的大小对所述第二数据分类模型进行重构,得到第三数据分类模型;

基于专家意见对所述第三数据分类模型进行调整,得到第四数据分类模型;

基于所述第四数据分类模型构建对应的专家业务领域树,并对所述对应的专家业务领域树上的所有树杈节点进行特征标注,得到目标专家业务领域树。

5.根据权利要求4所述的方法,其特征在于,基于专家意见对所述第三数据分类模型进行调整,得到第四数据分类模型,包括:

去除所述目标初始标注对象的分类标注,得到目标未标注对象;

基于所述第三数据分类模型对所述目标未标注对象进行分类预测,得到数据分类结果;

基于专家意见对所述数据分类结果进行调整,得到所述第四数据分类模型,其中,所述调整包括:修正树杈节点的特征标注。

6.根据权利要求2所述的方法,其特征在于,基于所述用户的数据搜索行为将点击跳转关系转换为数据对象之间的直接相似度,包括:

基于所述用户的数据搜索行为统计展示的数据对象的数量;

利用算式计算每个数据对象被随机点击的总次数,其中,n表示所述数据对象的数量,表示用户点击数据对象a跳转后再点击数据对象bi的次数;

利用算式计算数据对象之间的直接相似度,其中,f(a,b)表示数据对象a和数据对象b的直接相似度。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华青融天(北京)软件股份有限公司,未经华青融天(北京)软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010649115.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top