[发明专利]数据源搜索方法、装置和电子设备在审
申请号: | 202010649115.9 | 申请日: | 2020-07-07 |
公开(公告)号: | CN111782898A | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 戴曦 | 申请(专利权)人: | 华青融天(北京)软件股份有限公司 |
主分类号: | G06F16/903 | 分类号: | G06F16/903;G06F16/906 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 张磊 |
地址: | 100083 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据源 搜索 方法 装置 电子设备 | ||
本发明提供了一种数据源搜索方法、装置和电子设备,涉及数据处理的技术领域,包括获取目标专家业务领域树和目标机器业务领域树,利用目标专家业务领域树和目标机器业务领域树对目标数据源进行搜索,得到目标数据源的搜索结果。该方法提供了预先构建的目标专家业务领域树和目标机器业务领域树,利用树的结构按照业务逻辑逐层对目标数据源进行搜索,即可得到目标数据源的搜索结果,从而减少了设计人员的计算量,加快了目标数据源的搜索速度,从而有效的缓解了现有技术中的数据源搜索方法存在的搜索效率低的技术问题。
技术领域
本发明涉及数据处理的技术领域,尤其是涉及一种数据源搜索方法、装置和电子设备。
背景技术
现有技术中的数据源搜索技术依托业务应用为核心进行展开,一般地,若新增业务的数据要求与其它业务无关,则需要分析业务规律,定义数据范围,载入新数据源;如果是数据源已有,则需考虑数据合并过程中是否丢弃现有业务所需数据特征部分,如没有则需要重新载入数据源;或者,若新增业务依托于已有业务的中间数据或输出,则需要各个应用的负责人进行沟通,设计接口,进行调用。显然,上述数据源搜索方法严重依赖设计人员经验,设计人员需要足够专业并经过大量计算才能准确定位所需数据来源,如果数据规模小,人工计算尚且可以完成,但是对于大数据应用场景,上述方法显然不能轻易实现数据源的定位。
综上所述,现有技术中的数据源搜索方法存在搜索效率低的技术问题。
发明内容
本发明的目的在于提供一种数据源搜索方法、装置和电子设备,以缓解了现有技术中的数据源搜索方法存在的搜索效率低的技术问题。
第一方面,本发明实施例提供一种数据源搜索方法,包括:获取目标专家业务领域树和目标机器业务领域树,其中,所述目标专家业务领域树为基于初始专家业务领域树结合多分类训练得到的树状的数据业务化解释,所述目标机器业务领域树为基于用户的数据搜索行为得到的网状的数据业务化解释;利用所述目标专家业务领域树和目标机器业务领域树对目标数据源进行搜索,得到所述目标数据源的搜索结果。
在可选的实施方式中,获取目标专家业务领域树和目标机器业务领域树,包括:获取初始专家业务领域树、所述初始专家业务领域树的所有初始标注对象和用户的数据搜索行为;基于所述初始专家业务领域树和预设数量个初始标注对象构建基础数据分类模型;基于所述基础数据分类模型、目标初始标注对象和专家意见确定目标专家业务领域树,其中,所述目标初始标注对象为所述所有初始标注对象中除所述预设数量个初始标注对象之外的初始标注对象;基于所述用户的数据搜索行为将点击跳转关系转换为数据对象之间的直接相似度;基于所述数据对象之间的直接相似度构建目标机器业务领域树。
在可选的实施方式中,基于所述初始专家业务领域树和预设数量个初始标注对象构建基础数据分类模型,包括:基于所述初始专家业务领域树的索引结构中的特征项计算不同数据分类之间的区别特征和相同数据分类的固有特征;基于所述区别特征和所述固有特征对所述初始专家业务领域树的所有树杈节点进行特征标注,得到标注后的专家业务领域树;利用所述标注后的专家业务领域树和预设数量个初始标注对象对初始多分类的逻辑回归模型进行训练,得到目标多分类的逻辑回归模型,其中,所述目标多分类的逻辑回归模型用于确定树杈节点的特征和权重;基于所述树杈节点的特征和权重构建每个数据分类的基础数据分类模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华青融天(北京)软件股份有限公司,未经华青融天(北京)软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010649115.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种安全解封丢手完井管柱及其操作工艺
- 下一篇:一种生物质颗粒炉专用燃烧盆