[发明专利]代码搜索方法、装置、可读存储介质和电子设备在审
申请号: | 202011211683.7 | 申请日: | 2020-11-03 |
公开(公告)号: | CN112328743A | 公开(公告)日: | 2021-02-05 |
发明(设计)人: | 任雷鸣 | 申请(专利权)人: | 北京嘀嘀无限科技发展有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06N3/04;G06N3/08 |
代理公司: | 北京睿派知识产权代理事务所(普通合伙) 11597 | 代理人: | 刘锋 |
地址: | 100193 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 代码 搜索 方法 装置 可读 存储 介质 电子设备 | ||
本发明实施例公开了一种代码搜索方法、装置、可读存储介质和电子设备,通过确定多个候选代码片段和用于描述对应的目标代码片段的搜索信息,划分各候选代码片段得到对应的方法名、调用顺序以及符号标记。进一步对对应的方法名、调用顺序以及符号标记进行特征提取。同时对搜索信息进行特征提取得到搜索特征,再根据对应的方法名、调用顺序以及符号标记的提取结果和搜索特征各候选代码片段对应的候选代码特征,以根据各候选代码特征和搜索特征的相似度确定匹配的目标代码片段。本发明实施例通过划分候选代码片段并提取候选代码特征,同时提取搜索信息的搜索特征,基于候选代码特征和搜索特征进行代码搜索,提高了代码搜索结果的准确度。
技术领域
本发明涉及数据处理领域,尤其涉及一种代码搜索方法、装置、可读存储介质和电子设备。
背景技术
随着计算机科学技术的迅速发展,计算机学科在各个领域的研究和应用正朝着更深入和更广阔的方向进行,与其他学科相同的是,计算机学科的理论研究同样也离不开科学有效的实验,而作为实验的关键部分,开源代码成为了学术交流的重要桥梁,在学科发展和学术进步的过程中扮演着举足轻重的角色。开源服务在为人们的学习和交流提供便利的同时,也为人们的使用带来了诸多困扰,其中最典型的就是,用户需要付出巨大的时间和精力去筛选搜索引擎返回的推荐代码。因此,如何对代码和检索查询进行合理有效的相关性评估,是代码搜索领域亟待解决的问题。
发明内容
有鉴于此,本发明实施例提供了代码搜索方法、装置、可读存储介质和电子设备,旨在提供一种高效的代码搜索方法,提高代码搜索结果的准确性。
第一方面,本发明实施例公开了一种代码搜索方法,所述方法包括:
确定搜索信息和多个候选代码片段,所述搜索信息用于描述对应的目标代码片段;
确定各所述候选代码片段对应的方法名、调用顺序以及符号标记;
对于各所述候选代码片段,分别对对应的方法名、调用顺序以及符号标记进行特征提取,以确定第一代码特征、第二代码特征和第三代码特征;
对所述搜索信息进行特征提取,以确定搜索特征;
根据对应的第一代码特征、第二代码特征、第三代码特征和搜索特征确定各所述候选代码片段对应的候选代码特征;
确定各所述候选代码特征和搜索特征的相似度,以确定与搜索信息匹配的目标代码片段。
第二方面,本发明实施例提供了一种代码搜索装置,所述装置包括:
信息确定模块,用于确定搜索信息和多个候选代码片段,所述搜索信息用于描述对应的目标代码片段;
信息拆分模块,用于确定各所述候选代码片段对应的方法名、调用顺序以及符号标记;
第一提取模块,用于对于各所述候选代码片段,分别对对应的方法名、调用顺序以及符号标记进行特征提取,以确定第一代码特征、第二代码特征和第三代码特征;
第二提取模块,用于对所述搜索信息进行特征提取,以确定搜索特征;
特征确定模块,用于根据对应的第一代码特征、第二代码特征、第三代码特征和搜索特征确定各所述候选代码片段对应的候选代码特征;
信息匹配模块,用于确定各所述候选代码特征和搜索特征的相似度,以确定与搜索信息匹配的目标代码片段。
第三方面,本发明实施例提供了一种计算机可读存储介质,用于存储计算机程序指令,所述计算机程序指令在被处理器执行时实现如第一方面所述的方法。
第四方面,本发明实施例提供了一种电子设备,包括存储器和处理器,其特征在于,所述存储器用于存储一条或多条计算机程序指令,其中,所述一条或多条计算机程序指令被所述处理器执行以实现如第一方面所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京嘀嘀无限科技发展有限公司,未经北京嘀嘀无限科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011211683.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种混凝土浆水回收设备
- 下一篇:用户档案数据处理方法、装置、设备及存储介质