[发明专利]代码文件查询方法和装置有效
申请号: | 201410042833.4 | 申请日: | 2014-01-29 |
公开(公告)号: | CN104809139B | 公开(公告)日: | 2019-03-19 |
发明(设计)人: | 刘博;邬亮 | 申请(专利权)人: | 日本电气株式会社 |
主分类号: | G06F16/38 | 分类号: | G06F16/38;G06F8/75 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 张耀光 |
地址: | 日本国*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种代码文件查询方法和装置,属于数据处理技术领域。所述方法包括:基于历史查询词向量以及每个代码文件的文本特征向量和代码特征向量构造的转换矩阵,对当前查询词向量和每个代码文件的代码特征向量进行转换,代码特征向量根据代码文件的代码块确定;根据当前查询词向量、转换后的查询词向量、每个代码文件转换后的代码特征向量以及每个代码文件的文本特征向量,计算每个代码文件与查询词之间的相似度,得到代码文件查询结果。本发明考虑到了代码文件的结构对语义的影响,充分挖掘代码文件的内容和结构,提高了特征提取的准确性,且在查询代码文件的过程中,基于该文本特征向量和代码特征向量计算相似度,提高了查询精度。 | ||
搜索关键词: | 代码 文件 查询 方法 装置 | ||
【主权项】:
1.一种代码文件查询方法,其特征在于,所述方法包括:计算转换矩阵包括的第一转换矩阵的转置矩阵与当前查询词向量的乘积,得到转换后的查询词向量,所述转换矩阵包括所述第一转换矩阵和第二转换矩阵;其中,所述转换矩阵用于对查询词向量以及代码特征向量进行转换,所述第一转换矩阵用于对查询词向量进行转换,所述第二转换矩阵用于对每个代码文件的代码特征向量进行转换,使得所述查询词向量与所述代码特征向量映射至同一语义空间;将每个代码文件的代码特征向量组成代码特征矩阵,所述代码文件的代码特征向量根据代码文件中的代码块确定;计算所述代码特征矩阵的转置矩阵与所述第二转换矩阵的乘积,得到转换后的代码特征矩阵;提取所述转换后的代码特征矩阵的转置矩阵中的每个向量,作为对应代码文件的转换后的代码特征向量;根据所述当前查询词向量、所述转换后的查询词向量、所述每个代码文件转换后的代码特征向量以及所述每个代码文件的文本特征向量,计算每个代码文件与查询词之间的相似度;根据所述每个代码文件与所述查询词之间的相似度,得到代码文件查询结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于日本电气株式会社,未经日本电气株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410042833.4/,转载请声明来源钻瓜专利网。