[发明专利]编程数据的处理方法与装置在审
申请号: | 202110950404.7 | 申请日: | 2021-08-18 |
公开(公告)号: | CN113721977A | 公开(公告)日: | 2021-11-30 |
发明(设计)人: | 姜瑛;宋超 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06F8/77 | 分类号: | G06F8/77;G06F8/75 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 曾红芳 |
地址: | 650500 云南*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 编程 数据 处理 方法 装置 | ||
本发明公开了一种编程数据的处理方法与装置。其中,该方法包括:获取目标对象的编程数据;依据编程数据,识别出目标对象的编程行为;依据编程行为,确定目标对象、代码自动生成工具以及编程平台的编程贡献率。本发明解决了相关技术中不能明确区分程序员、代码自动生成工具和编程平台在编程过程中的行为和作用,导致难以体现不同角色对编程效率和质量的贡献的技术问题。
技术领域
本发明涉及编程技术领域,具体而言,涉及一种编程数据的处理方法与装置。
背景技术
目前,针对代码自动生成技术、程序员画像等均开展了相应研究。在代码自动生成方面,Liu Fang等人提出了一种基于多任务学习的代码生成预训练语言模型,首先结合代码理解和代码生成任务的混合目标函数进行预训练,然后在代码生成时对预先训练好的模型进行微调,通过多任务学习来共同预测并生成代码。Veselin Raychev等人提出了一种使用统计语言模型自动生成代码的方法,从大型代码库中提取应用程序接口(ApplicationProgramming Interface,简称为API)方法调用的历史记录作为训练语句,然后通过语言模型来预测概率最高的代码片段组合生成API代码。Xu J.Y等人提出了一种基于实时过程代数(Real-Time Process Algebra,简称为RTPA)的代码生成方法,通过学习RTPA的编码规则生成程序员期望的MATLAB代码。Bruch Marcel等人提出了一种集成到Eclipse编程平台的代码自动生成工具,首先获取程序员开发过程中代码的上下文并将其表示为特征向量,然后通过最匹配邻近(Best Matching Neighbors,简称为BMN)算法生成Java代码。TungThanh Nguyen等人提出了一种源代码统计语义语言模型(Statistical SemanticLanguage Model For Source Code,简称为SLAMC)和基于SLAMC的代码生成方法,分析已有代码并生成与其对应的语义代码序列,然后通过N-Gram模型来生成Java或C#代码。Gong Q等人提出了一种基于分层生成神经网络(Hierarchical Generative ConvolutionalNeural Networks,简称为HGCNN)的方法,以源代码和程序员的对应输入和输出数据作为训练数据集,通过HGCNN神经网络模型预测代码语句,最后根据预测结果结合传统的程序搜索技术生成代码。Hu Xing等人提出了本文提出了一种Hybrid-DeepCom方法,应用自然语言处理(NLP)技术从大型代码库中学习,并从学习的功能中生成代码注释。Nguyen AT等人提出了一种API代码生成方法,基于对细粒度代码更改以及所做更改的上下文的统计学习,利用重复代码更改的预测能力生成API代码。Bhoopchand A等人提出了一种具有稀疏指针网络的神经语言模型,通过捕获代码之间的长依赖关系来生成程序员需要的代码。
由于程序员各有不同的风格,代码自动生成工具或技术在编程过程中也会根据程序员的特点进行有针对性的代码推荐。Yang Jun-wen等人提出了一种基于程序员行为分析和挖掘的Web信息资源推荐方法,可以自动记录和抓取程序员在编程平台中的代码浏览和修改等动作,并从页面浏览信息获取基础信息,通过聚类和基于时间的关联分析确定程序员行为与Web信息资源之间的相关性,在程序员执行开发任务时自动推荐相关的Web信息资源。Xie Xin-qiang等人提出了一种能力与行为感知的多特征融合协同过滤程序员推荐方法,分析程序员动态行为特征并利用矩阵分解拟合技术对评价矩阵进行增强优化,通过对增强后的评价矩阵、开发者能力特征和开发者-任务相似匹配度进行特征融合,为程序员推荐适合的任务。Liu Ye-hui等人提出了一种针对开源社区中问题解决过程的参与者推荐方法,首先根据程序员参与的问题特征构建程序员画像,然后用熵值法对程序员画像进行特征偏好权重计算,结合信息检索和评论网络为新发起的问题解决过程推荐参与者。YangWen-hua等人提出了一种多维程序员画像模型,指定与程序员有关的软件开发的各个方面的属性,利用文本分析、Web数据分析和代码分析技术的方法构建程序员画像,以帮助程序员在协作软件开发过程中做出更好的决策。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110950404.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:真空玻璃纤维和其制备方法及加工系统
- 下一篇:三维存储器的制作方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置