[发明专利]基于情感因素对项目进展的协方差相关性提取方法有效
申请号: | 201810728956.1 | 申请日: | 2018-07-05 |
公开(公告)号: | CN108958710B | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 杨波;卫新洁;刘超 | 申请(专利权)人: | 北方工业大学 |
主分类号: | G06F8/10 | 分类号: | G06F8/10;G06F8/20;G06Q10/06 |
代理公司: | 北京市广友专利事务所有限责任公司 11237 | 代理人: | 张洪飞 |
地址: | 100144 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于情感因素对项目进展的协方差相关性提取方法,本方法对GitHub中项目的评论数据进行抽取,采用GitHub API,通过拼接URL,发送http请求,返回HTTP响应内容,并对正文中的Json格式数据进行解析,然后显示结果或存入本地;本方法提出了情感因素与故障修复之间的影响。本方法在数据抽取过程中用到了SwingWorker线程工作模式,实现异步处理,避免阻塞应用程序。 | ||
搜索关键词: | 基于 情感 因素 项目 进展 协方差 相关性 提取 方法 | ||
【主权项】:
1.一种基于情感因素对项目进展的协方差相关性提取方法,其特征在于包括有下列处理步骤:步骤一,从GitHub项目中的Pull requests模块提取出请求合并评论数据集PR;所述请求合并评论数据集记为PR={r1,r2,…,ra,…,rA};r1表示第一条请求合并评论数据;r2表示第二条请求合并评论数据;ra表示第a条请求合并评论数据;a表示请求合并评论数据的标识号;rA表示最后一条请求合并评论数据,A表示请求合并评论数据的总个数。步骤二,从请求合并数据集PR中获取Pull requests模块的评论内容,并对评论内容匹配情感分析值;任意一条评论内容经情感匹配处理SST处理后输出一个情感分析值SE,则有:属于r1中的评论内容记为将所述的经情感匹配处理SST处理后输出属于r1的情感分析值记为属于r2中的评论内容记为将所述的经情感匹配处理SST处理后输出属于r2的情感分析值记为属于ra中的评论内容记为将所述的经情感匹配处理SST处理后输出属于ra的情感分析值记为属于rA中的评论内容记为将所述的经情感匹配处理SST处理后输出属于rA的情感分析值记为情感分析值SE是指将任意一条评论数据中的评论内容输入至情感匹配处理SST中,然后由情感匹配处理SST输出一个数值。步骤三,从请求合并数据集PR中获取Pull requests模块的评论量;由于任意一条请求合并评论数据中携带有评论时间和评论内容,因此,根据评论时间来划分请求合并评论数据集PR={r1,r2,…,ra,…,rA},分别将得到以天为单位的天—请求合并评论数据B∈A、以周为单位的周—请求合并评论数据C∈A或者以月为单位的月—请求合并评论数据D∈A。在PR={r1,r2,…,ra,…,rA}中划分出的属于天—请求合并评论数据的条数记为天—评论量numday;在PR={r1,r2,…,ra,…,rA}中划分出的属于周—请求合并评论数据的条数记为周—评论量numweek;在PR={r1,r2,…,ra,…,rA}中划分出的属于月—请求合并评论数据的条数记为月—评论量nummonth;表示以天day为评论时间的第一条评论数据;表示以天day为评论时间的第二条评论数据;表示以天day为评论时间的任意一条评论数据;b表示以天day为评论时间的评论数据的标识号;表示以天day为评论时间的最后一条评论数据;表示以天week为评论时间的第一条评论数据;表示以天week为评论时间的第二条评论数据;表示以天week为评论时间的任意一条评论数据;c表示以天week为评论时间的评论数据的标识号;表示以天week为评论时间的最后一条评论数据;表示以天month为评论时间的第一条评论数据;表示以天month为评论时间的第二条评论数据;表示以天month为评论时间的任意一条评论数据;d表示以天month为评论时间的评论数据的标识号;表示以天month为评论时间的最后一条评论数据;步骤四,依据情感相关程度IFC获取以时间划分的评论数据的关联程度;在本发明中,情感相关程度中n表示求和元素,i表示求和指标,numi表示求和指标下的评论量,表示平均评论量,SEi表示求和指标下的情感分析值,表示平均情感分析值。IFC是按积差方法计算,以两因素与各自平均值的离差为基础,通过两个离差相乘来反映两因素间的相关程度。IFC的值越大,表示两因素间的相关程度越高;反之则表示两因素间的相关程度越低。IFC>0表示两因素之间存在正相关,IFC<0表示两因素之间存在负相关,IFC=0表示两因素之间不存在线性相关。若对天—请求合并评论数据进行情感相关程度处理,得到属于天的评论数据关联程度,记为IFCday。若对周—请求合并评论数据进行情感相关程度处理,得到属于天的评论数据关联程度,记为IFCweek。若对月—请求合并评论数据进行情感相关程度处理,得到属于天的评论数据关联程度,记为IFCmonth。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北方工业大学,未经北方工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810728956.1/,转载请声明来源钻瓜专利网。
- 上一篇:一种大型企业网站建设方案
- 下一篇:卫星多模式复杂系统的测试模板生成方法