[发明专利]一种面向电力领域知识学习的文献推荐方法及装置在审
申请号: | 202111019895.X | 申请日: | 2021-09-01 |
公开(公告)号: | CN113705217A | 公开(公告)日: | 2021-11-26 |
发明(设计)人: | 吴俊;查显光;徐滔;戴威;何泽家;崔林;刘媛 | 申请(专利权)人: | 国网江苏省电力有限公司电力科学研究院;国网江苏省电力有限公司 |
主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F40/216 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 张赏 |
地址: | 211103 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 电力 领域 知识 学习 文献 推荐 方法 装置 | ||
1.一种面向电力领域知识学习的文献推荐方法,其特征在于,包括:
获取用户历史阅读文献,抽取文献中的关键词构成文献关键词集;
基于文献关键词计算文献词向量;
基于文献词向量计算用户间的相似性;
基于用户间的相似性排序形成当前用户的邻居用户,将邻居用户的阅读文献进行相互推荐。
2.根据权利要求1所述的一种面向电力领域知识学习的文献推荐方法,其特征在于,所述抽取文献中的关键词构成文献关键词集,包括:
计算文献中每个词的频率:
其中,TF表示词频率;
基于词频率计算词权重;
基于词权重提取预设数量的关键词,构成文献关键词集。
3.根据权利要求2所述的一种面向电力领域知识学习的文献推荐方法,其特征在于,所述基于词频率计算词权重,包括:
如果该词不属于领域关键词词库C,则计算IDF值:
将IDF值与词频率TF相乘得到TF-IDF值作为该词的词权重;
如果该词属于领域关键词词库C,则计算RPD值:
将RPD值与词频率TF相乘得到TF-RPD值作为该词的词权重。
4.根据权利要求3所述的一种面向电力领域知识学习的文献推荐方法,其特征在于,所述log的底数取e。
5.根据权利要求3所述的一种面向电力领域知识学习的文献推荐方法,其特征在于,还包括:
邀请电力领域相关专家,通过人工标注的方式,针对专家根据经验收集和通过互联网收集到的所有电力领域文献,构建领域关键词词库C。
6.根据权利要求3所述的一种面向电力领域知识学习的文献推荐方法,其特征在于,
提取TF-RPD值排前k的词和TF-IDF值排前k的词共同作为文献的关键词,形成该文献的关键词集。
7.根据权利要求6所述的一种面向电力领域知识学习的文献推荐方法,其特征在于,所述k取值为3。
8.根据权利要求3所述的一种面向电力领域知识学习的文献推荐方法,其特征在于,还包括:
对词权重进行标准化:
其中,WvalueiTF-RPD*为第i个词标准化后的TF-RPD值,WvalueiTF-RPD为第i个词的TF-RPD值,WvaluejTF-IDF*为第j个词标准化后的TF-IDF值,WvaluejTF-IDF为第j个词的TF-IDF值。
9.根据权利要求8所述的一种面向电力领域知识学习的文献推荐方法,其特征在于,所述基于关键词计算文献词向量,包括:
其中,VLA表示文献A的词向量,Wvector是文献中关键词w的词向量,Wvalue是文献中关键词w标准化后的词权重,KeywordListA表示文献A的关键词集,2k为KeywordListA中关键词的个数。
10.根据权利要求9所述的一种面向电力领域知识学习的文献推荐方法,其特征在于,关键词的词向量计算如下:
基于预先构建的领域关键词词库C,对收集到的所有电力领域文献逐个进行分词处理,停用词处理以及分句处理,构建语料库;
利用Skip-gram模型对语料库中的语料进行训练,得到每个关键词的词向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网江苏省电力有限公司电力科学研究院;国网江苏省电力有限公司,未经国网江苏省电力有限公司电力科学研究院;国网江苏省电力有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111019895.X/1.html,转载请声明来源钻瓜专利网。