[发明专利]基于词性匹配与TF-IDF的调度指令一致性检测方法在审
申请号: | 202210260521.5 | 申请日: | 2022-06-13 |
公开(公告)号: | CN114818662A | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 荆江平;杨梓俊;孙昕杰;张刘冬;杨明;申张亮;吴海洋;王黎明;朱卫平;邓晨;耿明昊 | 申请(专利权)人: | 国网江苏省电力有限公司 |
主分类号: | G06F40/216 | 分类号: | G06F40/216;G06F40/253;G06F40/284;G06Q10/00;G06Q50/06 |
代理公司: | 南京行高知识产权代理有限公司 32404 | 代理人: | 李晓 |
地址: | 210000 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 词性 匹配 tf idf 调度 指令 一致性 检测 方法 | ||
1.一种基于词性匹配与TF-IDF的调度指令一致性检测方法,其特征在于,包括步骤:
(1)获取调度指令内容与操作票内容,利用word2vec对调度指令与操作票划分文本内容生成带词性标签的词向量;
(2)依据影响调度指令判断的关键程度,对调度指令内容与操作票内容区分关键词性词向量与非关键词性词向量,将两部分词性词向量分别作为输入进行相似度判断;
(3)利用TF-IDF模型分别计算调度指令与操作票间关键词性词向量、非关键词性词向量的一致性程度;
(4)得到票令一致性程度,包含票令间关键词性词向量的相似度和非关键词性词向量的相似度。
2.根据权利要求1所述的基于词性匹配与TF-IDF的调度指令一致性检测方法,其特征在于,词向量标签包括动词、名词、数量词、形容词、副词、连词、介词、助词。
3.根据权利要求1所述的基于词性匹配与TF-IDF的调度指令一致性检测方法,其特征在于,关键词性包括动词、名词、数量词;非关键词性包括形容词、副词、连词、介词、助词。
4.根据权利要求1所述的基于词性匹配与TF-IDF的调度指令一致性检测方法,其特征在于,将票令文档的词性词向量作为两个输入文档进行TF-IDF算法内,对票令文档的词性词向量进行预处理,去停用词,并转化为词袋矢量,通过词袋矢量计算词性词向量的相似度。
5.根据权利要求4所述的基于词性匹配与TF-IDF的调度指令一致性检测方法,其特征在于,通过词袋矢量计算词性词向量的相似度:
ys表示词性词向量的相似度,wi为词性词向量。
6.根据权利要求5所述的基于词性匹配与TF-IDF的调度指令一致性检测方法,其特征在于,
TF(wi)=fj(wi)
IDF(wi)=log(N/df(wi))
fj(wi)表示一个给定向量wi在文本中其中一个文档内出现的频率,log(N/d(wi))表示文本总数N和出现向量wi的文档总数df(wi)的比值指数。
7.根据权利要求1所述的基于词性匹配与TF-IDF的调度指令一致性检测方法,其特征在于,关键性词向量相似度必须为100%;非关键词向量相似度不少于95%。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网江苏省电力有限公司,未经国网江苏省电力有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210260521.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种加密通讯方法及系统
- 下一篇:一种低压舱可穿戴生命体征监测系统