[发明专利]基于词性匹配与TF-IDF的调度指令一致性检测方法在审

专利信息
申请号: 202210260521.5 申请日: 2022-06-13
公开(公告)号: CN114818662A 公开(公告)日: 2022-07-29
发明(设计)人: 荆江平;杨梓俊;孙昕杰;张刘冬;杨明;申张亮;吴海洋;王黎明;朱卫平;邓晨;耿明昊 申请(专利权)人: 国网江苏省电力有限公司
主分类号: G06F40/216 分类号: G06F40/216;G06F40/253;G06F40/284;G06Q10/00;G06Q50/06
代理公司: 南京行高知识产权代理有限公司 32404 代理人: 李晓
地址: 210000 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 词性 匹配 tf idf 调度 指令 一致性 检测 方法
【权利要求书】:

1.一种基于词性匹配与TF-IDF的调度指令一致性检测方法,其特征在于,包括步骤:

(1)获取调度指令内容与操作票内容,利用word2vec对调度指令与操作票划分文本内容生成带词性标签的词向量;

(2)依据影响调度指令判断的关键程度,对调度指令内容与操作票内容区分关键词性词向量与非关键词性词向量,将两部分词性词向量分别作为输入进行相似度判断;

(3)利用TF-IDF模型分别计算调度指令与操作票间关键词性词向量、非关键词性词向量的一致性程度;

(4)得到票令一致性程度,包含票令间关键词性词向量的相似度和非关键词性词向量的相似度。

2.根据权利要求1所述的基于词性匹配与TF-IDF的调度指令一致性检测方法,其特征在于,词向量标签包括动词、名词、数量词、形容词、副词、连词、介词、助词。

3.根据权利要求1所述的基于词性匹配与TF-IDF的调度指令一致性检测方法,其特征在于,关键词性包括动词、名词、数量词;非关键词性包括形容词、副词、连词、介词、助词。

4.根据权利要求1所述的基于词性匹配与TF-IDF的调度指令一致性检测方法,其特征在于,将票令文档的词性词向量作为两个输入文档进行TF-IDF算法内,对票令文档的词性词向量进行预处理,去停用词,并转化为词袋矢量,通过词袋矢量计算词性词向量的相似度。

5.根据权利要求4所述的基于词性匹配与TF-IDF的调度指令一致性检测方法,其特征在于,通过词袋矢量计算词性词向量的相似度:

ys表示词性词向量的相似度,wi为词性词向量。

6.根据权利要求5所述的基于词性匹配与TF-IDF的调度指令一致性检测方法,其特征在于,

TF(wi)=fj(wi)

IDF(wi)=log(N/df(wi))

fj(wi)表示一个给定向量wi在文本中其中一个文档内出现的频率,log(N/d(wi))表示文本总数N和出现向量wi的文档总数df(wi)的比值指数。

7.根据权利要求1所述的基于词性匹配与TF-IDF的调度指令一致性检测方法,其特征在于,关键性词向量相似度必须为100%;非关键词向量相似度不少于95%。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网江苏省电力有限公司,未经国网江苏省电力有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210260521.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top