[发明专利]一种基于CBOW模型的热点工单获取方法及装置在审
申请号: | 201910726132.5 | 申请日: | 2019-08-07 |
公开(公告)号: | CN110442873A | 公开(公告)日: | 2019-11-12 |
发明(设计)人: | 张逸彬;吴玮;陈晨;金瑞琼;郭超 | 申请(专利权)人: | 云南电网有限责任公司信息中心 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F16/35;G06Q50/06 |
代理公司: | 北京弘权知识产权代理事务所(普通合伙) 11363 | 代理人: | 逯长明;许伟群 |
地址: | 650000 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请公开一种基于CBOW模型的热点工单获取方法及装置,所述方法包括:获取ITSM工单管理系统中的工单,构建语料;对语料中的特征文本进行处理,获得多个词条;将词条随机划分为训练数据集和应用数据集;用CBOW模型将训练数据集中的词条映射为第一词向量数据集,获得词向量空间模型;用词向量空间模型训练应用数据集,获得第二词向量数据集;计算第二词向量数据集中任意两个第二词向量之间的语义相似度;将语义相似度大于第一预设阈值的第二词向量聚类,将聚类后第二词向量对应的词条作为目标词条;计算聚类后每一类下目标词条的TF‑IDF值,获取特征关键词,该特征关键词对应的工单为热点工单。采用前述方法,可提高热点工单获取效率。 | ||
搜索关键词: | 词向量 词条 数据集 聚类 特征关键词 语义相似度 空间模型 目标词条 语料 训练数据集 应用数据集 管理系统 数据集中 特征文本 训练数据 训练应用 构建 映射 预设 申请 | ||
【主权项】:
1.一种基于CBOW模型的热点工单获取方法,其特征在于,包括:获取ITSM工单管理系统中的工单,构建语料,所述语料中包含多个特征文本;对所述语料中的特征文本进行处理,获得多个词条;将所述词条随机划分为训练数据集和应用数据集;利用CBOW模型将训练数据集中的词条映射为第一词向量数据集;根据所述第一词向量数据集构建词向量空间模型;利用所述词向量空间模型训练所述应用数据集,获得第二词向量数据集;计算所述第二词向量数据集中的任意两个第二词向量之间的语义相似度;将所述语义相似度大于第一预设阈值的第二词向量聚类,将聚类后的第二词向量对应的词条作为目标词条;计算所述目标词条的TF‑IDF值;将所述TF‑IDF值大于第二预设阈值的目标词条作为特征关键词;获取热点工单,所述热点工单为所述特征关键词对应的工单。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云南电网有限责任公司信息中心,未经云南电网有限责任公司信息中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910726132.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种文本要素完整性审核方法及装置
- 下一篇:一种基于词向量的中文词义预测方法