[发明专利]一种基于WT-GloVe词向量构建的文本表示方法有效
申请号: | 201910573695.5 | 申请日: | 2019-06-28 |
公开(公告)号: | CN110348497B | 公开(公告)日: | 2021-09-10 |
发明(设计)人: | 姚全珠;古倩;费蓉;赵佳瑜;李莎莎 | 申请(专利权)人: | 西安理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F40/20 |
代理公司: | 西安弘理专利事务所 61214 | 代理人: | 王蕊转 |
地址: | 710048 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于WT‑GloVe词向量构建的文本表示方法,首先通过对网络文本自身特征的词间距计算评估其重要程度,根据特征的类间分布判别自身对类别的贡献度,将二者结合作为词间距和类间分布的特征加权模型,称为WDID‑TFIDF;然后根据GloVe模型的自身缺点进行过滤无关词,以提高词向量训练质量;最后根据结果选择对应词间距和类间分布的特征加权值并进行点乘,得到加权词向量模型,即为最终得到的文本表示方法。本发明解决了现有技术中存在的传统的文本表示方法计算复杂或者文本信息表示不够全面的问题。 | ||
搜索关键词: | 一种 基于 wt glove 向量 构建 文本 表示 方法 | ||
【主权项】:
1.一种基于WT‑GloVe词向量构建的文本表示方法,其特征在于,具体按照以下步骤实施:步骤1、通过对网络文本自身特征的词间距计算评估其重要程度,根据特征的类间分布判别自身对类别的贡献度,将二者结合作为词间距和类间分布的特征加权模型,称为WDID‑TFIDF;步骤2、根据GloVe模型的自身缺点进行过滤无关词,以提高词向量训练质量;步骤3、根据步骤2所得结果选择步骤1中对应词间距和类间分布的特征加权值并进行点乘,得到加权词向量模型,即为最终得到的文本表示方法。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安理工大学,未经西安理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910573695.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种人脸图像融合的方法及系统
- 下一篇:一种缝纫线迹缺陷检测方法