[发明专利]一种文档建模方法有效

申请号：	201710617657.6	申请日：	2017-07-26
公开（公告）号：	CN107357927B	公开（公告）日：	2020-06-12
发明（设计）人：	李双印;潘嵘	申请（专利权）人：	深圳爱拼信息科技有限公司
主分类号：	G06F16/35	分类号：	G06F16/35;G06K9/62;G06F16/38
代理公司：	广州越华专利代理事务所(普通合伙) 44523	代理人：	陈岑
地址：	518057 广东省深圳市南山区南山街道科***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种文档建模方法，通过设计一种能够同时利用单词和标签信息，以及自动利用标签种类信息，对半结构化文档进行有效的建模。并且利用自主补偿机制，在深度玻尔兹曼机中，学习不同种类的标签信息对文档建模的作用，可以充分考虑不同标签种类的异构信息，从而学习到更加有效的半结构化文档向量。
搜索关键词：	一种文档建模方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种文档建模的方法，其特征在于，包括以下步骤：步骤1，首先将文档中的单词w使用主题模型进行向量映射，得到单词信息的向量，作为步骤2，将文档中的各类标签信息m1,…,mt，使用标准受限玻尔兹曼机进行向量映射，得到所有标签种类的向量表达并存于步骤3，使用预设的自主补偿型深度玻尔兹曼机的学习算法构建整个网络；步骤4，将该文档的和作为输入，输入到训练好的自主补偿型深度玻尔兹曼机，获得该自主补偿型深度玻尔兹曼机的最高层输出h(t)；步骤5，h(t)为该半结构化文档的向量表示。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于深圳爱拼信息科技有限公司，未经深圳爱拼信息科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201710617657.6/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种文档建模方法有效

专利文献下载