[发明专利]一种文档建模方法有效

申请号：	201710617657.6	申请日：	2017-07-26
公开（公告）号：	CN107357927B	公开（公告）日：	2020-06-12
发明（设计）人：	李双印;潘嵘	申请（专利权）人：	深圳爱拼信息科技有限公司
主分类号：	G06F16/35	分类号：	G06F16/35;G06K9/62;G06F16/38
代理公司：	广州越华专利代理事务所(普通合伙) 44523	代理人：	陈岑
地址：	518057 广东省深圳市南山区南山街道科***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种文档建模方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种文档建模方法，其特征在于，包括以下步骤：

步骤1，首先将文档中的单词w使用主题模型进行向量映射，得到单词信息的向量，作为

步骤2，将文档中的各类标签信息m¹,…,m^t，使用标准受限玻尔兹曼机进行向量映射，得到所有标签种类的向量表达并存于

步骤3，使用预设的自主补偿型深度玻尔兹曼机的学习算法构建整个网络；

步骤4，将该文档的和作为输入，输入到训练好的自主补偿型深度玻尔兹曼机，获得该自主补偿型深度玻尔兹曼机的最高层输出h^(t)；

步骤5，h^(t)为该文档的向量表示；

其中，所述步骤4具体为：

步骤41，设置一个t层的深度玻尔兹曼机，其包含t个隐含层，和1个可见层，设置t种不同种类的补偿信息；

步骤42，从所述t种补偿信息中选取随机一种补偿信息与所述可见层连接起来，作为新的输入，与下一层隐含层构成一个受限玻尔兹曼机；

步骤43，从上述步骤选取的补偿信息之外的t-1中补偿信息中随机选择一个补偿信息，与上一层使用的补偿信息连接起来，与对应的隐含层一起构成一个受限玻尔兹曼机；

步骤44，重复步骤43，直至所述t种补偿信息全部连接起来，与对应的第t层隐含层构成最高层的受限玻尔兹曼机；

其中，步骤3中所述自主补偿型深度玻尔兹曼机的学习算法具体为：

步骤31，设置补偿信息候选集合m_left，此时已选补偿信息集合m_selected为空；

步骤32，选取深度玻尔兹曼机中的一层，使用上一层的输出h^(k)作为该层的可见层输入，并执行公式

从m_left中选择出某一种补偿信息标号，放入m_selected中，并从m_left中剔除；

步骤33，训练该层的补偿型深度玻尔兹曼机，并输出h^(k+1)；

步骤34，重复步骤32和33，直至m_left为空。

2.根据权利要求1所述的一种文档建模方法，其特征在于，

使用如下的目标函数进行自主决策补偿信息：

其中，λ为模型空间参数，设置为常数，v为一个指示向量，只有一维为1，其它维度都为0。

3.根据权利要求1所述的一种文档建模方法，其特征在于，

一个具有t层的补偿型深度玻尔兹曼机{w,h⁽¹⁾,…,h^(t),m⁽¹⁾,…,m^(t)}的能量函数为：

其中，|m|^t＝m¹|m²|…|m^t表示将t种补偿信息的向量连接起来作为补偿层；为模型参数；W¹,…,W^t为深度玻尔兹曼机各个层之间的参数，为相应的补偿层参数。

4.根据权利要求1所述的一种文档建模方法，其特征在于，

所述文档为半结构化文档数据，设置标签信息作为网络的补偿信息，标签信息的种类数量作为补偿信息种类数。

5.根据权利要求1所述的一种文档建模方法，其特征在于，使用ContrastiveDivergence算法训练补偿型深度玻尔兹曼机。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于深圳爱拼信息科技有限公司，未经深圳爱拼信息科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201710617657.6/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载