[发明专利]一种基于深度学习的推荐方法在审
申请号: | 201911059150.9 | 申请日: | 2019-11-01 |
公开(公告)号: | CN110929148A | 公开(公告)日: | 2020-03-27 |
发明(设计)人: | 杨勇;黄淑英;方玉明 | 申请(专利权)人: | 杨勇 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F40/30;G06F16/35;G06N3/04;G06N3/08 |
代理公司: | 北京汇信合知识产权代理有限公司 11335 | 代理人: | 张焕响 |
地址: | 330036 江西*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 推荐 方法 | ||
1.一种基于深度学习的推荐方法,其特征在于,包括以下步骤:
步骤一:对推荐项目的内容进行划分,将文本信息进行文本结构统一,形成内容文本;
步骤二:对内容文本进行数据预处理,具体包括对内容文本进行词组拆分、语义提取、语义延伸和词组重组;
步骤三:构建一个深度神经网络模型,并训练深度神经网络模型,然后利用训练好的深度神经网络模型对经过数据预处理的内容文本进行特征提取;
步骤四:对提取的特征进过滤处理,然后基于过滤处理后的特征进行内容推荐。
2.根据权利要求1所述的一种基于深度学习的推荐方法,其特征在于:所述步骤一中对推荐项目的内容进行划分时,具体为将推荐内容按照文本信息、图片内容和链接三个类别进行划分。
3.根据权利要求1所述的一种基于深度学习的推荐方法,其特征在于:所述步骤一中将文本信息进行文本结构统一,形成内容文本的具体过程为:将非结构化和半结构化的文本信息转换成结构化的文本信息,形成内容文本,首先选择文本信息的范围,然后建立分类文本语料库训练文本信息。
4.根据权利要求1所述的一种基于深度学习的推荐方法,其特征在于:所述步骤二中对内容文本进行数据预处理前,需要先对内容文本进行压缩处理,去除重复无用的词组,具体为:建立两个存放字符的列表来完成,并按照不同情况,将其放入list1或list2列表或触发压缩判断,若得出重复则压缩去除。
5.根据权利要求4所述的一种基于深度学习的推荐方法,其特征在于:所述压缩去除的规则为:
如果读入的当前字符与list1的首字符相同,而list2没有放入的国际字符,则将这个字符放入list2中;
如果读入的当前字符与list1的首字符相同,而list2也有国际字符,则触发压缩判断,若得出重复,则进行压缩去除,清空第二个列表;
如果读入的当前字符与list1的首字符相同,而list2也有国际字符,则触发压缩判断,若得出不重复,则清空两个列表,把读入的这个字符放入list1第一个位置;
如果读入的当前字符与list1的首字符不相同,触发压缩判断,如果得出重复,且列表所含国际字符数目大于等于2,则进行压缩去除,清空两个列表,把读入的这个字符放入list1第一个位置;
如果读入的当前字符与list1的首字符不相同,触发压缩判断,若得出不重复,且list2没有放入国际字符,则继续在list1放入国际字符;
如果读入的当前字符与list1的首字符不相同,触发压缩判断,若得出不重复,且list2已放入国际字符,则继续在list2放入国际字符;
读完所有国际字符后,触发压缩判断,对list1以及list2有意义部分进行比较,若得出重复,则进行压缩去除。
6.根据权利要求1所述的一种基于深度学习的推荐方法,其特征在于:所述步骤二中对内容文本进行词组拆分的具体过程为:将连续或不连续的内容文本按照短语或词组的方式进行拆分,形成具有真实语义的短语或词组。
7.根据权利要求6所述的一种基于深度学习的推荐方法,其特征在于:所述步骤二中的语义提取具体过程为:对经过词组拆分后得到的短语或词组进行语义提取;
所述语义延伸的具体过程为:对经过语义提取的短语或词组进多角度的语义延伸,得到多个延伸短语或词组;
所述词组重组的具体过程为:将经过语义提取后的短语或词组和延伸短语或词组进行重组,得到重组内容文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杨勇,未经杨勇许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911059150.9/1.html,转载请声明来源钻瓜专利网。