[发明专利]一种基于深度语义辨析的文本推荐方法有效
申请号: | 201710000406.3 | 申请日: | 2017-01-03 |
公开(公告)号: | CN107832312B | 公开(公告)日: | 2023-10-10 |
发明(设计)人: | 郐弘智;陈建辉;盛文瑾;闫健卓 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/953;G06F16/9532;G06F16/332;G06F16/36 |
代理公司: | 北京瑞盛铭杰知识产权代理事务所(普通合伙) 11617 | 代理人: | 韩剑峰 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 语义 辨析 文本 推荐 方法 | ||
1.一种基于深度语义辨析的文本推荐方法,其特征在于,所述文本推荐方法包含如下步骤:
步骤1:基于类脑“分层-发散”思考模式构建深度语义网格模型;
步骤2:结合“网格主题-同义词袋”模型和词匹配技术推理文本的网格主题集,利用网格模型的“联想-记忆”功能将分散的主题联结,然后利用情景语义分析功能推理不同激活主题在当前文本下的情景标签,最后构建融合多种情景语义以及记忆联结的文本主题树;
步骤3:根据用户兴趣对文本主题树进行剪枝处理,即过滤掉不符合用户当前情景状态的主题和关系,从而构建基于情景语义筛选的文本主题树;
步骤4:利用TF-IDF算法统计数据库中所有经过情景语义筛选后的文本主题树,计算主题的权重值并映射到相应的网格主题节点中,为每篇文档构建出用户文本兴趣画像;
步骤5:根据伪相关反馈方法抽取出与用户查询内容相关的文档以及相应的情景语义筛选后的文本主题树,统计反馈树中主题的频次并做归一化处理得到初始兴趣主题激活值;
步骤6:利用激活扩散机制计算反馈学习下初始兴趣网格主题与潜在兴趣网格主题的全局动态激活值,将计算结果赋值给网格模型中相应的主题节点,构建融合当前情景语义的用户查询兴趣画像;
步骤7:利用基于网格的余弦相似度计算方法,为用户查询兴趣画像和用户文本兴趣画像之间的深度语义相关度进行评分,并生成推荐列表进行推荐。
2.如权利要求1所述的一种基于深度语义辨析的文本推荐方法,其特征在于,步骤1中所述的深度语义网格模型是依据类脑“分层-发散”思维模式构建的,所述构建过程具体包括:
第一步,选取具有多领域融合的分类本体,利用Stanford大学的自然语言处理工具对本体中主题作语义拆分和词性还原处理得到核心主题集,按照本体的记忆特性将核心主题连接成发散的网格模型;
第二步,构建“网格主题-同义词袋”语义映射模型,“主题”代表分层网格模型中核心主题,“词袋”是通过抽取上述主题在WordNet词典中的同义术语集合组成。若“主题-词袋”模型中术语在文本中出现,则该主题被激活并将对应的网格节点属性设置为“1”,实现文本浅层语义主题挖掘功能;
第三步,遍历DBpedia知识库中“主题-标签-摘要”三元组,将三元组中主题与“主题-词袋”模型中术语进行匹配并抽取知识库中匹配主题对应的标签和摘要数据,将“网格主题-DBpedia主题-标签-摘要”逐层映射,并用语义相关关系类型进行关联;
第四步,以“分层-记忆”网格模型为骨架,实现“同义词袋-网格主题-DBpedia主题-标签-摘要”融合的“发散-深层”语义网格模型。
3.如权利要求1所述的一种基于深度语义辨析的文本推荐方法,其特征在于,步骤2中采用了基于DBpedia知识库的主题情景语义辨析方法,所述语义辨析方法的具体步骤如下:
第一步,生成文档中激活主题s动态跨度加窗后上下文的术语集合,Keys。
第二步,生成DBpedia知识库中激活主题s所对应的不同情景标签m下摘要的术语集合,Tm,s;统计情景标签下的摘要术语个数,Nm。
第三步,根据以下公式计算主题情景语义相似度:
其中counter(Tm,s,Keys)表示集合Tm,s与Keys中术语的共现频次。
第四步,选取最大相关度摘要所对应的情景标签作为文档激活主题s的情景语义状态,形成“文本-激活主题-情景标签”三元组。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710000406.3/1.html,转载请声明来源钻瓜专利网。