[发明专利]面向精细化内容重组的服务内容多重语义自动编码方法有效

专利信息
申请号: 202110507321.0 申请日: 2021-05-10
公开(公告)号: CN113343638B 公开(公告)日: 2023-10-13
发明(设计)人: 陆伟;罗卓然;钱佳佳;蔡乐;刘沛鹞 申请(专利权)人: 武汉大学
主分类号: G06F40/126 分类号: G06F40/126;G06F16/31;G06F16/35;G06N3/042;G06N3/048
代理公司: 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 代理人: 肖明洲
地址: 430072 湖*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 面向 精细 内容 重组 服务 多重 语义 自动 编码 方法
【权利要求书】:

1.一种面向精细化内容重组的服务内容多重语义自动编码方法,其特征在于,包括以下步骤:

步骤1:建立统一的自动编码标准库,规定统一的编码体系,建立分类体系,给予每一标签唯一的标识符;

所述自动编码标准库,编码框架由分类码、特征码和标识码三部分组成;

所述分类码用以确认服务内容资源所属的主题类别;

所述特征码用以标识服务内容资源的资源类型、语种、内容资源格式属性;

所述标识码包含著者号、发表时间、种次号和版本号;

步骤2:提取服务内容资源特定关键字信息,包括内容资源的标题、作者名称、发布时间、内容格式、语言类型;所述服务内容资源为文字资源或是已转换为文字的图像、音视频资源;

步骤3:在服务内容资源库中按标题+作者检索内容资源,若存在相同标题和作者的内容资源,只是版本不一样,则赋予新的版本号,直接存入服务内容资源库;若没有相同的服务内容资源,则进入步骤4;

步骤4:基于深度学习方法自动赋予内容资源唯一标识符,即自动生成内容资源编码,编码结束后将内容资源存入服务内容资源库;

具体实现包括以下子步骤:

步骤4.1:采用向量表示技术将服务内容资源字符向量化,得到内容资源特征向量;

步骤4.2:采用向量表示技术将编码字符向量化,得到编码特征向量;

步骤4.3:采用卷积循环神经网络对服务内容资源特征向量的每个窗口进行卷积操作,将每个窗口的文本表示进行组合,得到文本向量C;

步骤4.4:根据编码标准库中的分类体系自然生成编码之间的树状层级结构;通过结合父标签和子标签的向量来更新当前编码特征向量以解决标签不平衡的问题,得到编码向量A;

步骤4.5:采用注意力机制,根据文本向量C和编码向量A进行超维向量信息融合,获得向量V;

步骤4.6:对向量V进行标签判定,得到预测标签,使用正确标签和预测标签的二元交叉熵作为目标函数,完成内容资源的分类码自动编码;

步骤4.7:根据服务内容资源的外在属性以及编码标准,加入服务内容资源的特征码和标识码,组成完成的服务内容资源编码;

步骤4.8:将编码好的内容资源存入内容资源库。

2.根据权利要求1所述的面向精细化内容重组的服务内容多重语义自动编码方法,其特征在于:步骤1中,所述分类码用来确认服务内容资源所属的主题类别,将所有领域分为25个大类,再逐级划分下层类目,并为每个类别预先规定一个分类标识号,采用十进制数字来标识,子级分类用两个十进制数字表示,从01-99,若某资源不属于预先划分的任何一类,则当前层级用99表示,也表示该层无后续编码;如果一个资源同属于两个类别,使用“=”表示复分。

3.根据权利要求1所述的面向精细化内容重组的服务内容多重语义自动编码方法,其特征在于:步骤1中,所述特征码中资源类型编码标识的是内容的呈现形式,用2位大写字母标识;

所述特征码中语种标识符采用CSDL标准规范语种代码,使用3位小写字母标识内容资源的语言类型;

所述内容资源格式编码使用一位小写字母+两位十进制数字的固定长度编码,编码框架中含有文本、图像、音频和视频四大类内容格式,分别用t\p\a\v标识,后跟两位十进制数字标识各大类下的具体格式。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110507321.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top