[发明专利]面向精细化内容重组的服务内容多重语义自动编码方法有效
申请号: | 202110507321.0 | 申请日: | 2021-05-10 |
公开(公告)号: | CN113343638B | 公开(公告)日: | 2023-10-13 |
发明(设计)人: | 陆伟;罗卓然;钱佳佳;蔡乐;刘沛鹞 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06F40/126 | 分类号: | G06F40/126;G06F16/31;G06F16/35;G06N3/042;G06N3/048 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 肖明洲 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 精细 内容 重组 服务 多重 语义 自动 编码 方法 | ||
1.一种面向精细化内容重组的服务内容多重语义自动编码方法,其特征在于,包括以下步骤:
步骤1:建立统一的自动编码标准库,规定统一的编码体系,建立分类体系,给予每一标签唯一的标识符;
所述自动编码标准库,编码框架由分类码、特征码和标识码三部分组成;
所述分类码用以确认服务内容资源所属的主题类别;
所述特征码用以标识服务内容资源的资源类型、语种、内容资源格式属性;
所述标识码包含著者号、发表时间、种次号和版本号;
步骤2:提取服务内容资源特定关键字信息,包括内容资源的标题、作者名称、发布时间、内容格式、语言类型;所述服务内容资源为文字资源或是已转换为文字的图像、音视频资源;
步骤3:在服务内容资源库中按标题+作者检索内容资源,若存在相同标题和作者的内容资源,只是版本不一样,则赋予新的版本号,直接存入服务内容资源库;若没有相同的服务内容资源,则进入步骤4;
步骤4:基于深度学习方法自动赋予内容资源唯一标识符,即自动生成内容资源编码,编码结束后将内容资源存入服务内容资源库;
具体实现包括以下子步骤:
步骤4.1:采用向量表示技术将服务内容资源字符向量化,得到内容资源特征向量;
步骤4.2:采用向量表示技术将编码字符向量化,得到编码特征向量;
步骤4.3:采用卷积循环神经网络对服务内容资源特征向量的每个窗口进行卷积操作,将每个窗口的文本表示进行组合,得到文本向量C;
步骤4.4:根据编码标准库中的分类体系自然生成编码之间的树状层级结构;通过结合父标签和子标签的向量来更新当前编码特征向量以解决标签不平衡的问题,得到编码向量A;
步骤4.5:采用注意力机制,根据文本向量C和编码向量A进行超维向量信息融合,获得向量V;
步骤4.6:对向量V进行标签判定,得到预测标签,使用正确标签和预测标签的二元交叉熵作为目标函数,完成内容资源的分类码自动编码;
步骤4.7:根据服务内容资源的外在属性以及编码标准,加入服务内容资源的特征码和标识码,组成完成的服务内容资源编码;
步骤4.8:将编码好的内容资源存入内容资源库。
2.根据权利要求1所述的面向精细化内容重组的服务内容多重语义自动编码方法,其特征在于:步骤1中,所述分类码用来确认服务内容资源所属的主题类别,将所有领域分为25个大类,再逐级划分下层类目,并为每个类别预先规定一个分类标识号,采用十进制数字来标识,子级分类用两个十进制数字表示,从01-99,若某资源不属于预先划分的任何一类,则当前层级用99表示,也表示该层无后续编码;如果一个资源同属于两个类别,使用“=”表示复分。
3.根据权利要求1所述的面向精细化内容重组的服务内容多重语义自动编码方法,其特征在于:步骤1中,所述特征码中资源类型编码标识的是内容的呈现形式,用2位大写字母标识;
所述特征码中语种标识符采用CSDL标准规范语种代码,使用3位小写字母标识内容资源的语言类型;
所述内容资源格式编码使用一位小写字母+两位十进制数字的固定长度编码,编码框架中含有文本、图像、音频和视频四大类内容格式,分别用t\p\a\v标识,后跟两位十进制数字标识各大类下的具体格式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110507321.0/1.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法