[发明专利]出版物资源整合方法与出版物资源整合系统在审
申请号: | 202110448632.4 | 申请日: | 2021-04-25 |
公开(公告)号: | CN113177150A | 公开(公告)日: | 2021-07-27 |
发明(设计)人: | 夏国兵 | 申请(专利权)人: | 新华智云科技有限公司 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/958;G06F8/30 |
代理公司: | 杭州裕阳联合专利代理有限公司 33289 | 代理人: | 田金霞 |
地址: | 310012 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 出版物 资源整合 方法 系统 | ||
1.一种出版物资源整合方法,其特征在于,所述方法包括:
从业务系统获取多个出版物资源数据同步至数据存储单元;
从出版物资源网站和业务系统抓取运营数据,发送至数据存储单元;
将每一个出版物资源数据进行数据处理,以将每一类出版物资源数据标准化,以将不同的出版物资源数据之间建立关联;
基于所有出版物资源数据建立Elasticsearch索引,将所有出版物资源数据导入Elasticsearch搜索引擎;所述Elasticsearch索引包括多条记录,每一条记录对应一个出版物资源数据。
2.根据权利要求1所述的出版物资源整合方法,其特征在于,从业务系统获取出版物资源数据同步至数据存储单元,包括:
基于Dataworks数据采集脚本将业务系统中的多个出版资源数据同步至数据存储单元。
3.根据权利要求2所述的出版物资源整合方法,其特征在于,所述从出版物资源网站和业务系统抓取运营数据,发送至数据存储单元,包括:
基于爬虫服务、埋点服务和日志服务中的一种或多种抓取运营数据,将运营数据发送至数据存储单元。
4.根据权利要求3所述的出版物资源整合方法,其特征在于,所述将每一个出版物资源数据进行数据处理,以将每一类出版物资源数据标准化,以将不同的出版物资源数据之间建立关联,包括,包括:
建立各类出版物资源的接口标准;
对每一个出版物资源数据依据其对应的接口标准进行标准化处理,贴附标签。
5.根据权利要求4所述的出版物资源整合方法,其特征在于,所述建立各类出版物资源的API接口标准,包括:
建立图书接口标准,所述图书接口标准包括书名、原书名、作者、原书作者、译者、WBS编号、物料号、ISBN编号、E-ISBN编号、定价、ERP定价中的一种或多种标签;
建立音频接口标准,所述音频接口标准包括版号、学科分类、题材、总集数、主讲人、类别、审核和时长中的一种或多种标签;
建立视频接口标准,所述视频接口标准包括版号、学科分类、题材、总集数、主讲人、类别、审核和时长中的一种或多种标签;
建立图片接口标准,所述视频接口标准包括分类、栏目、封面、关键词、名称、来源、简介和缩略图中的一种或多种标签;
建立资讯接口标准,所述资讯接口标准包括读者ID、读者层次、分类、省份、城市中的一种或多种标签。
6.根据权利要求5所述的出版物资源整合方法,其特征在于,所述将每一个出版物资源数据进行数据处理,以将每一类出版物资源数据标准化,以将不同的出版物资源数据之间建立关联,还包括:
对每一个出版物资源数据中的各类素材进行媒体处理和内容审核。
7.根据权利要求6所述的出版物资源整合方法,其特征在于,所述对每一个出版物资源数据中的各类素材进行媒体处理和内容审核包括:
选取一个出版物资源数据;
将所述出版物资源数据中的文本类素材进行文档处理;
将所述出版物资源数据中的图片类素材进行转码处理,生成转码后的图片类素材,并将转码后的图片类素材进行水印处理;
将所述转码后的图片类素材进行内容识别处理,生成结构化的图片类素材数据;
将所述出版物资源数据中的音视频类素材进行音频转码处理和/或视频转码处理,以及语音识别处理,生成结构化的音视频类素材数据;
对经前述四个步骤处理后生成的数据进行内容安全审核,审核通过后整合为与所述出版物资源数据对应的素材数据;
反复执行前述六个步骤,直至所有的出版物资源数据中的各类素材均进行过媒体处理和内容审核。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新华智云科技有限公司,未经新华智云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110448632.4/1.html,转载请声明来源钻瓜专利网。