[发明专利]一种新闻节目智能标签的融合推理系统和方法有效
申请号: | 201811528577.4 | 申请日: | 2018-12-13 |
公开(公告)号: | CN109635171B | 公开(公告)日: | 2022-11-29 |
发明(设计)人: | 温序铭;谢超平;王炜 | 申请(专利权)人: | 成都索贝数码科技股份有限公司 |
主分类号: | G06F16/906 | 分类号: | G06F16/906;G06F16/907;G06F16/36;G06K9/62 |
代理公司: | 成都弘毅天承知识产权代理有限公司 51230 | 代理人: | 李春芳 |
地址: | 610041 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 新闻 节目 智能 标签 融合 推理 系统 方法 | ||
1.一种新闻节目智能标签的融合推理系统,其特征在于:包括智能识别执行器、历史标签库、内部知识库、内部案例库以及分析推理器,
智能识别执行器:用于执行各类新闻节目素材的识别任务,对视频图像、语音以及文本信息进行基础标签提取;
历史标签库:用于存储素材、元数据和标签,所述历史标签库中素材包括文本、语音和视频图像;元数据包括素材的标题、关键字、创建时间、地点、类型信息;标签包括素材所涉及的领域、情感倾向、发生时间、人物、发生地点;
内部知识库:基于历史标签库建立的内部知识图谱,所述内部知识图谱的实体包括人物、国家、时政、事件,内部知识库用于补充智能识别结果,为后续分析推理提供更多信息;
内部案例库:基于历史标签库建立的案例集合,包括具有代表性的、拥有完整元数据和标签的案例,用于深度学习训练过程;
分析推理器:用于智能标签的融合推理,包含基于规则的推理器和基于深度学习的推理器;基于规则的推理器综合利用智能识别结果和内部知识库进行推理;基于深度学习的推理器利用内部案例库训练深度学习模型,再利用训练得到的模型进行推理;
基于规则的推理器进行推理时,包括如下步骤:
S4.1.1:分别将智能识别执行器所提取的基础标签和节目初始的相关元数据作为实体;
S4.1.2:利用实体消歧和共指消解等方法得到每一实体在内部知识库中的位置;
S4.1.3:以每一实体为中心节点提取出相邻节点和关系作为子图;
S4.1.4:将各实体的子图数据输入经过训练的GCN采用分布式图技术进行计算,推理得到节目领域;
S4.1.5:将基础标签和推理得到的节目领域作为第一候选新增标签集。
2.根据权利要求1所述的一种新闻节目智能标签的融合推理系统,其特征在于:所述智能识别执行器对各类新闻节目素材进行识别,识别过程采用人脸识别执行器、OCR执行器、语音识别执行器和NLP执行器。
3.一种新闻节目智能标签的融合推理方法,其特征在于,包括如下步骤:
S1、构建新闻知识库:利用历史标签库、历史素材库、互联网以及其他知识库构建新闻知识库;
S2、构建内部案例库:从历史标签库中抽取具有领域标签的文本素材以及带有场景标签的图片形成内部案例库,并将内部案例库中的案例文本数值化;
S3、训练深度学习模型:利用经过数值化的案例训练深度神经网络,所述深度神经网络的训练过程包括文本分类训练过程和场景识别训练过程;
S4、进行融合推理:根据输入节目的类型,使用智能识别执行器进行内容识别,提取基础标签,然后利用内部知识库对基础标签进行基于规则的推理来判断节目类别,得到第一候选新增标签集,以及利用训练好的深度神经网络进行文本分类或场景识别,得到第二候选新增标签集,用户对第一候选新增标签集和第二候选新增标签集进行选择和校正,输出最终节目标签;
基于规则的推理器进行推理时,包括如下步骤:
S4.1.1:分别将智能识别执行器所提取的基础标签和节目初始的相关元数据作为实体;
S4.1.2:利用实体消歧和共指消解等方法得到每一实体在内部知识库中的位置;
S4.1.3:以每一实体为中心节点提取出相邻节点和关系作为子图;
S4.1.4:将各实体的子图数据输入经过训练的GCN采用分布式图技术进行计算,推理得到节目领域;
S4.1.5:将基础标签和推理得到的节目领域作为第一候选新增标签集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都索贝数码科技股份有限公司,未经成都索贝数码科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811528577.4/1.html,转载请声明来源钻瓜专利网。