[发明专利]基于资讯分类的场景应用方法、系统、介质及设备有效
申请号: | 201910786293.3 | 申请日: | 2019-08-23 |
公开(公告)号: | CN110688453B | 公开(公告)日: | 2023-09-08 |
发明(设计)人: | 王旭阳;孙沛基;朱悦;刘晋元;潘永春 | 申请(专利权)人: | 上海市研发公共服务平台管理中心;上海科技发展有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F16/958 |
代理公司: | 上海光华专利事务所(普通合伙) 31219 | 代理人: | 徐秋平 |
地址: | 200235 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 资讯 分类 场景 应用 方法 系统 介质 设备 | ||
1.一种基于资讯分类的场景应用方法,其特征在于,所述基于资讯分类的场景应用方法包括:
将资讯数据进行格式化预处理,以生成符合格式的资讯文本;
对所述资讯文本按照资讯源进行资讯源属性处理,以生成资讯源属性处理结果;所述资讯源属性处理结果包括资讯源特征结果和资讯应用场景的相关性结果;分析所述资讯文本的资讯源,以确定所述资讯源的类别;所述资讯源的类别包括:综合媒体、公共平台、管理单位、研究机构和/或行业媒体;将所述资讯文本按照资讯源分入其中一个资讯源的类别中,以得到资讯源特征结果;通过权重计算,校准所述资讯源的类别对于不同的应用场景的重要性,以确定资讯应用场景的相关性结果,所述资讯应用场景的相关性结果是指每一个所述应用场景在不同的资讯源的类别中产生的依赖度比值;
根据所述资讯应用场景对所述资讯源属性处理结果进行应用场景属性处理,以提取所述资讯文本的应用场景特征词后,生成不同的应用场景特征词库;
对资讯文本进行词频指数计算,以便将计算结果结合所述资讯源属性处理结果和所述应用场景特征词库进行资讯的针对性推送;所述针对性推送包括隐藏操作、更新操作、新增操作和/或关联入库操作;
其中,对资讯文本进行词频指数计算,以便将计算结果结合所述资讯源属性处理结果和所述应用场景特征词库进行资讯的针对性推送的步骤包括:计算所述资讯文本中每一段落的目标词汇的词频指数,以将所述词频指数结合预设规则确定每一段落的核心词汇;所述预设规则包括将所述词频指数进行降序排列后,提取顺序在前的若干位所述词频指数对应的目标词汇,所述目标词汇指按照文章类别选取的词汇,包括科技词汇;在所述应用场景特征词库中对所述核心词汇进行语义匹配,以筛选出匹配结果大于预设值的核心词汇所在的资讯文本;将所述资讯文本结合所述资讯源的类别生成资讯源三元组群,并结合所述应用场景特征词库生成特征词三元组群;结合所述资讯源三元组群和所述特征词三元组群,确定所述特征词三元组群中的核心词汇所属的应用场景的类别;选取排序之后前三位的所述核心词汇,并查找每一个所述核心词汇对应的应用场景的类别,以确定该应用场景的类别依赖度最高的资讯源;将所述资讯文本推送至所确定的依赖度最高的资讯源,并进行针对性操作。
2.根据权利要求1所述的基于资讯分类的场景应用方法,其特征在于,所述将资讯数据进行格式化预处理,以生成符合格式的资讯文本的步骤包括:
对所述资讯数据进行降噪处理,以得到净化后的资讯文本;所述降噪处理包括符号降噪和文本降噪;
利用词嵌入技术对所述资讯文本进行分词标注处理,以通过标注能区分出特定短语;所述特定短语包括:时间短语、姓名短语和/或机构短语;
通过语法机对带有特定短语标注的所述资讯文本进行语法解构;
利用格式机将所述语法解构的资讯文本按照预设格式进行存储,所述预设格式由格式器确定,所述格式器用于对所述资讯文本的字段进行规范格式的转换和缺省值的补充。
3.根据权利要求1所述的基于资讯分类的场景应用方法,其特征在于:
所述应用场景的类别包括:成果类、讣告类、聘用类、企业产业类、诚信和道德问题类、榜单类、荣誉类、宏观统计报告类、会议类、媒体热点类和/或政策类。
4.根据权利要求1所述的基于资讯分类的场景应用方法,其特征在于,所述根据所述资讯应用场景对所述资讯源属性处理结果进行应用场景属性处理,以提取所述资讯文本的应用场景特征词后,生成不同的应用场景特征词库的步骤包括:
抽取所述资讯文本中的名词和/或动词短语作为应用场景特征词;
统计所述应用场景特征词所在的文档数量;所述文档数量是指所有的所述资讯文本构成的文档总数;
筛选出所述文档数量在预设范围内的若干个所述应用场景特征词;
通过若干个所述应用场景特征词之间的依赖系数计算并结合所述资讯文本的语义向量,将所述应用场景特征词分入匹配的应用场景的类别中,构成应用场景特征词库。
5.根据权利要求1所述的基于资讯分类的场景应用方法,其特征在于,
所述针对性操作包括:针对讣告类的专家进行隐藏操作、对聘用类的任职机构进行更新、荣誉奖项类的新增操作和/或名单类的批量关联入库操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海市研发公共服务平台管理中心;上海科技发展有限公司,未经上海市研发公共服务平台管理中心;上海科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910786293.3/1.html,转载请声明来源钻瓜专利网。