[发明专利]基于序列化学习、关系挖掘、时序分析的新概念挖掘方法在审
申请号: | 201910280639.2 | 申请日: | 2019-04-09 |
公开(公告)号: | CN110321549A | 公开(公告)日: | 2019-10-11 |
发明(设计)人: | 牟昊;何宇轩;徐亚波;胡湛湛;李旭日 | 申请(专利权)人: | 广州数说故事信息科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F16/36 |
代理公司: | 广州恒华智信知识产权代理事务所(普通合伙) 44299 | 代理人: | 张培祥 |
地址: | 510000 广东省广州市天河区黄埔大道*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于序列化学习、关系挖掘、时序分析的新概念挖掘方法,可以通过句法依赖分析以及POS标注,将文本中可能出现的“概念”进行语义提取,通过时间序列的分析,判断识别“概念”在时间维度上,是否有从少到多,从无到有的变化过程,通过不同概念之间相互关系构建知识图谱,达到快速联想查询的效果,大幅度降低了传统产品研发需要人工查看原始数据量文本数据的需求;“新概念”的识别能够有效的帮助企业在生产过程中发现新的机会点,从而快速发觉竞争对手的研发动态和产品开发相关热门概念。 | ||
搜索关键词: | 新概念 关系挖掘 时序分析 序列化 研发 原始数据量 变化过程 产品开发 传统产品 关系构建 竞争对手 句法依赖 生产过程 时间维度 时间序列 文本数据 语义提取 挖掘 标注 图谱 分析 文本 热门 查询 学习 帮助 发现 | ||
【主权项】:
1.一种基于序列化学习、关系挖掘、时序分析的新概念挖掘方法,其特征在于,包括以下步骤:步骤1),获取文本,并将所述文本划分为若干个一定长度的词语串;步骤2),对文本进行POS算法的序列化标注,通过既定的序列化标注将所述词语串分为若干个不同性质的实体;步骤3),将上述步骤2中的实体向量化,并对所述词语串中成对同时出现的实体进行关系类型判断处理;步骤4),将上述步骤3中产生的关系对进行存储;步骤5),对上述步骤4中的实体进行第二标注并拟合时间序列,判断是否给该标注赋予一个供用户查看的标签。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州数说故事信息科技有限公司,未经广州数说故事信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910280639.2/,转载请声明来源钻瓜专利网。