[发明专利]知识库构建方法及装置在审
申请号: | 201811384346.0 | 申请日: | 2018-11-20 |
公开(公告)号: | CN109614498A | 公开(公告)日: | 2019-04-12 |
发明(设计)人: | 郑博;叶天生;梁栋;王宏志 | 申请(专利权)人: | 北京松鼠山科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/31 |
代理公司: | 北京卓唐知识产权代理有限公司 11541 | 代理人: | 唐海力;李志刚 |
地址: | 100020 北京市朝阳区利*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 金融数据 关联 知识库 知识库构建 时间属性 比对 写入 时间生成 实时确定 数据更新 关联性 归类 存储 申请 统计 | ||
本申请公开了一种知识库构建方法及装置。方法包括对所有待关联金融数据进行两两比对,以确定进行比对的待关联金融数据之间是否存在相关联的属性;将两两之间具有相关联属性的待关联金融数据进行关联,以得到关联金融数据;将关联金融数据写入知识库时,实时确定每个关联金融数据写入所述知识库的时间,以根据所述时间生成对应的时间属性;对加入所述知识库中的每个关联金融数据添加对应的所述时间属性;并得到数据更新后的知识库。从而可以确定各个待关联金融数据之间的相互关联性,从而便于对金融数据进行统计或归类。此外,还能在使关联金融数据存储进知识库之后彼此间能够产生时间上的联系。
技术领域
本申请涉及知识库数据处理技术领域,具体而言,涉及一种适用于金融数据的知识库构建方法及装置。
背景技术
随着金融数据模式的多样化,原本只基于文本金融数据的KBC(知识库构建)技术已经逐渐落后。
在金融领域中,需要对许多金融数据进行关联,以便对金融数据进行统计或归类,但是由于金融数据的来源不同,从而导致具有关联关系的金融数据的记录方式不同,例如,对于金融数据的名称,有些金融数据记录的是全称,有些金融数据记录的是简称,还有一些金融数据记录的是英文简写,从而导致金融数据不能进行有效关联,上述问题目前尚未提出有效的解决方法。
此外,金融数据在生成候选集的时候,候选关系的生成没有考虑时效性,有的候选关系可能随着时间的推移而不再存在,但是知识库中并没有更新。
针对相关技术中存在的问题,目前尚未提出有效的解决方案。
发明内容
本申请的主要目的在于提供一种将金融数据进行准确有效关联,且将其进行存储时有效考虑时效性的知识库构建方法及装置,以解决相关技术中存在的问题。
为了实现上述目的,根据本申请的一个方面,提供了一种知识库构建方法。
根据本申请的知识库构建方法包括:
对所有待关联金融数据进行两两比对,以确定进行比对的待关联金融数据之间是否存在相关联的属性;其中,所述待关联金融数据包括两个或两个以上;
将两两之间具有相关联属性的待关联金融数据进行关联,以得到关联金融数据;
将关联金融数据写入知识库时,实时确定每个关联金融数据写入所述知识库的时间,以根据所述时间生成对应的时间属性;
对加入所述知识库中的每个关联金融数据添加对应的所述时间属性;并得到数据更新后的知识库。
进一步的,如前述的知识库构建方法,所述对所有待关联金融数据进行两两比对,以确定进行比对的待关联金融数据之间是否存在相关联的属性,包括:
预先设定用于判断进行比对的待关联金融数据之间是否相似的相似度阈值;
分别确定所述进行比对的待关联金融数据的属性的语义和语法;
根据所述进行比对的待关联金融数据的属性的语义和语法,确定所述进行比对的待关联金融数据之间的相似度;
当所述相似度大于或等于所述相似度阈值时,判定所述进行比对的待关联金融数据之间存在相关联的属性。
进一步的,如前述的知识库构建方法,所述将两两之间具有相关联属性的待关联金融数据进行关联,以得到关联金融数据,包括:
利用度量学习得到的模型,对所述存在相关联的属性的待关联金融数据进行筛选;
将符合所述模型的要求的待关联金融数据确定为具有相同属性的待关联金融数据;
将具有相同属性的待关联金融数据进行关联,以得到关联金融数据。
进一步的,如前述的知识库构建方法,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京松鼠山科技有限公司,未经北京松鼠山科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811384346.0/2.html,转载请声明来源钻瓜专利网。