[发明专利]用于独立于领域的术语链接的系统和方法在审
申请号: | 201880090468.0 | 申请日: | 2018-12-27 |
公开(公告)号: | CN111742321A | 公开(公告)日: | 2020-10-02 |
发明(设计)人: | 丁海波;贺一帆;赵林;徐魁;冯哲 | 申请(专利权)人: | 罗伯特·博世有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/216;G06N5/02 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 张健;刘春元 |
地址: | 德国斯*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 立于 领域 术语 链接 系统 方法 | ||
1.一种用于将术语自动链接到知识库节点的自动术语链接系统,所述系统包括:
候选者生成器,其被配置成使用出现统计信息针对要链接到知识库节点的每个术语来标识候选者节点,其中被确定为不具有候选者的每个术语被标识为无候选者术语;
伪候选者生成器,其被配置成针对要链接到知识库节点的无候选者术语来标识伪候选者节点;以及
候选者评分器,其被配置成使用对应于候选者和伪候选者的知识库节点的出现统计信息和共现统计信息、通过集体推理来分别对候选者节点和伪候选者节点进行评分,
其中伪候选者生成器被配置成将与所述无候选者术语在语义上相关的知识库节点标识为所述无候选者术语的伪候选者节点,
其中所述术语被链接到与针对所述术语的最高得分的候选者节点相对应的知识库节点,以及
其中所述无候选者术语被链接到与针对所述无候选者术语的最高得分的伪候选者相对应的知识库节点。
2.根据权利要求1所述的系统,进一步包括:
知识库统计信息计数器,其被配置成确定针对知识库节点的出现统计信息和共现统计信息。
3.根据权利要求1所述的系统,其中候选者生成器被配置成接收文档以及文档中的术语列表作为输入。
4.根据权利要求3所述的系统,进一步包括:
文档生成器,其被配置成利用链接到知识库的相关联节点的术语来生成技术文档。
5.根据权利要求1所述的系统,其中伪候选者生成器被配置成:将作为与所述无候选者术语的近义词的知识库节点标识为针对所述无候选者术语的伪候选者。
6.根据权利要求1所述的系统,其中伪候选者生成器被配置成:将与所述无候选者术语共享单词的知识库节点标识为针对所述无候选者术语的伪候选者。
7.根据权利要求1所述的系统,其中伪候选者生成器被配置成:将与所述无候选者术语在分布上相似的知识库节点标识为针对所述无候选者术语的伪候选者。
8.根据权利要求1所述的系统,其中所述无候选者术语与知识库节点之间的分布相似性是使用未链接的术语和知识库节点的向量表示来确定的。
9.一种用于将术语自动链接到知识库节点的方法,所述方法包括:
利用候选者生成器、使用出现统计信息针对要链接到知识库节点的每个术语来标识候选者节点,其中被确定为不具有候选者的每个术语被标识为无候选者术语;
使用伪候选者生成器针对将链接到知识库节点的无候选者术语来标识伪候选者节点;以及
使用知识库节点的出现统计信息和共现统计信息、通过集体推理来对候选者节点和伪候选者节点进行评分;
将所述术语链接到针对该术语的最高得分的候选者;以及
将所述无候选者术语与针对该无候选者术语的最高得分的伪候选者进行链接,
其中伪候选者生成器被配置成将与所述无候选者术语在语义上相关的知识库节点标识为所述无候选者术语的伪候选者节点。
10.根据权利要求9所述的方法,进一步包括:
使用知识库统计信息计数器来确定针对知识库节点的出现统计信息和共现统计信息。
11.根据权利要求9所述的方法,其中候选者生成器被配置成接收文档以及文档中的术语列表作为输入。
12.根据权利要求11所述的方法,进一步包括:
利用链接到知识库的相关联节点的术语来生成技术文档。
13.根据权利要求9所述的方法,其中伪候选者生成器被配置成:将作为与所述无候选者术语的近义词的知识库节点标识为针对所述无候选者术语的伪候选者。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于罗伯特·博世有限公司,未经罗伯特·博世有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880090468.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:信号和事件处理引擎
- 下一篇:用于个人UV暴露测量的装置和系统