[发明专利]基于协同自扩展的命名实体集合扩展方法及查询推荐方法有效
申请号: | 201410293658.6 | 申请日: | 2014-06-26 |
公开(公告)号: | CN105205075B | 公开(公告)日: | 2018-12-07 |
发明(设计)人: | 孙乐;石贝 | 申请(专利权)人: | 中国科学院软件研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京君尚知识产权代理事务所(普通合伙) 11200 | 代理人: | 司立彬 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于协同自扩展的命名实体集合扩展方法及查询推荐方法。本方法为:1)根据输入的种子集合,对每一种子生成一模板并对该模板的质量进行评估;2)利用选取的模板进行实例抽取,并建立每一所选模板的模板‑实例关系;3)对于每一所选模板,根据所有所选模板的模板‑实例关系计算被该模板抽取的实例是正实例的概率,然后根据概率值选取若干正实例和具有区分能力的负实例加入到该种子集合中;4)持续迭代上述步骤1)~3),直至该种子集合中抽取的正实例的数目达到预设的阈值;其中得到的正实例集合作为扩展后的具有同一类别的命名实体集合,负实例为该命名实体集合的边界。本发明大大增强了种子的描述能力,提高了查询性能。 | ||
搜索关键词: | 基于 协同 扩展 命名 实体 集合 方法 查询 推荐 | ||
【主权项】:
1.一种基于协同自扩展的命名实体集合扩展方法,其步骤为:1)根据输入的种子集合,对每一种子生成一模板并对该模板的质量进行评估;2)利用评估选取的模板进行实例抽取,并建立每一所选模板的模板‑实例关系;3)对于每一所选模板,根据所有所选模板的模板‑实例关系计算被该模板抽取的实例是正实例的概率,然后根据概率值选取若干正实例和具有区分能力的负实例加入到该种子集合中;4)持续迭代上述步骤1)~3),直至该种子集合中抽取的正实例的数目达到预设的阈值;其中得到的正实例集合作为扩展后的具有同一类别的命名实体集合,负实例为该命名实体集合的边界;其中,对所述模板的质量进行评估的方法为:根据每个模板的抽取情况和实例的极性,将所有模板已抽取出的实体按照实体有没有被该模板被抽取和实体是否属于种子集合对应的语义类别划分为四类:ep为被抽取的正实例,en为被抽取的负实例,nep为没有被抽取的正实例,nen为没有被抽取的负实例;然后计算该模板普适性、抽取准确率和未抽取准确率,对该模板质量进行评估;所述普适性为所述抽取准确率为所述未抽取准确率为
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院软件研究所,未经中国科学院软件研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410293658.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种甜玉米人参奶茶及其制备方法
- 下一篇:一种电商网站的页面信息获取方法