[发明专利]得到和搜索结构化语义知识的方法及对应装置有效
申请号: | 201110447926.1 | 申请日: | 2011-12-28 |
公开(公告)号: | CN103186556A | 公开(公告)日: | 2013-07-03 |
发明(设计)人: | 赵世奇;方高林;王海峰 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京鸿德海业知识产权代理事务所(普通合伙) 11412 | 代理人: | 袁媛 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: |
本发明提供了一种得到和搜索结构化语义知识的方法及对应装置,从已有语料中抽取出实体类型E的实体ei;从搜索日志中获取所有包含E的搜索项(query),从query中E之前出现的实词抽取候选需求限定词dm,构成候选需求限定词集合{dm};从大规模语料库中抽取出包含属于E的ei且包含{dm}中至少一个候选需求限定词的句子,从句子中选择出现次数满足第二出现次数要求的候选需求限定词作为需求限定词cj,确定所抽取句子中cj和ei构成的词语对 |
||
搜索关键词: | 得到 搜索 结构 语义 知识 方法 对应 装置 | ||
【主权项】:
一种得到结构化语义知识的方法,其特征在于,该方法包括:S1、对已有语料进行分词处理和命名实体识别,抽取出实体类型E的实体ei;S2、从搜索日志中获取所有包含所述E的搜索项query,从query中所述E之前出现的实词抽取候选需求限定词dm,构成候选需求限定词集合{dm};S3、从大规模语料库中抽取出包含属于所述E的ei且包含所述{dm}中至少一个候选需求限定词的句子,从句子中选择出现次数满足第二出现次数要求的候选需求限定词作为需求限定词cj,确定所抽取句子中cj和ei构成的词语对;S4、将存入实体类型E对应的结构化数据库EKBase。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201110447926.1/,转载请声明来源钻瓜专利网。