[发明专利]标题纠错方法和装置有效
申请号: | 201910617118.1 | 申请日: | 2019-07-10 |
公开(公告)号: | CN110134970B | 公开(公告)日: | 2019-10-22 |
发明(设计)人: | 邓卓彬;罗希意;赖佳伟;付志宏;何径舟 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F16/31;G06F16/33 |
代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 王一;武晨燕 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例提出一种标题纠错方法和装置,方法包括:基于语料库获取待纠错标题中的每个词语片段的第一召回词;根据待纠错标题向标题检索库发送检索请求,从标题检索库中获取待纠错标题的相似标题,标题检索库在接收到检索请求时进行数据更新;根据相似标题获取每个词语片段的第二召回词;对每个词语片段的第一召回词和第二召回词进行特征计算;确定每个词语片段的候选召回词;基于每个词语片段的候选召回词对待纠错标题进行纠错。本发明实施例从预设标题检索库获取的相似标题获取第二召回词,可以有效弥补通过语料库获取的第一召回词可能存在的召回不足的问题。通过第一召回词和第二召回词可以实现从不同维度全面的对待纠错标题进行纠错。 | ||
搜索关键词: | 纠错 检索库 词语 方法和装置 检索请求 语料库 数据更新 特征计算 维度 预设 发送 | ||
【主权项】:
1.一种标题纠错方法,其特征在于,包括:基于语料库,获取待纠错标题中的每个词语片段的第一召回词;根据所述待纠错标题,向标题检索库发送检索请求,所述标题检索库在接收到所述检索请求时进行数据更新;根据所述检索请求和所述待纠错标题的文本内容,从所述标题检索库中获取所述待纠错标题的相似标题;根据所述相似标题,获取所述每个词语片段的第二召回词;对所述每个词语片段的第一召回词和第二召回词分别进行特征计算;根据特征计算结果,确定所述每个词语片段的候选召回词;基于所述每个词语片段的候选召回词对所述待纠错标题进行纠错。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910617118.1/,转载请声明来源钻瓜专利网。