[发明专利]一种面向事件检索的多事件成分混合反馈方法与系统在审
申请号: | 202111560808.1 | 申请日: | 2021-12-20 |
公开(公告)号: | CN113946659A | 公开(公告)日: | 2022-01-18 |
发明(设计)人: | 王鹏鸣 | 申请(专利权)人: | 华东交通大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33 |
代理公司: | 北京中济纬天专利代理有限公司 11429 | 代理人: | 黄攀 |
地址: | 330000 江西省南*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 事件 检索 多事 成分 混合 反馈 方法 系统 | ||
1.一种面向事件检索的多事件成分混合反馈方法,其特征在于,所述方法包括如下步骤:
步骤一,为已知事件集合中的每个已知事件构建已知事件语言模型:
在带有事件标注的语料库中,为所有已知事件分别取出预设篇数的文档,通过在不同的已知事件集合中统计各个词项出现的频度,来构建对应的已知事件语言模型;
步骤二,查询隐藏目标事件;
根据所述已知事件集合与各隐藏目标事件构建得到完备事件集合,通过隐藏目标事件在完备事件集合中的概率分布,模拟构建以得到伪反馈文档集合的log-似然函数,通过期望最大化方法对所述伪反馈文档集合的log-似然函数最大化之后,再根据用户的初始查询模型在最大化之后的似然函数中进行查询以确认得到隐藏目标事件;
步骤三,对用户的初始查询模型进行更新;
根据查询确认得到的隐藏目标事件,对用户的初始查询模型进行更新以得到改进后的新查询模型;
步骤四,获得检索结果;
根据所述改进后的新查询模型重新进行检索,通过新查询模型与文档模型之间的KL-散度对应的分值来确定得到更准确的检索结果。
2.根据权利要求1所述的一种面向事件检索的多事件成分混合反馈方法,其特征在于,所述步骤二具体包括:
根据所述已知事件集合与各隐藏目标事件构建得到完备事件集合;
通过隐藏目标事件在完备事件集合中的概率分布,结合查询的伪反馈文档中词项的分布模型,得到伪反馈文档集合中词项的生成概率;
根据伪反馈文档集合中词项的生成概率构建以得到伪反馈文档集合的log-似然函数;
通过期望最大化方法对所述伪反馈文档集合的log-似然函数进行最大化处理;
根据用户的初始查询模型在最大化之后的似然函数中进行查询以确认得到隐藏目标事件。
3.根据权利要求2所述的一种面向事件检索的多事件成分混合反馈方法,其特征在于,根据所述已知事件集合与各隐藏目标事件构建得到完备事件集合的步骤中,已知事件集合表示为,表示第个已知事件,隐藏目标事件表示为,完备事件集合表示为,表示已知事件中的词项的数量。
4.根据权利要求3所述的一种面向事件检索的多事件成分混合反馈方法,其特征在于,在通过隐藏目标事件在完备事件集合中的概率分布,结合查询的伪反馈文档中词项的分布模型,得到伪反馈文档集合中词项的生成概率的步骤中,隐藏目标事件在完备事件集合中的概率分布表示为:
其中,表示隐藏目标事件在完备事件集合中的概率分布,,表示第个已知事件,表示隐藏目标事件为已知事件的概率值,,表示未知事件,表示隐藏目标事件为第个已知事件的概率,表示隐藏目标事件为未知事件的概率。
5.根据权利要求4所述的一种面向事件检索的多事件成分混合反馈方法,其特征在于,所述伪反馈文档集合中词项的生成概率表示为:
其中,表示伪反馈文档集合中词项的生成概率,表示伪反馈文档中词项的分布模型,表示已知事件中词项的分布模型,表示未知事件中词项的分布模型,表示词项为已知事件的概率,表示词项为未知事件的概率,表示出现的词项。
6.根据权利要求5所述的一种面向事件检索的多事件成分混合反馈方法,其特征在于,在根据伪反馈文档集合中词项的生成概率构建以得到伪反馈文档集合的log-似然函数的步骤中,伪反馈文档集合的log-似然函数表示为:
其中,表示伪反馈文档集合的log-似然函数,表示伪反馈文档集合,表示词项在伪反馈文档集合中的词频,表示所有词的总集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东交通大学,未经华东交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111560808.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种5G多层LCP材料基板及其加工方法
- 下一篇:一种照明装置