[发明专利]一种针对关联关系的语义区分能力度量方法有效
申请号: | 201310713258.1 | 申请日: | 2013-12-20 |
公开(公告)号: | CN103678643A | 公开(公告)日: | 2014-03-26 |
发明(设计)人: | 胡传平;徐峥;齐力;梅林;支凤麟;梁辰;骆祥峰;魏晓;张顺香 | 申请(专利权)人: | 公安部第三研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海天翔知识产权代理有限公司 31224 | 代理人: | 刘常宝 |
地址: | 200031*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 关联 关系 语义 区分 能力 度量 方法 | ||
1.一种针对关联关系的语义区分能力度量方法,其特征在于,所述度量方法建立在语义区分模型的基础上,选择五个统计与图论方面的参数,用函数来模拟语义区分模型,再利用由函数来模拟的语义区分模型进行语义区分能力度量。
2.根据权利要求1所述的一种针对关联关系的语义区分能力度量方法,其特征在于,所述五个统计与图论方面的参数分别为:
(1)关联关系的支持度,在文档空间中为篇频;
(2)关联关系前键的支持度;
(3)关联关系后键的支持度;
(4)关联关系的出度,以关键词为节点,以关联关系为边的有向图中的链;
(5)关联关系的入度,以关键词为节点,以关联关系为边的有向图中的接。
3.根据权利要求2所述的一种针对关联关系的语义区分能力度量方法,其特征在于,所述用函数来模拟语义区分模型时,根据已选参数,采用了五种策略:
(1)建立与关联关系的支持度线性相关的函数;
(2)建立与入度线性相关的函数;
(3)建立与支持度和入度线性相关的函数;
(4)建立与入度非线性相关的函数,该函数与入度成指数关系;
(5)建立与支持度和关联关系的入度的非线性相关函数;
且就五种策略分别计算该函数与语义区分模型的相关系数,通过对比确定最终的用于模拟语义区分模型的函数。
4.根据权利要求1至3中任一项所述的一种针对关联关系的语义区分能力度量方法,其特征在于,所述度量方法应用于文档聚类算法时,使用关键字和关联关系来表示文件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于公安部第三研究所,未经公安部第三研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310713258.1/1.html,转载请声明来源钻瓜专利网。