[发明专利]一种基于相似变精度粗糙集模型的知识推送规则提取方法在审
申请号: | 201710290504.5 | 申请日: | 2017-04-28 |
公开(公告)号: | CN107169059A | 公开(公告)日: | 2017-09-15 |
发明(设计)人: | 张发平;李丽;张清雅;吴迪;张晓刚;敬石开 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京理工正阳知识产权代理事务所(普通合伙)11639 | 代理人: | 毛燕 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开的一种基于相似变精度粗糙集模型的知识推送规则提取方法,属于知识工程领域。本发明通过对用户行为数据提取处理,构建包括条件属性及决策属性决策表,利用信息熵理论得到条件属性相对于决策属性的重要度,在此基础上利用条件属性相对于决策属性的重要度对决策表进行约简,得到约简后的决策表;在约简后的决策表基础上提取含有确定性因子的决策规则;对推送规则进行验证评估,规则评估通过后即可利用规则进行知识推送,提高知识推送精度。本发明能够解决粗糙集模型过于严格问题、提高粗糙集模型的容错能力、使其适于知识推送规则提取情境,此外,能够获取高质量的知识推送规则,提高知识推送精度,降低知识获取成本,提高知识获取效率。 | ||
搜索关键词: | 一种 基于 相似 精度 粗糙 模型 知识 推送 规则 提取 方法 | ||
【主权项】:
一种基于相似变精度粗糙集模型的知识推送规则提取方法,其特征在于:包括如下步骤:步骤1数据预处理;步骤1.1用户行为记录及数据抽取;进行知识规则生成的基础数据是用户浏览、使用知识的行为记录,所述的行为记录包括用户的个人特征信息、任务属性、浏览使用的知识属性,用户操作系统对行为记录进行记录,抽取用于进行规则生成的数据;步骤1.2数据离散化;利用粗糙集进行规则挖掘,要求数据必须是离散的,所以需要对连续值属性进行离散化处理;步骤1.3决策表建立;构建决策表,决策表的行表示用户行为的记录,列表示属性集合,包括条件属性集C和决策属性集D,简称CD决策表;由于知识推送规则是根据用户所处情境的属性得到用户需要知识的属性,所以,条件属性为情境属性,决策属性为知识属性;构建决策表时,对行与行之间的相似性进行计算,将等价的行进行合并,并统计其数量;另外为了便于讨论,用字母和数字标识属性名称以及属性值;步骤1.4决策表的一致性检验;构建决策表之后,需要对决策表的一致性进行检验,当决策属性D完全依赖于条件属性C,即γ(C,D)=1时,称决策表是完全一致的;由于噪声数据的影响及信息的不完备性,很难得到γ(C,D)为1的决策表;故规定一个阈值E,0<E<1,若γ(C,D)≥E,则认为决策表是满足阈值要求的,认为是可接受的,即完成数据预处理;否则不可接受,需要重新对决策表进行调整,返回步骤1.1,重新抽取其他数据进行迭代处理;步骤2属性相对约简,得到约简后的决策表;步骤3推送规则生成;利用步骤2中约简后的决策表,生成规则Tij:Des(Xi)→μDes(Yj)步骤4推送规则验证评估;用部分未参与规则生成的历史数据验证决策规则,观测决策结论和实际结论的差别,如果规则得到的结果正确性在可接受的范围之内,则确认规则,如果正确性较低,一般是由于抽取的数据不能反映总体情况所导致,需要返回步骤1.1,重新抽取数据进行运算;步骤5规则实施,提高知识推送精度;根据步骤2中约简后的决策表的条件属性集合C和决策属性集合D,收集数据,进行数据预处理工作,匹配合适的规则,把相关的决策结果推送给用户,并记录用户的反馈结果,为日后的规则评价及更新积累数据,提高知识推送精度。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710290504.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种试题打乱顺序方法和系统
- 下一篇:终端中的图片处理方法、装置及终端