毕业论文
计算机论文
经济论文
生物论文
数学论文
物理论文
机械论文
新闻传播论文
音乐舞蹈论文
法学论文
文学论文
材料科学
英语论文
日语论文
化学论文
自动化
管理论文
艺术论文
会计论文
土木工程
电子通信
食品科学
教学论文
医学论文
体育论文
论文下载
研究现状
任务书
开题报告
外文文献翻译
文献综述
范文
模糊关联规则及其应用研究(4)
2.4.2 Apriori算法的基本原理
Apriori算法是一种典型的规则挖掘算法,通过挖掘布尔关联规则频繁项集挖掘数据。它的基本原理如下:
(1)通过事物数据库得到大一项集L1 。若L1为非空的,则由L1产生长度为2的候选项集合C2;
(2)对事务数据库中的每一个事务t,求出t在C2中的全部子集C t,对于C t中的每一个长度为2的候选项集 进行加1操作。
(3)完成一次事务数据库的扫描,筛选出C2中满足最小支持度的项集组成了长度为2的频繁项集合。
(4)重复以上步骤,处理新得到的频繁项集合,直到不再产生频繁项集合为止。
分析上述算法可知,在第K次循环中产生候选K-项集的集合 中的项集是用来产生频集的候选集,最后的频集 必须是 的一个子集。 中的每个元素需在交易数据库中进行验证来决定其是否加入 ,这里的验证过程是算法性能的一个瓶颈。这个算法执行过程可能产生大量的候选集,还有可能需要重复扫描数据库,这是Apriori算法的主要缺点[9]。
2.4.3关联规则挖掘的应用
关联规则的应用非常普遍,因为其不受只能选择一个因变量的限制,能够在大型数据库中发现数据关系。下面通过一个例子利用Apriori算法说明关联规则的应用。设T = {T100,T200,T300,T400}, I = {A, B, C, D, E}, min-sup= 50﹪。则C1={{A},{B},{C},{D},{E}},第一次循环产生L1= {{A},{B},{C},{D},{E}},由Apriori-Gen(L1)生成C2,扫描数据库,计算C2中每个候选集得到L2。依此循环,得到L3。
事物数据库T如下表:
表1 事物数据库T
TID 100 200 300 400
属性集 ACD BCE ABCE BE
具体步骤如下:
Step1:扫描T,对每个候选计数。计算所有的候选1-项集的集合C1
表2 候选1-项集
属性集 {A} {B} {C} {D} {E}
支持数 2 3 3 1 3
假设支持度为50%,产生所有的频繁1-项集 。
表3 频繁1-项集
属性集 {A} {B} {C} {E}
支持数 2 3 3 3
Step2:由 产生候选集 。
表4 候选2-项集
属性集 {AB} {AC} {AE} {BC} {BE} {CE}
支持数 1 2 1 2 3 2
由 产生 。
表5 频繁2-项集
属性集 {AC} {BC} {BE} {CE}
支持数 2 2 3 2
Step3:由 产生候选集 。
表6 候选3-项集
属性集 {BCE}
支持数 2
由 产生 ,由于 中所有的支持数都是2,故都在 中。
表7 频繁3-项集
属性集 {BCE}
支持数 2
Step4:至此求出了所有的频繁项集。
3.模糊关联规则及相关概念
3.1 模糊关联规则理论基础
模糊关联规则基于数据挖掘和关联规则中的知识发现,以模糊理论为依据,而模糊理论是基于模糊集合基础,用来描述和处理人类语言特有的模糊信息理论,其主要包括模糊集合、模糊运算、隶属度函数和模糊关系等[10]。
自然或社会科学研究中,有很多定义不严格或有模糊性的概念。“模糊性”所描述的现象或概念本身是模糊不清的,一个对象是否符合一个模糊概念不能明确判定。如白纸上的一滴墨迹,由于墨水外渗,墨痕边缘不清,要判有位置是否被墨痕覆盖,还是没有被覆盖都不可能,它只能用种“可能性”(如用[0,1]间某个数)来描述该位置,墨痕中的点“可能性”最大(如是1),绝不是墨痕中的点的可能性最小(如是0),而边缘的点“可能性”介在其间。因此用“可能性”而不是“概率”来度量模糊性。
共7页:
上一页
1
2
3
4
5
6
7
下一页
上一篇:
MedWin+AT89C51单片机武器射击记录仪设计+PCB图纸
下一篇:
AT89S52单片机的家庭智能浇花器设计+源程序
基于MATLAB的直流电机模糊控制系统设计
基于模糊自适应PID的水面无人艇航向控制
模糊算法在PID控制系统中的应用MATLAB仿真
GLIP2003直线二级倒立摆的模...
基于模糊控制方法的机械手同步控制研究
MATLAB的模糊图像增强算法+程序
MATLAB模糊预测控制的工业...
谷度酒庄消费者回访调查问卷表
多元化刑事简易程序构建探讨【9365字】
中国古代秘书擅权的发展和恶变
高校网球场馆运营管理初探【1805字】
辩护律师的作证义务和保...
浅谈传统人文精神茬大學...
浅谈新形势下妇产科护理...
《醉青春》导演作品阐述
国内外无刷直流电动机研究现状
拉力采集上位机软件开发任务书