毕业论文
计算机论文
经济论文
生物论文
数学论文
物理论文
机械论文
新闻传播论文
音乐舞蹈论文
法学论文
文学论文
材料科学
英语论文
日语论文
化学论文
自动化
管理论文
艺术论文
会计论文
土木工程
电子通信
食品科学
教学论文
医学论文
体育论文
论文下载
研究现状
任务书
开题报告
外文文献翻译
文献综述
范文
基于关联规则算法的处方信息分析研究(3)
具体来表述,整个挖掘过程包含下面几个步骤(如图2.1所示):
图2.1 数据挖掘过程的步骤
1)数据集成:保证数据一定要大量且全面丰富,只有这样才能更具有说服性。数据过于少,整个数据挖掘过程肯定毫无作用。
2)数据过滤:数据过滤是对整个数据集合就行清洗,消除噪声和一些格式等不一样的数据,避免其对挖掘结果产生影响。通过这一步骤,可以得到更加准确、更加丰富的数据,从而保障挖掘过程的顺利进行。
3)数据选择:在数据库中提取符合要求的相关数据
4)数据转换:将一些形式不符合的数据进行相应的转换得到符合要求的数据
5)数据挖掘:使用适当的数据挖掘方法进行挖掘
6)评估:判断数据挖掘结果是否合理,是否有实际意义。评估也可以依据丰富的经验,用数据来验证模型是否正确,进而调整整个模型,再反复进行挖掘。
7)结果表示:把数据之间的特性、数据之间的关系形象具体化的描述。
2.2.3 数据挖掘的分类
数据挖掘有多种分类方式,可以根据发现的知识类型、采用的技术类型、数据库的类型、挖掘的深度以及挖掘的应用领域来进行分类。
这里主要介绍一下按照被发现知识类型分类:
1) 关联规则挖掘:数据挖掘中最先研究的挖掘方法之一。在实践中也比较成熟,挖掘目的也从最初的发现项集之间的关联关系扩展为不同类型的关联关系。
2) 特征规则挖掘:从相关的一组数据之中提取表达式,用这些表达式去描述整个数据集合的特征。
3) 分类规则挖掘:通过分析数据的样本,得出有关类别的较为准确的描述。
4) 时序规则挖掘:也称为序列模式,是生成与时间有关的规则。
5) 偏差规则挖掘:偏差包括分类中的反常实例、例外模式、观测结果对期望值的偏离及量值随时间的变化等。
按挖掘数据库类型分类分为面对对象、事务数据库及多媒体数据库等等,其余几种分类标准也有相对应的分类,就不一一列出。
共3页:
上一页
1
2
3
下一页
上一篇:
FPGA数字视频信息叠加软件设计+源程序
下一篇:
数据挖掘国内外研究现状
认知无线电网络中基于双...
基于TCP/IP技术的转向架振动测试系统设计
基于PM2.5浓度的健康出行路径规划及实现
基于涡旋电磁波的新型雷达成像技术研究
基于相关滤波器的长期跟踪算法研究
基于ZigBee协议轨道交通环...
基于QT的图像处理系统设计
国内外无刷直流电动机研究现状
拉力采集上位机软件开发任务书
中国古代秘书擅权的发展和恶变
谷度酒庄消费者回访调查问卷表
浅谈传统人文精神茬大學...
高校网球场馆运营管理初探【1805字】
浅谈新形势下妇产科护理...
多元化刑事简易程序构建探讨【9365字】
辩护律师的作证义务和保...
《醉青春》导演作品阐述