摘要:随着数据库技术和信息技术的飞速发展,从大量的数据中获取有用的信息和知识变得越来越重要。模糊关联规则挖掘是数据挖掘中针对数量型属性关联规则发现的一种有效方法。本文采用数据挖掘和关联规则作为知识发现的基本结构,研究了模糊关联规则挖掘算法。针对原有关联算法只能挖掘布尔型关联规则的问题,本文结合模糊集理论,把模糊关联规则应用于网络中杂乱、繁复的安全事件分析中。通过对DARPA标准数据集的分析,得到了预期数量的关联规则,某些场景仿真表明取得了较好的实验结果。5526
关键词:数据挖掘;关联规则;模糊关联规则;网络安全

 Application Research of Fuzzy Association Rules
Abstract: With the rapid development of database technology and information technology, it is becoming increasingly important to obtain useful information and knowledge from large amounts of data . Fuzzy association rule mining is an effective method for quantitative attributes in data mining association rules. In this paper, it took the data mining and association rules as the basic structure of knowledge discovery, studied the fuzzy association rule mining algorithm . In view of the existing correlation algorithm can only solve the problem of mining Boolean association rules, based on the fuzzy set theory, this paper applied the fuzzy association rules to the heavy and complicated security incidents analysis in the network, .This paper obtained the anticipated number of association rules through the analysis of the DARPA standard data sets and some scene simulation indicated that good experimental results were obtained.
Key Word:Data Mining; Association Rules; Fuzzy Association Rules; Network         Security
目    录

摘要    1
引言    1
1.数据挖掘    2
1.1数据挖掘的概念    2
1.2数据挖掘的特点    2
1.3数据挖掘的步骤    2
2.关联规则    3
2.1关联规则概念    3
2.2关联规则的几个度量值    3
2.3关联规则挖掘步骤    5
2.4关联规则算法Apriori    5
3.模糊关联规则及相关概念    8
3.1模糊关联规则理论基础    8
3.2模糊关系    10
4.模糊关联规则挖掘算法在安全事件相关应用    12
5.结论及展望    14
参考文献    15
致谢    16
 
模糊关联规则及其应用研究
引言
自从Agrawal等提出了挖掘顾客交易数据库中项集间的干练规则问题之后,数据库中关联规则的挖掘一直是人们研究的重点,因为它可以发现数据库(特别是大规模数据库)中未知而有用的模式,支持人们的决策,从而带来巨大的、直接的社会、经济效益。对关联规则的研究有单层次关联规则,多层次关联规则。随着电子技术、计算机技术、通信技术等先进技术的引入,社会的信息化建设不断增强,各行业每天都会采集到海量的业务数据,包括各类的设计数据、生产监控数据等。在过程控制系统中,想要充分利用这些数据,就必须在庞大的数据库中找出对改善控制系统有用的数据,这就使数据挖掘(Data Mining)技术成为可能,并根据关联规则找出与之相关的数据之间的关系,然后根据挖掘出的数据分析、发现过程控制系统中所存在的问题并及时解决问题。
1.数据挖掘
1.1数据挖掘的概念
数据挖掘(Data Mining)的概念有多种描述,最常见的有两种:(1)G.Piatetsky Shapior,W.J.Frawley数据挖掘定义为:从数据库的大量数据中揭示出隐含的、先进而未知的、潜在且有用信息的频繁过程。这个定义有几层含义:数据源必须是确实存在的、数量巨大的、含噪声的;发现的是用户感兴趣的信息或知识;这些内容要能够被接受、能够被理解、能够被运用;并没有要求发现对任何问题都适用的知识,但要支持特定的发现问题。和数据挖掘具有相同含义的词有决策支持、数据融合和数据分析等。(2)数据挖掘的广义观点:数据挖掘是从存放在数据库或其他信息库中的大量数据中发现有趣知识的过程[1]。
上一篇:MedWin+AT89C51单片机武器射击记录仪设计+PCB图纸
下一篇:AT89S52单片机的家庭智能浇花器设计+源程序

基于MATLAB的直流电机模糊控制系统设计

基于模糊自适应PID的水面无人艇航向控制

模糊算法在PID控制系统中的应用MATLAB仿真

GLIP2003直线二级倒立摆的模...

基于模糊控制方法的机械手同步控制研究

MATLAB的模糊图像增强算法+程序

MATLAB模糊预测控制的工业...

谷度酒庄消费者回访调查问卷表

多元化刑事简易程序构建探讨【9365字】

中国古代秘书擅权的发展和恶变

高校网球场馆运营管理初探【1805字】

辩护律师的作证义务和保...

浅谈传统人文精神茬大學...

浅谈新形势下妇产科护理...

《醉青春》导演作品阐述

国内外无刷直流电动机研究现状

拉力采集上位机软件开发任务书