朴素贝叶斯分类在入侵检测中的应用 |
| http://www.lunwenda.com 论文下载网 2008-05-09 钟慰 周铁军 浏览: 次 【打印论文】【收藏论文】 |
1 前言
在入侵检测系统中,为了提高系统的性能,包括降低误报率和漏报率,缩短反应时间等,学者们引入了许多方法,如专家系统、神经网络、遗传算法和数据挖掘中的聚类,分类等各种算法。例如:Cooper & Herkovits提出的一种基于贪心算法的贝叶斯信念网络,而Provan & Singh Provan,G.M & Singh M和其他学者报告了这种方法的优点。贝叶斯网络说明联合条件概率分布,为机器学习提供一种因果关系的图形,能有效的处理某些问题,如诊断:贝叶斯网络能正确的处理不确定和有噪声的问题,这类问题在任何检测任务中都很重要。
然而,在分类算法的比较研究发现,一种称作朴素贝叶斯分类的简单贝叶斯算法给人印象更为深刻。尽管朴素贝叶斯的分类器有个很简单的假定,但从现实数据中的实验反复地表明它可以与决定树和神经网络分类算法相媲美[1]。
在本文中,我们研究朴素贝叶斯分类算法,用来检测入侵审计数据,旨在开发一种更有效的,检验更加准确的算法。
2 贝叶斯分类器
贝叶斯分类是统计学分类方法。它们可以预测类成员关系的可能性,如给定样本属于一个特定类的概率。
朴素贝叶斯分类[2]假定了一个属性值对给定类的影响独立于其它属性的值,这一假定称作类条件独立。
设定数据样本用一个 n 维特征向量X={x1,x2,,xn}表示,分别描述对n 个属性A1,A2,,An样本的 n 个度量。假定有m个类 C1,C2,,Cm 。给定一个未知的数据样本 X(即没有类标号),朴素贝叶斯分类分类法将预测 X 属于具有最高后验概率(条件 X 下)的类,当且仅当P(Ci | X)> P(Cj | X),1≤j≤m,j≠i 这样,最大化P(Ci | X)。其中P(Ci | X)最大类Ci 称为最大后验假定,其原理为贝叶斯定理:
公式(1)
公式(2)
概率
,可以由训练样本估值:
公式(3)
是属性Ak的高斯密度函数,而 分别为平均值和标准差。
时:NBC是使用高斯密度函数
来评估该属性,而K-NBC正如它的名字所说得一样,使用高斯核密度函数来评估属性。它的标准核密度公式为
公式(4)
公式(5) |
|
朴素贝叶斯
|
核密度
|
||
|
时间
|
空间
|
时间
|
空间
|
|
|
具有n条事务的训练数据
|
O(nm)
|
O(m)
|
O(nm)
|
O(nm)
|
|
具有q条事务的测试数据
|
O(qm)
|
|
O(qnm)
|
|
公式(6)
公式(7)
公式(8)
公式(9)
公式(10) 在试验中,以记录正确分类的百分比作为分类效率的评估标准,表2为两种算法的分类效率。
|
数据集
算法
|
DOS
(neptune)
|
Proble
(satan)
|
R2L
( guess_passwd)
|
U2R
(buffer_overflow)
|
||||||||
|
检测率
|
误检率
|
整体检测率
|
检测率
|
误检率
|
整体检测率
|
检测率
|
误检率
|
整体检测率
|
检测率
|
误检率
|
整体检测率
|
|
|
NBC
|
99.5
|
0.2
|
99.79
|
98.3
|
0.1
|
99.84
|
97.3
|
0.8
|
99.2
|
95
|
1.8
|
98.21
|
|
K-NBC
|
99.5
|
0.2
|
99.96
|
98.3
|
0
|
99.96
|
97.3
|
0.2
|
99.81
|
71
|
0.1
|
99.76
|
|
SU+NBC
|
99.5
|
0
|
99.96
|
98.3
|
0.1
|
99.85
|
98
|
0.7
|
99.24
|
9
|
1.1
|
98.84
|
|
SU+K-NBC
|
99.5
|
0
|
99.96
|
98.3
|
0
|
99.96
|
98.7
|
0.2
|
99.76
|
85
|
0.1
|
99.81
|
|
数据集
算法
|
整体检测
|
分类检测
|
||||||||||
|
Normal
|
Dos
|
Proble
|
R2L
|
U2R
|
||||||||
|
检测率
|
误检率
|
检测率
|
误检率
|
检测率
|
误检率
|
检测率
|
误检率
|
检测率
|
误检率
|
检测率
|
误检率
|
|
|
NBC
|
98.14
|
1.8
|
98.2
|
0.8
|
99.8
|
0
|
99.8
|
0
|
90
|
0
|
86.7
|
1.8
|
|
K-NBC
|
99.78
|
0.2
|
99.8
|
2.3
|
99.8
|
0
|
99.8
|
0
|
96
|
0
|
73.3
|
0.1
|
|
SU+NBC
|
97.99
|
2.0
|
98
|
0.8
|
99.8
|
0
|
99.8
|
0
|
90
|
0
|
86.7
|
1.9
|
|
SU+K-NBC
|
99.79
|
0.2
|
99.8
|
1.9
|
99.8
|
0
|
99.8
|
0
|
96
|
0
|
80
|
0.1
|
| 【设为主页】 【收藏论文】 【保存论文】 【推荐好友】 【打印论文】 【回到顶部】 【关闭此页】 |