時間:2022-12-18 10:10:55
序論:好文章的創(chuàng)作是一個不斷探索和完善的過程,我們?yōu)槟扑]一篇計算機(jī)數(shù)據(jù)挖掘技術(shù)研究范例,希望它們能助您一臂之力,提升您的閱讀品質(zhì),帶來更深刻的閱讀感受。
隨著信息技術(shù)的發(fā)展,Internet在生產(chǎn)生活中的應(yīng)用越來越廣泛,社會的網(wǎng)絡(luò)化發(fā)展為計算機(jī)網(wǎng)絡(luò)病毒提供了滋生的環(huán)境。最早出現(xiàn)的計算機(jī)病毒是1988年產(chǎn)生的莫里斯蠕蟲病毒,網(wǎng)絡(luò)病毒會對計算機(jī)造成嚴(yán)重的損害,計算機(jī)系統(tǒng)的信息化程度越高,越容易產(chǎn)生強(qiáng)力的網(wǎng)絡(luò)病毒。傳統(tǒng)的計算機(jī)網(wǎng)絡(luò)病毒防御技術(shù)難以有效抵御強(qiáng)力的網(wǎng)絡(luò)病毒,需要技術(shù)人員進(jìn)行技術(shù)研發(fā)與創(chuàng)新,數(shù)據(jù)挖掘技術(shù)則是有效的病毒防御技術(shù)。
1常見的病毒擴(kuò)散方式
1.1掃描傳播
在計算機(jī)網(wǎng)絡(luò)病毒傳播過程中,掃描傳播方式主要是通過Internet主機(jī)存在的漏洞開展掃描,從而掌握計算機(jī)的控制權(quán)。掃描傳播方式中的病毒主要通過硬盤、光盤、U盤或者網(wǎng)頁進(jìn)行傳播,將計算機(jī)網(wǎng)絡(luò)病毒從一個計算機(jī)系統(tǒng)傳播到多個計算機(jī)系統(tǒng)。與此同時,在掃描傳播方式下,某些計算機(jī)網(wǎng)絡(luò)病毒可以對計算機(jī)系統(tǒng)內(nèi)的可寫文件夾進(jìn)行搜索,并在可寫文件夾中進(jìn)行病毒體的復(fù)制。就上述掃描傳播方式的分析可以發(fā)現(xiàn),計算機(jī)網(wǎng)絡(luò)病毒的掃描傳播方式和Email傳播方式有一定的相同之處,但是仍舊與Email傳播方式存在差異。
1.2擴(kuò)散傳播
在計算機(jī)網(wǎng)絡(luò)病毒中,擴(kuò)散傳播方式主要是指Email傳播方式,該方式是計算機(jī)網(wǎng)絡(luò)病毒傳播最常用的方式。在進(jìn)行網(wǎng)絡(luò)郵件的發(fā)送和接收過程中,網(wǎng)絡(luò)郵件很容易受到計算機(jī)網(wǎng)絡(luò)病毒的感染。以2017年MessageLabs的報告為例,該機(jī)構(gòu)對近20億封郵件進(jìn)行了統(tǒng)計分析,分析結(jié)果顯示,這些文件中存在兩千萬個計算機(jī)網(wǎng)絡(luò)病毒。也就是說,每100封網(wǎng)絡(luò)郵件中,就會有一封郵件感染計算機(jī)網(wǎng)絡(luò)病毒。由此可以看出,受到擴(kuò)散傳播方式的影響,網(wǎng)絡(luò)郵件中很容易受到計算機(jī)網(wǎng)絡(luò)病毒的影響,對人們的正常生產(chǎn)生活造成了不利影響。在實際的病毒防御中,傳統(tǒng)的計算機(jī)病毒防御技術(shù)難以有效預(yù)防掃描傳播和擴(kuò)散傳播產(chǎn)生的計算機(jī)網(wǎng)絡(luò)病毒,需要技術(shù)人員引進(jìn)先進(jìn)的病毒防御技術(shù)。
2數(shù)據(jù)挖掘技術(shù)在計算機(jī)網(wǎng)絡(luò)病毒防御中的運用
2.1數(shù)據(jù)挖掘技術(shù)的主要方法
2.1.1關(guān)聯(lián)挖掘
在關(guān)聯(lián)挖掘中,主要對數(shù)據(jù)庫中對象與對象之間的關(guān)聯(lián)規(guī)則進(jìn)行挖掘。在具體的實踐中,就是利用某一出現(xiàn)對象推斷出另一個對象,或者是將同時發(fā)生的規(guī)則進(jìn)行分析與推斷。在關(guān)聯(lián)挖掘中,最重要的就是通過關(guān)聯(lián)分析,將數(shù)據(jù)信息之間隱藏的關(guān)聯(lián)挖掘出來,并依照已知的狀況對未知的問題進(jìn)行推測。關(guān)聯(lián)規(guī)則是形如X→Y的蘊涵式,其中,X和Y分別稱為關(guān)聯(lián)規(guī)則的先導(dǎo)(LHS)和后繼(RHS)。關(guān)聯(lián)規(guī)則挖掘過程主要包含兩個階段:第一階段必須先從資料集合中找出所有的高頻項目組,第二階段再由這些高頻項目組中產(chǎn)生關(guān)聯(lián)規(guī)則。
2.1.2統(tǒng)計學(xué)分析法
在數(shù)據(jù)庫中,字段項與字段項之間存在著兩種關(guān)系,分別為函數(shù)關(guān)系以及關(guān)聯(lián)關(guān)系。其中,在數(shù)據(jù)分析的過程中,主要使用了相關(guān)分析、成分分析、回歸分析等統(tǒng)計學(xué)分析法。在統(tǒng)計學(xué)分析法中,通過對研究數(shù)據(jù)信息的規(guī)模、范圍、速度以及程度等數(shù)量關(guān)系進(jìn)行研究與分析,能夠揭示出事物與數(shù)據(jù)之間的變化規(guī)律、相互關(guān)系以及發(fā)展趨勢,實現(xiàn)對數(shù)據(jù)信息的準(zhǔn)確解讀和預(yù)測。從本質(zhì)上來說,統(tǒng)計學(xué)分析法就是使用數(shù)學(xué)方式建立起數(shù)學(xué)模型,并利用工調(diào)查獲取的多種數(shù)據(jù)信息及資料完成數(shù)理統(tǒng)計與分析,最終形成定量的結(jié)論,是現(xiàn)階段被廣泛使用的一種科學(xué)方法,更加客觀、精確以及科學(xué)。
2.2數(shù)據(jù)挖掘技術(shù)的運用過程
2.2.1數(shù)據(jù)收集
嘗試通過數(shù)據(jù)挖掘技術(shù)應(yīng)對實際問題,首先應(yīng)確保收集到詳實可行的數(shù)據(jù),該階段工作可以看作是數(shù)據(jù)挖掘技術(shù)的基礎(chǔ)。結(jié)合一般性工作資料可以發(fā)現(xiàn),各地的網(wǎng)絡(luò)安全問題發(fā)生率、破壞級別雖然不盡相同,但發(fā)生方式是類似的,即擴(kuò)散傳播下的病毒無差別侵襲和掃描傳播下的針對性侵襲??蓪θ魏蔚貐^(qū)進(jìn)行安全問題大范圍數(shù)據(jù)收集,了解兩類破壞問題的發(fā)生率,以統(tǒng)計學(xué)分析法對不同大類問題和具體問題的發(fā)生率進(jìn)行評估,再以拓?fù)鋵W(xué)原理進(jìn)行問題羅列,通過數(shù)據(jù)分析的方式了解工作重點,做好下一階段的工作。
2.2.2數(shù)據(jù)處理和分析
完成數(shù)據(jù)收集后,以統(tǒng)計學(xué)方法做初步處理,分析階段,則強(qiáng)調(diào)關(guān)聯(lián)挖掘法的應(yīng)用。如某地多發(fā)掃描侵襲問題,占比超過60%,可知病毒傳播的方式以點——面進(jìn)行的,進(jìn)一步作關(guān)聯(lián)挖掘,又可以發(fā)現(xiàn)公共電腦往往是病毒擴(kuò)散的發(fā)源地,占比80%??梢詫⒏黝惞搽娔X作為工作重點,建議企業(yè)和網(wǎng)吧等進(jìn)行計算機(jī)大規(guī)模掃描,同時處理一些存在感染問題的移動設(shè)備,以數(shù)據(jù)處理和分析的結(jié)果為基礎(chǔ),借此針對性的控制掃描傳播問題,提升計算機(jī)網(wǎng)絡(luò)病毒防御效果。該過程如圖1所示(未知攻擊模塊隸屬于異常分析器,單獨未知類型的攻擊進(jìn)行分析)。
2.2.3模型匹配
模型匹配是一種針對性較強(qiáng)的網(wǎng)絡(luò)安全處理方法,該方法的特殊性在于,可以針對一些具有特異性的木馬病毒做針對性處理。各地可以收集各類安全事件的發(fā)生態(tài)勢,對多見的病毒類型進(jìn)行總結(jié)。通過數(shù)據(jù)挖掘技術(shù),發(fā)現(xiàn)超過70%的木馬病毒是以安裝包的形式存在的,且?guī)в袕V告元素,大小一般不超過5.0mb。后續(xù)工作中,可以將帶有類似特征的數(shù)據(jù)包作為重點,將其輸入默認(rèn)的計算機(jī)管理軟件中,生成防火墻。當(dāng)同類數(shù)據(jù)包嘗試進(jìn)入計算機(jī)時,網(wǎng)絡(luò)病毒防御系統(tǒng)可直接進(jìn)行攔截,并提示人員進(jìn)行處理,以保證計算機(jī)和網(wǎng)絡(luò)安全,以數(shù)據(jù)挖掘結(jié)果為基礎(chǔ)的防火墻工作態(tài)勢。
3總結(jié)
綜上,網(wǎng)絡(luò)安全目前已經(jīng)成為各界廣泛關(guān)注的問題,互聯(lián)網(wǎng)病毒防御則稱為保證網(wǎng)絡(luò)安全的核心所在,目前來看,以數(shù)據(jù)挖掘技術(shù)為視角,可通過關(guān)聯(lián)挖掘、統(tǒng)計學(xué)分析法應(yīng)對病毒侵襲,具體方式則包括數(shù)據(jù)收集、數(shù)據(jù)處理和分析、模型匹配等。后續(xù)工作中,可以上述理論為基礎(chǔ),有效保證網(wǎng)絡(luò)安全。
參考文獻(xiàn)
[1]聶利穎.數(shù)據(jù)挖掘技術(shù)在計算機(jī)網(wǎng)絡(luò)安全病毒防御中的實踐應(yīng)用分析[J].電腦知識與技術(shù),2018,14(21):52-54.
[2]孫赫.淺析數(shù)據(jù)挖掘技術(shù)在計算機(jī)網(wǎng)絡(luò)病毒防御中的應(yīng)用[J].吉林勞動保護(hù),2016(11):28-29.
作者簡介楊米娜(1979-),女,河北省定州市人。研究方向為計算機(jī)、多媒體技術(shù)、數(shù)據(jù)挖掘等等。