時間:2023-03-01 16:20:06
序論:好文章的創(chuàng)作是一個不斷探索和完善的過程,我們?yōu)槟扑]十篇人工神經(jīng)網(wǎng)絡范例,希望它們能助您一臂之力,提升您的閱讀品質,帶來更深刻的閱讀感受。
神經(jīng)網(wǎng)絡是一個具有高度非線性的超大規(guī)模連續(xù)時間動力系統(tǒng)。是由大量的處理單元(神經(jīng)元)廣泛互連而形成的網(wǎng)絡。它是在現(xiàn)代神經(jīng)科學研究成果的基礎上提出的,反映了腦功能的基本特征。但它并不是人腦的真實描寫,而只是它的某種抽象、簡化與模擬。網(wǎng)絡的信息處理由神經(jīng)元之間的相互作用來實現(xiàn);知識與信息的存儲表現(xiàn)為網(wǎng)絡元件互連間分布式的物理聯(lián)系;網(wǎng)絡的學習和計算決定于各神經(jīng)元連接權系的動態(tài)演化過程。因此神經(jīng)元構成了網(wǎng)絡的基本運算單元。每個神經(jīng)元具有自己的閾值。每個神經(jīng)元的輸入信號是所有與其相連的神經(jīng)元的輸出信號和加權后的和。而輸出信號是其凈輸入信號的非線性函數(shù)。如果輸入信號的加權集合高于其閾值,該神經(jīng)元便被激活而輸出相應的值。在人工神經(jīng)網(wǎng)絡中所存儲的是單元之間連接的加權值陣列。
神經(jīng)網(wǎng)絡的工作過程主要由兩個階段組成,一個階段是工作期,此時各連接權值固定,計算單元的狀態(tài)變化,以求達到穩(wěn)定狀態(tài)。另一階段是學習期(自適應期,或設計期),此時各計算單元狀態(tài)不變,各連接權值可修改(通過學習樣本或其他方法),前一階段較快,各單元的狀態(tài)亦稱短期記憶(STM),后一階段慢的多,權及連接方式亦稱長期記憶(LTM)〔1〕。
根據(jù)網(wǎng)絡的拓撲結構和學習規(guī)則可將人工神經(jīng)網(wǎng)絡分為多種類型,如不含反饋的前向神經(jīng)網(wǎng)絡、層內(nèi)有相互結合的前向網(wǎng)絡、反饋網(wǎng)絡、相互結合型網(wǎng)絡等〔2〕。本文的人工神經(jīng)網(wǎng)絡模型是采用BP算法的多層前饋網(wǎng)絡。
該模型的特點是信號由輸入層單向傳遞到輸出層,同一層神經(jīng)元之間互不傳遞信息,每個神經(jīng)元與鄰近層所有神經(jīng)元相連,連接權用Wij表示。各神經(jīng)元的作用函數(shù)為Sigmoid函數(shù),設神經(jīng)網(wǎng)絡輸入層的p個節(jié)點,輸出層有q個節(jié)點,k-1層的任意節(jié)點用l表示,k層的任意節(jié)點用j表示,k+1層的任意節(jié)點用l表示。Wij為k-1層的第i個神經(jīng)元與k層的第j個神經(jīng)元相連接的權值。k-1層的節(jié)點i輸出為O(k-1)i,k層節(jié)點j的輸出為:
k層節(jié)點j的輸出為:
Okj=f(netkj)
設訓練樣本為(X,Ye),X為p維向量,加到輸入層;Ye為q維向量,對應于期望輸出;網(wǎng)絡的實際輸出Y也是q維向量。網(wǎng)絡在接受樣本對的訓練過程中,采用BP算法,其權值調整量為:
ΔWij=-ηδkjO(k-1)i
其中,對于輸出層為:
δkj=yj(1-yj)(yej-yj)
對于非輸出層為:
η為訓練步長,取0<η<1。
用樣本集合反復訓練網(wǎng)絡,并不斷修改權值,直到使實際輸出向量達到要求,訓練過程結束〔3〕。
上述人工神經(jīng)網(wǎng)絡可以完成多種信息處理任務,如從二進制數(shù)據(jù)中提取相關知識,完成最近鄰模式分類,實現(xiàn)數(shù)據(jù)聚集等。而本文要用的是其極強的數(shù)學逼近映射能力,即開發(fā)合適的函數(shù)f:ARnBRn,以自組織的方式響應以下的樣本集合:(x1,y1),(x2,y2)…,(xm,ym),其中yi=f(xi)。這里描述的是一般的數(shù)學抽象,像識別與分類這些計算都可以抽象為這樣的一種近似數(shù)學映射。
所謂診斷,實質上是一個分類問題。即根據(jù)候診者的癥狀,醫(yī)學檢查結果(如體溫、心跳等)等一些情況,它們可以用一向量(e1,e2,…,em)來表示,將其歸類為病人或非病人。這也可以轉化為尋找一差別函數(shù)f使得:
(1)f(e1,e2,…,em)>ε,(e1,e2,…,em)∈T
(2)f(e1,e2,…,em)>ε,(e1,e2,…,em)T
其中集合T表示患病。
因此,病情診斷最終也可作為一類函數(shù)的逼近問題。
而許多研究已表明,前向神經(jīng)網(wǎng)絡可作為非線性逼近的標準型。對于實數(shù)空間的任一函數(shù),只要它滿足一定的條件,一定存在唯一的具有單一隱層的前向網(wǎng)絡作為它的最優(yōu)最佳逼近。而含有兩個隱含層的前向網(wǎng)絡可在任意的平方誤差內(nèi)逼近某一實函數(shù)〔3〕。
診斷步驟
肺癌病例數(shù)據(jù)選自1981~1994年在某醫(yī)院住院的病人,共計551例。其中486例(88%)經(jīng)病理學、細胞學診斷證實為肺癌。每一病例都包括多項數(shù)據(jù),其中用于診斷的數(shù)據(jù)項有:病人的一般情況(如年齡、性別等),家族史、既往史、吸煙史、術后病理、X射線檢查、CT檢查、纖維支氣管鏡檢查、PAT痰檢等多達58項。因此,原則上58項數(shù)據(jù)應作為神經(jīng)網(wǎng)絡的輸入項,而神經(jīng)網(wǎng)絡的輸出值就是病人是否患肺癌的結果。
1.網(wǎng)絡訓練集的確定:在最原始的551例病人數(shù)據(jù)中存在著各種各樣的差別,如性別差異(419例男性,132例女性),診斷結果的差異(486例經(jīng)證實為肺癌),所患肺癌種類的差異(鱗癌、小細胞癌、大細胞癌等),患病程度上的差異(早、中晚期的不同)等等。顯然,訓練數(shù)據(jù)集應最大限度地保證兼顧各種病例情況。經(jīng)過仔細篩選,選擇了含有460個病例的集合作為肺癌診斷用的網(wǎng)絡的訓練集。
2.神經(jīng)網(wǎng)絡輸入和輸出數(shù)據(jù)的預處理
按照人工神經(jīng)網(wǎng)絡的理論,神經(jīng)網(wǎng)絡的輸入輸出數(shù)據(jù)都應該屬于(0,1)區(qū)間的實數(shù),為此我們需對原始數(shù)據(jù)進行如下的規(guī)一化處理:
其中xi為原始數(shù)據(jù)項,而Max=max{xi∶xi∈X},Min=min{xi∶xi∈X}。這里X為原始數(shù)據(jù)集。經(jīng)過(7)式變換后,yi將在(0,1)區(qū)間。因此,可作為神經(jīng)網(wǎng)絡的輸入輸出。
3.應用神經(jīng)網(wǎng)絡進行肺癌診斷
將描述病人各種情況的數(shù)據(jù)作為前向網(wǎng)絡的輸入數(shù)據(jù)加到其輸入端,并按(1)~(6)式計算各神經(jīng)元的輸入和輸出,同時調整神經(jīng)元之間的連接權值以使網(wǎng)絡的輸出和實際的病例情況相符。即當病人確實患肺癌時網(wǎng)絡的輸出結果也恰好指示為肺癌,反之亦然。如果對所有的訓練樣本集網(wǎng)絡的輸出基本上(95%或更高)能保證與實際結果一致,則訓練過程結束。我們認為神經(jīng)網(wǎng)絡已建立起病人的各種因素與他是否是肺癌患者之間的函數(shù)映射關系。對于一個新的候診病人來說,只要將他的情況輸入到訓練好的神經(jīng)網(wǎng)絡中去,根據(jù)網(wǎng)絡的輸出結果就可以知道他是否已患肺癌。
表1基于不同發(fā)病因素的診斷網(wǎng)絡模型
類型訓練集精度測試集精度
基于遺傳因素的診斷網(wǎng)53.8%46.3%
基于個人生活習慣的診斷網(wǎng)57.1%44.9%
基于病癥的診斷網(wǎng)89.4%83.3%
基于醫(yī)學檢查結果的診斷網(wǎng)98.5%92.6%
上述結果表明不同類型的因素應分開來考慮。于是我們將58項輸入數(shù)據(jù)分成四類,這四類有各自的BP診斷網(wǎng),依次稱為診斷一、診斷二、診斷三、診斷四。它們先單獨測定,然后再將它們各自的結果綜合起來得出最后的判斷。
上述四種診斷網(wǎng)絡所得結果的可靠性各不相同。其中,根據(jù)醫(yī)學檢查結果所作的診斷準確性最高,因此在最后的綜合分析中要重點考慮它的診斷結果,我們給它設一個相對最高的權值。其次,根據(jù)病人的癥狀所作的診斷往往也具有較高的準確性,因此給它的權值也較高,但比醫(yī)學檢查結果的稍低。其他兩類因素在有關肺癌的診斷中僅具參考作用,因而所設的權值相對較小。轉
最后的結果O為:
O=a1.O1+a2.O2+a3.O3+a4.O4
a1+a2+a3+a4=1
其中Oi,ai,i=1,2,3,4分別為各診斷網(wǎng)的輸出及其對應的權值。
當O>0.5時最后的診斷結果為患肺癌,反之則正常。對所有的病例數(shù)據(jù)經(jīng)上述方法的診斷結果見表2。
表2神經(jīng)網(wǎng)絡對肺癌診斷結果分析
神經(jīng)網(wǎng)絡
診斷結果訓練數(shù)據(jù)測試數(shù)據(jù)
肺癌患者非肺癌患者肺癌患者非肺癌患者
+4602253
-038122
其中對于訓練集,肺癌病人的正確檢出率為100%,非肺癌病人誤診率為5%。對于測試集,肺癌病人的正確檢出率為96.2%;非肺癌患者正確檢出率為88%,誤診率為12%。
討論
1.本研究所采用的人工神經(jīng)網(wǎng)絡的肺癌診斷方法的結果較好地符合了已知數(shù)據(jù),具有較高的準確性,特別是對于肺癌患者一般都能準確地做出診斷,有利于肺癌的早期發(fā)現(xiàn)和治療。
2.要想進一步提高該方法的準確性,應該注意收集更多更全面的病例數(shù)據(jù)。人工神經(jīng)網(wǎng)絡主要是利用它能自動從數(shù)據(jù)集中抽取函數(shù)的關系的功能。如果我們所使用的數(shù)據(jù)越多越全面,則其中所蘊含的事物本身的規(guī)律性就越強,利用人工神經(jīng)網(wǎng)絡從中所抽取的函數(shù)關系就越具有普遍性,因而就更準確。
3.實現(xiàn)對肺癌的診斷的關鍵在于準確找到罹患肺癌的判定函數(shù),可利用前向網(wǎng)絡的函數(shù)逼近功能來實現(xiàn)。但是這里涉及到兩個問題。首先,由于差別函數(shù)和預測率函數(shù)都是利用人工神經(jīng)網(wǎng)絡從已知的病例數(shù)據(jù)集中抽取出來的,它實際反映的是這些數(shù)據(jù)集中輸入輸出對的映射關系。因此要想保證診斷具有較高的準確性,就應該使用來建立函數(shù)關系的這些數(shù)據(jù)集(稱訓練集)具有充分的代表性,即這些數(shù)據(jù)應基本蘊含肺癌診斷的醫(yī)學原理。這就涉及到如何選擇網(wǎng)絡合理的訓練集及關鍵的輸入項。另一個問題涉及到神經(jīng)網(wǎng)絡本身的要求,即網(wǎng)絡的輸入輸出數(shù)據(jù)值都應在區(qū)間(0,1)中。這可以通過數(shù)據(jù)的編碼和歸一化來實現(xiàn)。
4.由于某些原因有些病人的病例數(shù)據(jù)不完整,約占總病例數(shù)據(jù)的10%左右。顯然,如果按照傳統(tǒng)的方法來建立肺癌病人的診斷模型〔4〕,這些有缺項的數(shù)據(jù)是不太好處理的,但是由于人工神經(jīng)網(wǎng)絡有較強的容錯性,輸入數(shù)據(jù)在某些項上的錯誤對網(wǎng)絡最終結果的正確性影響不大。
參考文獻
1.焦李成.神經(jīng)網(wǎng)絡系統(tǒng)理論.第1版.西安:西安電子科技大學出版社,1995,3
關于人工神經(jīng)網(wǎng)絡技術飛速發(fā)展時期,九十年代初期,對于人工神經(jīng)網(wǎng)絡技術的弊端予以充分解決,尤其是Hopefield的人工神經(jīng)網(wǎng)絡技術模型的提出,致使對于互聯(lián)網(wǎng)的穩(wěn)定性以及收斂性的探究有了充分的理論依據(jù)。而且將人工神經(jīng)網(wǎng)絡模型全面應用到具體的實踐中,并且得到全面推廣,同時,將科學技術和人工神經(jīng)網(wǎng)絡進行有機結合,使人工神經(jīng)網(wǎng)絡技術更加具有可研究性。
2關于人工神經(jīng)技術的構造以及典型模型
互聯(lián)網(wǎng)人工神經(jīng)技術的構造的組成包括以神經(jīng)元件為主,同時,這項包含多種神經(jīng)元結構的互聯(lián)網(wǎng)信息處理技術是可以并行存在的。每一個具體的人工神經(jīng)元件可以單一輸出,還可以和其他的神經(jīng)元件相結合,并且具有非常多的連接輸出方法,每一種連接措施都會有相應的權系數(shù)。具體的人工神經(jīng)網(wǎng)絡技術的特點有:(1)針對每一個節(jié)點i,都會有相應的狀態(tài)變量Xi存在;(2)節(jié)點j到節(jié)點i之間,是相應的權系數(shù)Wij存在;(3)在每一個節(jié)點i的后面,具體存在相應的閾值θi;(4)在每一個節(jié)點i的后面,存在變換函數(shù)fi(Xi,Wijθi),但是,通常情況來說,這個函數(shù)取fi(∑,WijXi-θi)的情況。
3將人工神經(jīng)網(wǎng)絡技術進行全面使用
互聯(lián)網(wǎng)的人工神經(jīng)網(wǎng)絡技術具有獨特的結構和處理措施,具體包括在:自動控制處理和網(wǎng)絡技術模式識別、模型圖像處理和相應的傳感器信號處理技術。信號處理技術和機器人控制處理技術、地理領域和焊接、在電力系統(tǒng)應用和相關數(shù)據(jù)挖掘、軍事和交通行業(yè)、農(nóng)業(yè)和氣象行業(yè)等多個領域紛紛體現(xiàn)出其卓越的貢獻。
ART人工神經(jīng)網(wǎng)絡技術的運用。人工神經(jīng)網(wǎng)絡技術ART在網(wǎng)絡語音和網(wǎng)絡圖像、文字處理和具體識別等方面,得到廣泛的應用;同時,在工業(yè)處理系統(tǒng)中也有相應的應用,例如,在工業(yè)系統(tǒng)中的故障診斷和故障檢測以及事故警報等情況的控制;人工神經(jīng)網(wǎng)絡ART技術還應用在數(shù)據(jù)挖掘方面,在相關數(shù)據(jù)中挖掘最穩(wěn)定和最有意義的模式。具體的神經(jīng)網(wǎng)絡技術ART的優(yōu)勢為:網(wǎng)絡技術處理能力高、穩(wěn)定性強以及聚類效果非常好。
一、前言
人工神經(jīng)網(wǎng)絡是一個多科學、綜合性的研究領域,它是根據(jù)仿生學模擬人體大腦結構和運行機制構造的非線性動力學系統(tǒng)[1]。神經(jīng)網(wǎng)絡可以看作是一種具有自組織、自學習能力的智能機器,它能模仿人的學習過程,通過給網(wǎng)絡各種范例,把網(wǎng)絡的實際輸出與希望輸出比較,根據(jù)偏差修改節(jié)點間的連接權,直到獲得滿意的輸出?,F(xiàn)已廣泛應用于經(jīng)濟學、軍事學、材料學、醫(yī)學、生物學等領域。
化工過程一般比較復雜, 對象特性多變、間歇或半連續(xù)生產(chǎn)過程多,具有嚴重非線性特性。因此,其模型化問題一直是研究的熱點。化工生產(chǎn)過程的數(shù)據(jù)或實驗室實驗數(shù)據(jù)的擬臺、分析,是優(yōu)化過程或優(yōu)化反應條件的基礎一般被處理的數(shù)據(jù)可以分為二類:靜態(tài)數(shù)據(jù)(static data)和動態(tài)數(shù)據(jù)(Dynamic data),對于靜態(tài)數(shù)據(jù)的關聯(lián),神經(jīng)網(wǎng)絡是一種很有希望的“經(jīng)驗模型”擬合工具。動態(tài)過程數(shù)據(jù)具有系統(tǒng)隨時間而變化的特征,操作參數(shù)和產(chǎn)物的產(chǎn)量和質量之間的關系更為復雜。處理和分析動態(tài)過程數(shù)據(jù)的方法除了常用的在物料衡算、能量衡算、反應動力學方程、相平衡等基礎上建立數(shù)學模型(Mathematical Models)、數(shù)理統(tǒng)計(Statistical Analysis)等方法外,用神經(jīng)網(wǎng)絡擬合動態(tài)過程數(shù)據(jù), 建立動態(tài)過程模型, 往往能從動態(tài)數(shù)據(jù)提供的模式中提取較為有用的信息,對過程進行預測、故障診斷,從而使過程得到優(yōu)化。因此,神經(jīng)網(wǎng)絡以其強大的函數(shù)映射能力, 已經(jīng)廣泛用于化工過程非線性系統(tǒng)建模領域。 它能夠通過輸入輸出數(shù)據(jù)對過程進行有效地學習,為化工過程的綜合發(fā)展提供了一種先進的技術手段。
二、人工神經(jīng)網(wǎng)絡簡介
人工神經(jīng)網(wǎng)絡(英文縮寫為ANN)簡稱神經(jīng)網(wǎng)絡,是在生物學和現(xiàn)代神經(jīng)科學研究的基礎上,對人類大腦的結構和功能進行簡化模仿而形成的新型信息處理系統(tǒng)[2,3]。由“神經(jīng)元”(neurons)或節(jié)點組成。至少含有輸入層、一個隱含層以及一個輸出層。輸入層—從外部接受信息并將此信息傳入人工神經(jīng)網(wǎng)絡,以便進行處理;隱含層—接收輸入層的信息,對所有信息進行處理;輸出層—接收人工神經(jīng)網(wǎng)絡處理后的信息,將結果送到外部接受器。當輸入層從外部收到信息時,它將被激活,并將信號傳遞到它的近鄰這些近鄰從輸入層接收到激活信號后,依次將其輸出到它們的近鄰,所得到的結果在輸出層以激活模式表現(xiàn)。
神經(jīng)網(wǎng)絡可以看作是一種具有自組織、自學習能力的智能機器,它能模仿人的學習過程。比如,一個復雜化工裝置的操作工人,開始學習操作時,由于沒有經(jīng)驗,難以保證控制質量。但經(jīng)過一段時間學習后,他就能逐步提高技能。神經(jīng)網(wǎng)絡正是模擬人類學習過程,通過給網(wǎng)絡各種范例,把網(wǎng)絡的實際輸出與希望輸出比較,根據(jù)偏差修改節(jié)點間的連接權,直到獲得滿意的輸出。人工神經(jīng)網(wǎng)絡研究工作可分成 3個大方向:(1)探求人腦神經(jīng)網(wǎng)絡的生物結構和機制,這實際上是研究神經(jīng)網(wǎng)絡理論的初衷;(2)用微電子或光學器件形成有一定功能的網(wǎng)絡,這主要是新一代計算機制造領域所關注的問題;(3)將人工神經(jīng)網(wǎng)絡作為一種解決問題的手段和方法,而這類問題用傳統(tǒng)方法無法解決或在具體處理技術上尚存在困難。
三、神經(jīng)網(wǎng)絡在化工中的應用
1.故障診斷
當系統(tǒng)的某個環(huán)節(jié)發(fā)生故障時,若不及時處理,就可能引起故障擴大并導致重大事故的發(fā)生。因此建立高效的、準確的實時故障檢測和診斷系統(tǒng),消除故障隱患,及時排除故障,確保安全、平穩(wěn)、優(yōu)質的生產(chǎn),已成為整個生產(chǎn)過程的關鍵所在。神經(jīng)網(wǎng)絡是模仿和延伸人腦智能、思維、意識等功能的非顯形自適應動力學系統(tǒng),其所具有的學習算法能使其對事物和環(huán)境具有很強的自學習、自適應和自組織能力。神經(jīng)網(wǎng)絡用于故障診斷和校正不必建立嚴格的系統(tǒng)公式或其它數(shù)學模型,經(jīng)數(shù)據(jù)樣本訓練后可準確、有效地偵破和識別過失誤差,同時校正測量數(shù)據(jù)中的隨機誤差。與直接應用非線性規(guī)劃的校正方法相比,神經(jīng)網(wǎng)絡的計算速度快,在化工過程的實時數(shù)據(jù)校正方面具有明顯的優(yōu)勢。目前應用于故障診斷的網(wǎng)絡類型主要有:BP網(wǎng)絡、RBF網(wǎng)絡、自適應網(wǎng)絡等。
Rengaswamy[4]等人把神經(jīng)網(wǎng)絡用在化工過程的初始故障預測和診斷( FDD)中,提出一種神經(jīng)網(wǎng)絡構架,利用速度訓練在分類設計中明確引入時間和過程模型映像的在線更新三個要素,來解決化工過程中的初始故障診斷問題。國內(nèi)也有關于神經(jīng)網(wǎng)絡用于故障診斷的報道,黃道[5]等人以TE (Tenneaaee Eastman,Eastman化學公司開發(fā)的過程模擬器,提供了一個實際工業(yè)過程的仿真平臺,是一種國際上通用的標準仿真模型)模型為背景,根據(jù)模型的特點進行了故障診斷。當輸入變量接近訓練過的樣本時,診斷的成功率可達100%。另外,模糊神經(jīng)元網(wǎng)絡作為一種更接近人腦思維的網(wǎng)格,也是解決此類問題的一個發(fā)展方向。李宏光[6]等人就針對化工非線性過程建模問題, 提出了由函數(shù)逼近和規(guī)則推理網(wǎng)絡構成的模糊神經(jīng)網(wǎng)絡,其規(guī)則網(wǎng)絡基于過程先驗知識用于對操作區(qū)間的劃分,而函數(shù)網(wǎng)絡采用改進型模糊神經(jīng)網(wǎng)絡結構完成非線性函數(shù)逼近,并將該技術應用于工業(yè)尿素 CO2汽提塔液位建模。
2.化工過程控制
隨著神經(jīng)網(wǎng)絡研究的不斷深入,其越來越多地應用于控制領域的各個方面,從過程控制、機器人控制、生產(chǎn)制造、模式識別直到?jīng)Q策支持神經(jīng)網(wǎng)絡都有應用。神經(jīng)網(wǎng)絡可以成功地建立流程和控制參數(shù)問的非線性關系及構造相關的數(shù)學模型,并可跟蹤瞬息過程及具有穩(wěn)健功能等,因此可有效地用于化工過程最優(yōu)化和控制。
1986年,Rumelhart第一次將ANN用于控制界。神經(jīng)元網(wǎng)絡用于控制有兩種方法,一種用來構造模型,主要利用對象的先驗信息,經(jīng)過誤差校正反饋,修正網(wǎng)絡權值,最終得到具有因果關系的函數(shù),實現(xiàn)狀態(tài)估計,進而推斷控制;另一種直接充當控制器,就像PID控制器那樣進行實時控制。神經(jīng)元網(wǎng)絡用于控制,不僅能處理精確知識,也能處理模糊信息。Tsen[7]等利用混合神經(jīng)網(wǎng)絡實現(xiàn)對乙酸乙烯酯(VA)的乳液聚合過程的預測控制。原有的該間歇過程的復雜的機理模型可對單體轉化率做出較準確的預測,然而對產(chǎn)品性質(如數(shù)均相對分子質量及其分布)的預測不太可靠。所建的混合型神經(jīng)網(wǎng)絡模型用于實現(xiàn)過程的反饋預測控制。國內(nèi)對神經(jīng)網(wǎng)絡的實質性研究相對較晚,譚民[8]在1990年提出了一種基于神經(jīng)網(wǎng)絡雙向聯(lián)想機制的控制系統(tǒng)故障診斷方法,并且作了仿真驗證。清華大學自動化系則開發(fā)了一種基于時序神經(jīng)網(wǎng)絡的故障預報方法,利用工藝現(xiàn)場數(shù)據(jù)對大型氯堿廠的氯氣中含氫氣的問題進行了模擬預報實驗。
3.藥物釋放預測
建立精確的緩釋微膠囊模型是找出最優(yōu)的工藝條件及掌握芯材釋放規(guī)律的重要一步。緩釋微膠囊的性能與影響因素之間足一種多輸入、多輸出、復雜的非線性關系。機理分析法和傳統(tǒng)的系統(tǒng)辨識法對輸入、多輸出問題適應性差,過分依賴研究領域的知識與經(jīng)驗,難以得到實用的緩釋微膠囊模型。人工神經(jīng)網(wǎng)絡能夠很好地解決傳統(tǒng)方法不能解決的具有高度非線性、耦合性、多變量性系統(tǒng)的建模問題并具有獨特的優(yōu)勢。
趙武奇[9]等人建立了紅景天苷緩釋微囊的人工神經(jīng)網(wǎng)絡模型及其遺傳算法優(yōu)化技術,用神經(jīng)網(wǎng)絡模型描述了微囊制作參數(shù)與性能之間的關系,并用遺傳算法優(yōu)化微囊制作工藝參數(shù),設計出性能最佳的微囊制作工藝參數(shù)。范彩霞[10]等人以難溶性藥物氟比洛芬為模型藥物,制備了17個處方并進行釋放度檢查。氟比洛芬和轉速作為自變量,取其中l(wèi)4個處方為訓練處方,其余3個處方為驗證處方,將自變量作為人工神經(jīng)網(wǎng)絡的輸入,藥物在各個取樣時間點的釋放為輸出,采用剔除一點交叉驗證法建立了人工神經(jīng)網(wǎng)絡模型。并通過線性回歸和相似因子法比較人工神經(jīng)網(wǎng)絡和基于二元二項式的響應面法的預測能力,顯示了人工神經(jīng)網(wǎng)絡的預測值與實測值的接近程度。
4.物性估算
用神經(jīng)網(wǎng)絡來解決估算物質的性質必須解決三個基本問題,第一個是對物質的表征問題;第二個是采用何種神經(jīng)網(wǎng)絡及其算法問題;第三個是神經(jīng)網(wǎng)絡輸入與輸出數(shù)據(jù)的歸一化問題。無論采用哪種方法對數(shù)據(jù)進行處理,當用經(jīng)過訓練的神經(jīng)網(wǎng)絡進行物性估計時,不能將網(wǎng)絡直接的輸出值作為物性預估值,而是要將輸出值再乘上一個系數(shù),這個系數(shù)就是前面進行歸一化處理時對數(shù)據(jù)的除數(shù),相乘后得到的值作為物性估算值。神經(jīng)網(wǎng)絡用于物性估算,目前采用的就是BP網(wǎng)絡或在此基礎上的各種改進形式。常壓沸點進行估算和研究。Prasad[11]等人利用神經(jīng)網(wǎng)絡對有機化合物的物理性質進行了預測,并與傳統(tǒng)的基團貢獻法比較,可以得到更為準確的物性參數(shù)。而后,董新法、方利國[12]等人將神經(jīng)網(wǎng)絡在物性估算中的應用作了一個全面而又簡要的講解,并提出神經(jīng)網(wǎng)絡在物性估算中潛在的應用前景,為其發(fā)展及其以后的應用研究提供了很好的工作平臺。
目前,人工神經(jīng)網(wǎng)絡在各個領域中的應用都在向人工智能方向發(fā)展。不斷豐富基礎理論和開展應用研究、完善其技術的可靠性、開發(fā)智能性化工優(yōu)化專家系統(tǒng)軟件,對于我國的化工發(fā)展具有重要意義。此外,模糊理論、小波變換、統(tǒng)計學方法和分形技術等信息處理方法和理論與神經(jīng)網(wǎng)絡的結合解決化工類問題,被認為是一種發(fā)展趨勢。
參考文獻
[1]高大文,王鵬,蔡臻超.人工神經(jīng)網(wǎng)絡中隱含層節(jié)點與訓練次數(shù)的優(yōu)化[J].哈爾濱工業(yè)大學學報, 2003, 35(2): 207-209.
[2]蘇碧瑤.人工神經(jīng)網(wǎng)絡的優(yōu)化方法[J]. 科技資訊, 2011(30): 239-240.
[3]黃忠明, 吳志紅, 劉全喜. 幾種用于非線性函數(shù)逼近的神經(jīng)網(wǎng)絡方法研究[J]. 兵工自動化,2009, 28(10): 88-92.
[4]Rengaswamy R, Venkatasubramanian V. A fast training neural network and its updation for incipient fault detection and diagnosis[J].Computers and Chemical Engineering, 2000,(24): 431-437.
[5]黃道, 宋欣.神經(jīng)網(wǎng)絡在化工過程故障診斷中的應用[J].控制工程,2006,(13): 6-9.
[6]李宏光,何謙.化工過程建模中的一類復合型模糊神經(jīng)網(wǎng)絡[J]. 計算機與應用化學,2000,17(5): 399-402.
[7]Tsen A D, Shi S J, Wong D SH, etal. Predictive Control of Quality in Batch Polymerization Using a Hybrid Artificial Neural Network Model[J]. AIChE Journal,1996, 42(2): 455-465.
[8]譚民, 疏松桂. 基于神經(jīng)元網(wǎng)絡的控制系統(tǒng)故障診斷[J]. 控制與決策, 1990(1): 60-62.
[9]趙武奇, 殷涌光, 仇農(nóng)學. 基于神經(jīng)網(wǎng)絡和遺傳算法的紅景天苷緩釋微囊制備過程建模與優(yōu)化[J]. 西北農(nóng)林科技大學學報(自然科學版), 2006,34(11): 106-110.
[10] 范彩霞, 梁文權, 陳志喜. 人工神經(jīng)網(wǎng)絡預測氟比洛芬HPMC緩釋片的藥物釋放[J]. 中國醫(yī)藥工業(yè)雜志, 2006, 37(10): 685-688.
通過對靜態(tài)鄰域的各種結構以及它們對技術性能影響進行分析后得出,在拓撲適應性方面星形拓撲、VonNeumann拓撲以及環(huán)形拓撲最好。此外,人工神經(jīng)網(wǎng)絡技術性能與鄰域密切相關,處理復雜問題時小鄰域的人工神經(jīng)網(wǎng)絡技術性能較好,但是處理簡單問題上大鄰域的人工神經(jīng)網(wǎng)絡技術性能會更好。Chend從改進人工神經(jīng)網(wǎng)絡結構的角度出發(fā),提出了一種具有雙結構的人工神經(jīng)網(wǎng)絡技術。技術將神經(jīng)網(wǎng)絡單元分為M+1層,其中“1”指頂層,技術通過獲得頂層神經(jīng)網(wǎng)絡單元的全局最優(yōu)值影響其余各層的粒子對最優(yōu)值的探索,以此提高神經(jīng)網(wǎng)絡單元搜索結果的多樣性。該技術考慮到神經(jīng)網(wǎng)絡單元體表現(xiàn)以及粒子個體的表現(xiàn),并將其作為觸發(fā)條件控制領域變化從而提高尋優(yōu)效率。提出了KRTG-人工神經(jīng)網(wǎng)絡技術,通過產(chǎn)生隨機動態(tài)的網(wǎng)絡拓撲結構并將平均值引入到粒子更新公式中,增加了種群的多樣性,改善了粒子間信息的傳播速度。
1.2結合其他技術改進
相關研究將遺傳技術中遺傳算子的選擇、交叉、變異等過程與人工神經(jīng)網(wǎng)絡技術相結合,提出一種混合技術。改進后的技術提高人工神經(jīng)網(wǎng)絡技術的性能,增加種群的多樣性并提高逃離局部最小的能力,可以將差分進化技術和人工神經(jīng)網(wǎng)絡技術相結合,通過兩種技術的交叉執(zhí)行來提高改進技術的效率。白俊強等將二階振蕩和自然選擇兩種方法融入到人工神經(jīng)網(wǎng)絡技術中,通過二階振蕩對技術速度公式進行更新,通過自然選擇提高了神經(jīng)網(wǎng)絡單元中靠近最優(yōu)值粒子的比重。通過收集粒子的取值信息構建記憶庫,讓庫中信息和粒子自身極值共同決定粒子的尋優(yōu)方向,從而提高尋優(yōu)準確性。
2人工神經(jīng)網(wǎng)絡技術在計算機系統(tǒng)中的應用
2.1系統(tǒng)管理模塊
系統(tǒng)管理模塊主要是系統(tǒng)管理員對系統(tǒng)進行維護操作,包括用戶的認證、數(shù)據(jù)的維護以及系統(tǒng)安全管理。系統(tǒng)用戶認證模塊,由于系統(tǒng)的用戶包括專家用戶,負責對評估因子進行篩選確定以及對評估因子進行打分操作;管理員,負責系統(tǒng)維護以及相關數(shù)據(jù)的錄入、修改和刪除操作;普通用戶,所以系統(tǒng)需要對用戶進行認證以便完成與其身份相對應的操作,確保系統(tǒng)安全。系統(tǒng)的后臺維護模塊主要用來完成數(shù)據(jù)庫導出以及軟件維護操作,系統(tǒng)安全管理模塊主要對系統(tǒng)的用戶權限進行管理。
2.2資源管理模塊
資源管理模塊主要是用來管理系統(tǒng)所有的安全駕駛理論知識體系的,包括文字、圖片、視頻和動畫。主要操作有插入、修改、刪除。文字信息管理模塊,面向系統(tǒng)管理員,主要用來管理系統(tǒng)的文字信息,文字信息包括地點名稱等信息,文字對應相應的知識點,大多以理論知識和測試題的模式存在于模塊中。圖片信息管理模塊面向系統(tǒng)管理員,主要用來管理圖片相關信息,包括圖片名稱、所屬知識點信息。圖片和文字一樣,用來進行知識的展示。視頻信息管理模塊面向系統(tǒng)管理員,主要用來管理視頻信息,采用人工神經(jīng)網(wǎng)絡技術。人工神經(jīng)網(wǎng)絡技術指以神經(jīng)元方式在網(wǎng)絡中傳送音頻、視頻和多媒體文件的媒體傳輸技術。
2.3系統(tǒng)關鍵技術
2.3.1使用人工神經(jīng)網(wǎng)絡作為接口處理規(guī)范。
由于本系統(tǒng)是在瀏覽器中訪問,需要訪問核心數(shù)據(jù)庫,在這里我們采用人工神經(jīng)網(wǎng)絡技術,可以對系統(tǒng)數(shù)據(jù)訪問接口進行擴展,對數(shù)據(jù)進行格式化以提高可讀性。在系統(tǒng)中我們采用的是標準的人工神經(jīng)網(wǎng)絡格式,其中報文分為報文的頭和體兩部分。
2.3.2系統(tǒng)網(wǎng)絡拓撲結構。
為了保障系統(tǒng)的安全性,我們在這里采用兩個服務器:一個是用于數(shù)據(jù)存儲的服務器;另一個是用于用戶請求處理的服務器。系統(tǒng)對于用戶的使用分為內(nèi)網(wǎng)用戶和外網(wǎng)用戶,內(nèi)網(wǎng)用戶是在內(nèi)部局域網(wǎng)進行訪問系統(tǒng),針對的是學習系統(tǒng)的管理員,外部用戶是互聯(lián)網(wǎng)上的用戶,針對的是進行在線學習的學習者。在服務器與內(nèi)網(wǎng)、內(nèi)網(wǎng)與外網(wǎng)之間都設置了防火墻,以保障數(shù)據(jù)的傳輸安全和數(shù)據(jù)庫的安全。這樣的拓撲結構有效地保障了系統(tǒng)的安全性和穩(wěn)定性,其好處主要包括:人工神經(jīng)網(wǎng)絡三層結構將業(yè)務處理和數(shù)據(jù)處理的服務器分開,有利于系統(tǒng)的維護和升級,保障了系統(tǒng)數(shù)據(jù)的安全;分布式的網(wǎng)絡布局,對于不同的用戶有不同的訪問方式,多渠道的訪問方式有效地避免了不兼容的情況的發(fā)生,系統(tǒng)的可用性得到了提高。
2.4數(shù)據(jù)庫設計
所選擇的數(shù)據(jù)庫需要有良好數(shù)據(jù)組織結構,可以使整個系統(tǒng)迅速、方便、準確地調用管理所需的數(shù)據(jù),提高整個系統(tǒng)的性能。為了達到上述要求,系統(tǒng)采用神經(jīng)元數(shù)據(jù)庫。神經(jīng)元數(shù)據(jù)庫是一個對象——關系型數(shù)據(jù)庫,它提供了開放、全面、集成的信息管理方法,數(shù)據(jù)存儲具有透明性。有了一個高性能數(shù)據(jù)庫作為基礎,還需要好的數(shù)據(jù)庫結構,數(shù)據(jù)庫結構設計的好壞將直接影響系統(tǒng)的效率和實現(xiàn)的效果,好的數(shù)據(jù)結構設計會使得系統(tǒng)具有較快的響應速度,提高數(shù)據(jù)的完整性和一致性,大大提高整個系統(tǒng)的性能。
中圖分類號:TP18 文獻標識碼:A 文章編號:1009-3044(2014)06-1285-02
Research on the Application of Artificial Neural Network
LI Hong-chao
(China University of Petroleum (East China), Qingdao 266580,China)
Abstract: Artificial neural networks are part of an integrated artificial intelligence, it is proposed is based on research of modern neuroscience. With the continuous development of artificial neural networks, and their use more widely. This article first analyzes the basic concepts and features of artificial neural networks, from six aspects of information, medicine, psychology and other details of the application of artificial neural networks.
Key words: artificial neural network; information processing; risk assessment
1 人工神經(jīng)網(wǎng)絡
人工神經(jīng)網(wǎng)絡,英文名為“Artificial Neural Network”,簡稱ANN,它充分分析大腦神經(jīng)突觸聯(lián)接的結構特點,對其進行模擬,然后進行信息處理。簡單來說,人工神經(jīng)網(wǎng)絡就是對人腦結構、人腦功能的模仿。它的特點有很多,比如非線性、非局限性、非常定性、非凸性等。這些特點鑄就了人工神經(jīng)網(wǎng)絡的各種功能,促進了它的應用。
2 人工神經(jīng)網(wǎng)絡的應用
隨著人們對人工神經(jīng)網(wǎng)絡的不斷研究,人工神經(jīng)網(wǎng)絡的作用越來越大,給人們提供了更好的服務,下面就以人工神經(jīng)網(wǎng)絡在信息領域、醫(yī)學、經(jīng)濟領域、控制領域、交通運輸、心理學六個方面分別介紹其應用。
2.1 信息領域
人工神經(jīng)網(wǎng)絡在信息領域的應用分為兩個方面,一個是信息處理,一個是信息識別。
1)信息處理
由于現(xiàn)代信息的多樣化和多變性的特點,信息處理就變得復雜起來,人工神經(jīng)網(wǎng)絡可以對人的一部分思維能力進行模仿甚至代替,解決傳統(tǒng)信息處理的困難。在通常情況下,人工神經(jīng)網(wǎng)絡可以自動診斷問題,開啟問題求解模式。另外,人工神經(jīng)網(wǎng)絡系統(tǒng)的容錯性能高,當其連接線遭到破壞,自身的組織功能還是可以保持它的優(yōu)化工作狀態(tài)。因此,軍事系統(tǒng)充分利用這一優(yōu)勢,在其電子設備廣泛應用人工網(wǎng)絡信息系統(tǒng)。
2)模式識別
這項功能的理論基礎有兩個,一個是貝葉斯的概率論,另一個是申農(nóng)提出的信息論。模式識別主要是分析和處理存在于目標體上的各種形式的信息,然后在處理和分析的基礎上對目標體進行描述、辨認等過程。隨著人工神經(jīng)網(wǎng)絡在模式識別中的應用,傳統(tǒng)的模式識別逐漸被取代。隨著模式識別的發(fā)展,已經(jīng)逐漸應用到語音識別、人臉識別、文字識別等各個方面。
2.2 醫(yī)學領域
人體是非常復雜的,在醫(yī)學中,想要弄清楚疾病的類型、疾病的嚴重情況等,僅僅依靠傳統(tǒng)的望聞問切診斷方法是遠遠不夠的,醫(yī)學的發(fā)展需要運用新技術。人工神經(jīng)網(wǎng)絡應用于醫(yī)學中,可以分析生物信號,觀察信息的表現(xiàn)形式以及研究信息的變化規(guī)律,將這三者的結果進行分析和比較,從而掌握病人的病情。
1)生物信號的檢測與分析
在醫(yī)學診斷中,醫(yī)生基本上都是通過對醫(yī)學設備中呈現(xiàn)出來的連續(xù)波形進行分析。人工神經(jīng)網(wǎng)絡中有一套自適應的動力學系統(tǒng),該系統(tǒng)由一些數(shù)量龐大的簡單處理單元互相連接。因此,它具有多種功能,比如Massively Parallelism,即所謂的巨量并行,分布式存貯功能以及強大的自組織自學習功能等。用常規(guī)處理法處理生物醫(yī)學信號分析非常困難,而人工神經(jīng)網(wǎng)絡的功能可以有效解決難題,其在生物醫(yī)學人腦檢測與處理中的應用非常廣泛,比如分析電腦信號,對心電信號進行壓縮處理,醫(yī)學圖像的識別等,在很大程度上促進了醫(yī)學的發(fā)展。
2)醫(yī)學專家系統(tǒng)
對于傳統(tǒng)的專家系統(tǒng)而言,其工作原理基本上就是先由專家根據(jù)自己多年的醫(yī)學經(jīng)歷,總結自己的經(jīng)驗和所掌握的知識,以某種規(guī)則的形式將這些經(jīng)驗和知識存儲在電腦中,建立一個專家的知識庫,然后借助邏輯推理等方式開展醫(yī)療診斷工作。但是,隨著專家知識的不斷增長和經(jīng)驗的日益豐富化,數(shù)據(jù)庫的規(guī)模會越來越大,極有可能產(chǎn)生知識“爆炸”的現(xiàn)象。同時,專家在獲取知識的過程中也會遇到困難,導致工作效率低下。人工神經(jīng)網(wǎng)絡中的非線性并行處理方式解決了傳統(tǒng)專家系統(tǒng)中的困難,在知識推理、自組織等方面都有了很大的提高,醫(yī)學專家系統(tǒng)也開始逐漸采用人工神經(jīng)網(wǎng)絡系統(tǒng)。
在醫(yī)學領域中,麻醉和危重醫(yī)學的研究過程中,存在很多的生理方面的分析與檢測工作,人工神經(jīng)網(wǎng)絡系統(tǒng)有良好的信號處理能力,排除干擾信號,準確檢測臨床狀況的相關情況,有力促進了醫(yī)學的發(fā)展。
2.3 經(jīng)濟領域
經(jīng)濟的快速有效增長是基于人們對市場規(guī)律良好的掌握和運用以及對經(jīng)濟活動中的風險評估,及時應對和解決,這樣才能保障經(jīng)濟活動的快速發(fā)展。人工神經(jīng)網(wǎng)絡應用于經(jīng)濟領域,主要有預測市場價格和評估經(jīng)濟風險兩個方面。
1)預測市場價格的波動情況
商品的價格主要是由市場的供求關系和國家宏觀調控來變化的。國家的宏觀調控是客觀存在的,我們可以在遵循國家宏觀調控的前提之下分析市場的供求關系,從而預測商品的市場價格。在傳統(tǒng)的統(tǒng)計學方法中,在預測價格波動時因其自身的局限性,難以做出科學的判斷。人工神經(jīng)網(wǎng)絡可以有效處理不完整數(shù)據(jù)和規(guī)律性不強的數(shù)據(jù),它是傳統(tǒng)統(tǒng)計方法所不能達到的。人工神經(jīng)網(wǎng)絡系統(tǒng)基于市場價格的確定機制,綜合分析影響商品價格的因素,比如城市化水平、人均工資水平、貸款情況等,將這些復雜的因素綜合起來,建立一個模型,通過模型中的數(shù)據(jù)顯示,科學預測商品的市場價格波動情況,有效利用商品的價格優(yōu)勢。
2)評估經(jīng)濟風險
經(jīng)濟風險,即Economic Exposure,它指的是由于經(jīng)濟前景的一些不確定因素,導致經(jīng)濟實體出現(xiàn)重大的經(jīng)濟損失。在處理經(jīng)濟風險的時候,做好的措施就是防患于未然,做好評估和預測,將經(jīng)濟風險扼殺在萌芽時期。人為的主觀判斷經(jīng)濟風險具有一定的可靠性,但是也存在很多的不足。將人工神經(jīng)網(wǎng)絡系統(tǒng)應用于評估經(jīng)濟風險,可以有效彌補人為判斷風險的不足。人工神經(jīng)網(wǎng)絡先提取具體風險來源,然后在此基礎上構建出一個模型,這個模型一般要符合實際情況,通過對模型的研究,得出風險評價系數(shù),最終確定有效的解決方案。
2.4 控制領域
隨著人工神經(jīng)網(wǎng)絡的不斷發(fā)展,人們開始研究其在控制領域的應用。比如現(xiàn)在的機器人的攝像機控制、飛機控制等。它主要是通過控制圖像傳感器,再結合圖像表面的非線性關系,進行計算和分析,另外,它還可以將圖像傳感器瞄準到處于運動狀態(tài)中的目標物上。
2.5 交通運輸
交通問題具有高度的非線性特點,它的數(shù)據(jù)處理是非常龐大和復雜的,這與人工神經(jīng)網(wǎng)絡有很大的吻合性。就目前來講,人工神經(jīng)網(wǎng)絡應用到交通領域有模擬駕駛員的行為、分析交通的模式等等。
2.6 心理學
人工神經(jīng)網(wǎng)絡是對人腦神經(jīng)元的信息處理能力的模擬,本身就帶有一定的抽象性,它可以訓練很多的認知過程,比如感覺、記憶、情緒等。人們通過對人工神經(jīng)系統(tǒng)的不斷研究,多個角度分析了其認知功能。就目前來看,人工神經(jīng)網(wǎng)絡可以分析人的認知,同時對認知方面有缺陷的病人進行模擬,取得了很大的進步。當然,人工神經(jīng)網(wǎng)絡應用于心理學領域也存在很多的問題,比如結果精確度不高、模擬算法的速度不夠等,這些都需要人們持之以恒的研究。突破這些難題,促使人工神經(jīng)網(wǎng)絡有效應用于心理學領域。
3 結束語
綜上所述,隨著人工神經(jīng)網(wǎng)絡的不斷發(fā)展,它特有的非線性適應能力和自身的模擬結構都有效推動了其應用范圍。我們應該不斷運用新技術,不斷完善人工神經(jīng)網(wǎng)絡的功能,拓寬其應用范圍,促進其智能化、功能化方向發(fā)展。
參考文獻:
[1] 毛健,趙紅東,姚婧婧.人工神經(jīng)網(wǎng)絡的發(fā)展及應用[J].電子設計工程,2011(12).
[2] 林和平,張秉正,喬幸娟.回歸分析人工神經(jīng)網(wǎng)絡[J].吉林大學學報:信息科學版,2010(3).
引言
林分材種出材率是林分調查工作的重要指標,它可以進一步評價森林木材資源的經(jīng)濟價值,而研究森林木材,又可以合理正確的經(jīng)營森林資源,達到人與自然和諧相處的目的。林分林種出材率就是原木材積于立木材積之比,我國現(xiàn)行的森林采伐限額制度、查處亂砍濫伐林木案件、制訂林業(yè)發(fā)展規(guī)劃、計劃和編制森林經(jīng)營方案、預測和計算、開展森林資源資產(chǎn)評估等等,都需掌握積蓄量和材種的出材率的指標。我國已經(jīng)不斷學習借鑒前蘇聯(lián)的先進技術編制自己的材種出材率表了,隨著我國天然林保護工程的全面實施和林業(yè)分類經(jīng)營的逐步推行,人工商品林比例的不斷提高,我國森林結構和性質也有所變化,所以傳統(tǒng)的統(tǒng)計學以難以解決很多問題,運用人工神經(jīng)網(wǎng)絡在林業(yè)生成與運用則是一個不二之選的方法,對林業(yè)的發(fā)展也有很大的理論價值和推廣意義。
人工神經(jīng)網(wǎng)絡(Artificial Neural Network-ANN),簡稱“神經(jīng)網(wǎng)絡”,是由大量處理單元過極其豐富和完善的互聯(lián)組成的非線性、自適應信息處理系統(tǒng)。它的提出是基于現(xiàn)代神經(jīng)科學研究成果上,以模擬大腦神經(jīng)網(wǎng)絡處理、記憶信息的方式進行信息處理。涉及學科較多,較為廣泛。
1 研究內(nèi)容和方法
平均樹高,平均胸徑,林種年齡,立地質量,積蓄量,保留密度等等因素都會影響林分材種出材率,而林分林種出材率具有非線性和非確定性的因素,一般采用統(tǒng)計分析方法進行預測采樣,需要大量的林木樣本元素,模型涉及的許多參數(shù)無法或很難有較高的精確度。
人工神經(jīng)網(wǎng)絡(Artificial Neural Network)具有非線性,非局限性,自適應,自組織,自學習的特征,相較于傳統(tǒng)的統(tǒng)計學方法,不同之處在于它的容錯性和儲存量,通過單元之間的相互作用,相互連接能模擬大腦的局限性。ANN的獨到之處,也使得人們注意了ANN,并且廣泛的應用于各種學科之中,如心理學,邏輯學,數(shù)學模型,遺傳算法,語音識別,智能控制等等。當然,運用人工神經(jīng)網(wǎng)絡對林分林種出材率進行預測也同樣具有很好的效果與實現(xiàn)。
研究主要完成,通過對數(shù)據(jù)的采樣和分析處理,對神經(jīng)網(wǎng)路預測模型的結構,參數(shù)進行優(yōu)化,再應用到林分材種出材率的預測中。以c++程序設計為設計平臺,運用人工神經(jīng)網(wǎng)絡中的BP算法,分析各隱含層神經(jīng)元的數(shù)量,訓練的次數(shù),隱含層函數(shù),樣本數(shù)量,進行優(yōu)化建立林分材種出材率的預測模型。
1.1BP人工神經(jīng)網(wǎng)絡
BP(Back-Propagation Network)神經(jīng)網(wǎng)絡是一種以誤差逆?zhèn)鞑ニ惴?BP)訓練的多層前饋網(wǎng)絡,目前應用較為廣泛的神經(jīng)網(wǎng)絡模型之一。BP神經(jīng)網(wǎng)絡能學習和存貯多個輸入-輸出模式映射關系,而且無需事前對這種映射關系的數(shù)學方程進行描述。它通過不斷反向傳播來調整神經(jīng)網(wǎng)絡的權值和閾值,使神經(jīng)網(wǎng)絡的誤差平方和最小。BP神經(jīng)網(wǎng)絡模型拓撲結構由三層組成分別是輸入層(input)、隱層(hidelaver)和輸出層(output layer)。
BP人工神經(jīng)網(wǎng)絡主要以標準BP算法為主,而標準BP算法有存在許多問題,由于是非線性梯度優(yōu)化算法,就會存在局部極小值問題,使得精確度受限;算法迭代系數(shù)過多,使得學習率降低,收斂速度降低;網(wǎng)絡對初始化的值存在發(fā)散和麻痹;隱節(jié)點不確定性的選取。所以引進了幾種BP算法:動量BP算法、學習速率可變的BP算法和LM算法(Levenberg-Marquardt)。動量BP算法以上一次修正結果來影響本次的修正,動量因子越大,梯度的動量就越大。學習效率可變的BP算法怎是力求算法的穩(wěn)定,減小誤差。為了在近似二階訓練速率進行修正時避免計算HeSSian矩陣,選擇LM算法。所以為了神經(jīng)網(wǎng)絡計算的速度與精確度,所以運用不同的優(yōu)化算法來改善BP網(wǎng)絡中的局部極小值問題,提高收斂速度和避免了抖動性。
2 基于BP人工神經(jīng)網(wǎng)絡和林分材種出材率預測模型的建立
分析了大量的材種出材率的相關資料后,均有非線性的特征,對于模型的建立和預測,傳統(tǒng)的識別系統(tǒng)在研究和實踐中有很大的問題,而采用人工神經(jīng)網(wǎng)絡,不僅其特征是非線性,而且人工神經(jīng)網(wǎng)絡具有較為穩(wěn)定的優(yōu)越性,所以,對于林分材種出材率的預測和建立采用BP人工神經(jīng)網(wǎng)絡。
2.1建模工具
研究采用c++程序設計對數(shù)值的計算和預測,對模型進行編譯和實現(xiàn)。c++語言是受到非常廣泛應用的計算機編程語言,它支持過程化程序設計,面向對象程序設計等等程序設計風格。c++是一門獨立的語言,在學習時,可以結合c語言的知識來學習,而c++又不依賴于c語言,所以我們可以不學c語言而直接學習C++。
用c++來模擬BP網(wǎng)絡是相對較好的程序設計語言,以面向對象程序設計來設計和實現(xiàn)林分材種出材率的BP算法,直觀而簡潔。
2.2BP神經(jīng)網(wǎng)絡結構的確定
對于使用BP算法,關鍵在于隱含層層數(shù)和各層節(jié)點數(shù)。而神經(jīng)元的輸入輸出又影響著隱含層層數(shù),而對于BP萬羅中的輸入輸出層是確定的,重點就在于隱含層層數(shù),增加隱含層數(shù)可以提高網(wǎng)絡的處理能力,是的訓練復雜化,樣本數(shù)目增加,收斂速度變慢等,而隱含層的節(jié)點數(shù)越多,可以提到其精確度。
研究過程中,多層隱含層會將訓練復雜化,所以我們往往選擇三層就夠了,即一個輸入層,一個隱含層,一個輸出層的基本單層BP網(wǎng)絡結構。最后確定以下四個神經(jīng)元:平均樹高、平均胸徑、林種年齡、每公頃積蓄量作為輸入單元。輸出單元為林分材種出材率。
結論
中圖分類號:TP183 文獻標識碼:A文章編號:1006-4311(2012)08-0112-02
0引言
工業(yè)品出廠價格指數(shù)(PPI)是衡量工業(yè)企業(yè)產(chǎn)品出廠價格變動趨勢和變動程度的指數(shù),是反映某一時期生產(chǎn)領域價格變動情況的重要經(jīng)濟指標,也是制定有關經(jīng)濟政策和國民經(jīng)濟核算的重要依據(jù)。
工業(yè)品出廠價格指數(shù)的調查范圍是工業(yè)企業(yè)出售給本企業(yè)以外所有單位的各種生產(chǎn)資料和直接出售給居民用于生活消費的各種生活資料。其中,生產(chǎn)資料包括原材料工業(yè)、采掘工業(yè)和加工工業(yè)3類;生活資料包括一般日用品、食品、衣著和耐用消費品4類。在PPI的結構中,生產(chǎn)資料所占的權重較大,超過了70%;生活資料所占的權重只有不到30%。因此PPI在很大程度上反映的是工業(yè)企業(yè)生產(chǎn)成本的高低。目前我國PPI覆蓋了全部39個工業(yè)行業(yè)大類,涉及186個種類,4000多種產(chǎn)品。
我國現(xiàn)行的工業(yè)品價格指數(shù)是采用算術平均法編制的。其中除包括工業(yè)企業(yè)售給商業(yè)、外貿(mào)、物資部門的產(chǎn)品外,還包括售給工業(yè)和其他部門的生產(chǎn)資料以及直接售給居民的生活消費品。通過工業(yè)生產(chǎn)價格指數(shù)能觀察出廠價格變動對工業(yè)總產(chǎn)值的影響。工業(yè)品出廠價格指數(shù)的計算公式為:工業(yè)品出廠價格指數(shù)=工業(yè)總產(chǎn)值總指數(shù)/工業(yè)總產(chǎn)量總指數(shù)×100%。我國目前編制的工業(yè)品出廠價格指數(shù)的4種分組:①輕、重工業(yè)分組;②生產(chǎn)資料和生活資料分組;③工業(yè)部門分組;④工業(yè)行業(yè)分組。權數(shù)計算資料來源于工業(yè)經(jīng)濟普查數(shù)據(jù)。工業(yè)品出廠價格指數(shù)的權數(shù)確定,采用分攤權數(shù)。
在市場經(jīng)濟活動中,資源配置是通過價格漲跌引導市場主體的經(jīng)濟活動來完成的。因此,價格的波動對經(jīng)濟運行會有很大的影響,價格總水平的波動也是一個重要的宏觀經(jīng)濟現(xiàn)象。通常認為PPI反映的是工業(yè)品進入流通領域的最初價格,是制定工業(yè)品批發(fā)價格和零售價格的基礎,而CPI反映的是居民購買消費品的價格。
為抑制通貨膨脹,中央銀行需要準確把握通貨膨脹的先行指標,從而正確把握經(jīng)濟和物價的未來走勢并進行前瞻性調控。根據(jù)價格傳導規(guī)律,PPI對CPI有一定的影響。研究表明PPI引導了CPI變動,其原因是生產(chǎn)資料價格指數(shù)、生活資料價格指數(shù)和原材料、燃料和動力價格指數(shù)都引導了CPI變動,PPI可以作為我國通貨膨脹的先行指標,政府和學者可以利用PPI預測通貨膨脹[1-2]。PPI是一個非常復雜的、受諸多因素影響的非線性系統(tǒng)。如果采用傳統(tǒng)的計量經(jīng)濟模型無法很好地提高預測精度。
目前對PPI預測的研究較少,鑒于PPI的時間序列是是非線性的,為了準確和客觀地預測PPI,采用人工神經(jīng)網(wǎng)絡預測方法。人工神經(jīng)網(wǎng)絡是目前一種有效的預測方法,大量的仿真實驗和理論研究已經(jīng)證明BP算法是一種有效的神經(jīng)網(wǎng)絡學習算法,它具有很強的處理非線性問題的能力,近年來已經(jīng)廣泛應用到經(jīng)濟領域中。但在實際應用中,BP算法也暴露出一些自身的缺點,如算法容易陷入局部極值點,收斂速度慢等,這使得BP算法只能解決小規(guī)模的問題,求得全局最優(yōu)的可能性較小,這樣限制了BP算法在實際中的應用。因此應用改進BP算法的人工神經(jīng)網(wǎng)絡模型預測PPI。
1PPI預測模型的建立
人工神經(jīng)網(wǎng)絡是理論化的人腦神經(jīng)網(wǎng)絡的數(shù)學模型,是基于模仿大腦神經(jīng)網(wǎng)絡結構和功能而建立的一種信息處理系統(tǒng)。其信息的處理是通過學習動態(tài)修改各神經(jīng)元之間的連接權值閾值來實現(xiàn)的。根據(jù)某一學習規(guī)則,通過修改神經(jīng)元之間的連接權值和閾值,存儲到神經(jīng)網(wǎng)絡模型中,建立輸入層神經(jīng)元與輸出層神經(jīng)元之間的高度非線性映射關系,并通過學習后的神經(jīng)網(wǎng)絡來識別新的模式或回憶過去的記憶。在各種神經(jīng)網(wǎng)絡模型中,80%-90%的模型采用誤差反向傳播神經(jīng)網(wǎng)絡(簡稱BP神經(jīng)網(wǎng)絡)或它的變化形式。BP神經(jīng)網(wǎng)絡是前饋網(wǎng)絡的核心部分,體現(xiàn)了人工神經(jīng)網(wǎng)絡最精華的部分。1989年Robert Hecht-Nielson證明了對于任何的連續(xù)函數(shù)映射關系都可以用含有一個隱含層的BP神經(jīng)網(wǎng)絡來逼近。
BP神經(jīng)網(wǎng)絡具有非局域性、非線性、非定常性和非凸性,在信息處理方面具有如下顯著特點:BP神經(jīng)網(wǎng)絡具有自適應和自組織能力,通過與外界環(huán)境的相互作用,從外界環(huán)境中獲取知識,把環(huán)境的統(tǒng)計規(guī)律反映到自身結構上來,并能有機地融合多種信息。當外界環(huán)境發(fā)生變化時,只需輸入新的資料讓模型再學習即可很快跟蹤環(huán)境的變化,可操作性強。BP神經(jīng)網(wǎng)絡模型的建立不需要有關體系的先驗知識,主要依賴于資料,只需給網(wǎng)絡若干訓練實例,BP神經(jīng)網(wǎng)絡就可以通過自學習來完成,完全能夠發(fā)現(xiàn)其隱含的信息,并有所創(chuàng)新。BP神經(jīng)網(wǎng)絡作為一個高度的非線性動態(tài)處理系統(tǒng),具有很強的容錯功能。由于神經(jīng)元之間的高維、高密度的并行計算結構,神經(jīng)網(wǎng)絡具有很強的集體計算能力,完全可以進行高維數(shù)據(jù)的實時處理,同時也可以進行分布式聯(lián)想存儲。
工業(yè)品出廠價格指數(shù)(PPI)數(shù)據(jù)來源于《中國統(tǒng)計年鑒(2009年)》,PPI數(shù)據(jù)時間范圍為1990年-2008年。在實際應用中,由于所采集的數(shù)據(jù)跨度較大,為提高訓練速度和靈敏性以及有效避開Sigmoid函數(shù)的飽和區(qū),一般要求輸入數(shù)據(jù)的值在0-l之間。再有,為保證建立的模型具有一定的外推能力,最好使數(shù)據(jù)預處理后的值在0.2-0.8之間,把0-0.2和0.8-1.0的空間預留。下面是數(shù)據(jù)預處理和反預處理算法:①數(shù)據(jù)預處理法:y=(0.8-0.2)*(x-min(x))/ (max(x)-min(x))+0.2。②反預處理算法:x=(y-0.2)*(max(x)-min(x))/(0.8-0.2)+min(x)。其中:x是工業(yè)品出廠價格指數(shù)原始數(shù)據(jù);y是預處理后的工業(yè)品出廠價格指數(shù)數(shù)據(jù);max(x)和min(x)分別是工業(yè)品出廠價格指數(shù)原始數(shù)據(jù)取值范圍的最大值與最小值。
我國歷年PPI數(shù)據(jù)按順序構成一組時間序列,利用時間序列分析方法對我國歷年PPI數(shù)據(jù)時序進行檢驗識別,可知PPI數(shù)據(jù)服從4階自回歸模型AR(4),由此模型輸入層單元數(shù)為4個,輸出層單元數(shù)為1個。
適當?shù)碾[層數(shù)目及節(jié)點數(shù)決定于多種因素。如訓練樣本的多少、樣本噪音的大小以及所面對問題的復雜程度。隱層在BP神經(jīng)網(wǎng)絡中起著很重要的作用,它具有高度的抽象功能,并可從輸入單元中提取特征。隱層層數(shù)的選擇與問題的復雜性有關,為了確保訓練后人工神經(jīng)網(wǎng)絡模型的泛化能力和預測能力,應在滿足精度要求的前提下取盡可能緊湊的網(wǎng)絡結構。一個三層人工神經(jīng)網(wǎng)絡模型就可解決一般函數(shù)的擬合、逼近問題。因此三層人工神經(jīng)網(wǎng)絡能滿足預報要求。由于BP網(wǎng)絡在確定隱層單元數(shù)的問題上還沒有成熟的理論可依,大都根據(jù)經(jīng)驗來定。目前比較有效的方法就是試錯法。本文分別組建了隱層節(jié)點數(shù)從1-35的BP網(wǎng)絡,為了防止出現(xiàn)過擬合現(xiàn)象,經(jīng)過大量試算,最后根據(jù)試報效果,確定了較為理想的隱層單元數(shù)是6。
傳統(tǒng)BP網(wǎng)絡的學習算法實質上是一種簡單的最速下降靜態(tài)尋優(yōu)算法,通常具有收斂速度慢、易陷入局部極小值和網(wǎng)絡推廣能力不強等方面的缺陷。本文采用MATI AB神經(jīng)網(wǎng)絡工具箱提供的改進快速學習算法,有效克服了傳統(tǒng)BP網(wǎng)絡學習算法的缺陷。Trainlm訓練函數(shù)采用Levenberg-Marquardt優(yōu)化方法,該訓練函數(shù)的效率優(yōu)于最速下降靜態(tài)尋優(yōu)算法。
2結果
利用1990年-2003年的我國PPI數(shù)據(jù)作為訓練樣本,采用改進BP算法的Trainlm訓練函數(shù)進行訓練構建的神經(jīng)網(wǎng)絡,然后采用2004年-2008年的PPI數(shù)據(jù)作為檢驗樣本,利用訓練好的BP網(wǎng)絡對2004年-2008年的PPI進行預測,結果見表1。仿真實驗表明我國PPI訓練樣本模擬值和實際值的平均相對誤差為0.82%,模擬值和實際值的相關系數(shù)為0.994778;我國PPI檢驗樣本預測值和實際值的平均相對誤差為0.80%,預測值和實際值的相關系數(shù)為0.915313;2007年PPI預測值為102.6,PPI實際值為103.1,預測值和實際值的相對誤差為-0.48%;2008年PPI的預測值為107.4,PPI實際值為106.9,預測值和實際值的相對誤差僅為0.47%,這都與實際情況相近,結果較為滿意。并對2011年和2012年的我國PPI做了預測,PPI預測值分別為107.3和107.6。
3結論
人工神經(jīng)網(wǎng)絡模型能夠很好地捕捉我國PPI內(nèi)在的規(guī)律性,無需設計任何數(shù)學模型,通過神經(jīng)元之間的相互作用來完成整個人工神經(jīng)網(wǎng)絡的信息處理,并能得到很好的預測精度。
將人工神經(jīng)網(wǎng)絡模型應用于我國PPI預測,PPI預測值和實際值的平均相對誤差為0.80%,預測誤差小,PPI檢驗樣本預測值與實際值的線性相關系數(shù)為0.915313,預測精度高,模型預測值和實際值能較好的吻合。
參考文獻:
分類號 B842
1 引言
人工神經(jīng)網(wǎng)絡模型(Artificial Neural Network Model,簡稱ANN),顧名思義,就是用人造的程序、機械或設備來模擬人腦神經(jīng)網(wǎng)絡的模型。人工神經(jīng)網(wǎng)絡模型的用途有二:(1)發(fā)明基于神經(jīng)網(wǎng)絡的人工智能系統(tǒng),來模擬人的學習、記憶、推理等智能活動,以服務于人類的現(xiàn)實生活;(2)構建各種心理活動和心理過程的模型,以為各種心理學理論提供支持。前者是自動化、通信、制造、經(jīng)濟領域關注的,我們平時所見的語音識別、經(jīng)濟領域使用的股票走勢預測等智能系統(tǒng)大多是基于人工神經(jīng)網(wǎng)絡模型研制出來的。而后者則是心理學家所關注的領域。至今,人工神經(jīng)網(wǎng)絡模型已被用來模擬諸如知覺、記憶、學習、判斷等各種心理活動,以解釋矛盾的實驗數(shù)據(jù),為有關的心理學理論提供豐富的證據(jù)。
和其他領域的研究者們一樣,內(nèi)隱學習領域的研究者們也注意到了這一行之有效的工具。Cleeremans(1993)指出根據(jù)已有的內(nèi)隱學習理論構造人工神經(jīng)網(wǎng)絡模型,將模型的輸出數(shù)據(jù)與人類被試的實驗數(shù)據(jù)進行比較,能為原有的理論觀點提供證據(jù)[1]。Dienes和Perner(1996)也有類似的看法[2]。然而,在發(fā)揮人工神經(jīng)網(wǎng)絡模型在內(nèi)隱學習研究上的功效之前,必須解決如下問題:人工神經(jīng)網(wǎng)絡模型是否正如Cleeremans等所言適用于內(nèi)隱學習研究?如果是,用哪類人工神經(jīng)網(wǎng)絡模型來模擬內(nèi)隱學習?
2 人工神經(jīng)網(wǎng)絡模型的工作原理及其研究內(nèi)隱學習的適用性
人工神經(jīng)網(wǎng)絡模型之所以適用于內(nèi)隱學習,是因為它的基本工作原理和內(nèi)隱學習的兩個本質特征有著驚人的相似。
2.1 人工神經(jīng)網(wǎng)絡模型的工作原理
早在20世紀40年代,便有研究者對人工神經(jīng)網(wǎng)絡模型的工作原理做了最初的嘗試。1943年,McCulloch和Pitts用類似“開關”的閾限邏輯單元(Threshold Logic Unit)**來模擬神經(jīng)元,并將多個這樣的單元以相等的強度(權重)連接起來,形成網(wǎng)絡,這就是著名的MP模型[3]。1949年,Hebb在論述條件反射的形成時,無意間提到了神經(jīng)元間連接強度更新的重要法則,即兩個彼此相連的神經(jīng)元同時激活或同時抑制,都能增加神經(jīng)元間的連接強度,后人稱此為Hebb法則[4]。然而,MP模型和Hebb法則都不能構成真正意義**上的神經(jīng)網(wǎng)絡模型,雖然,MP模型已經(jīng)具備將多個神經(jīng)元連接起來,形成網(wǎng)絡的雛形,但是由于不同單元間的連接強度相等,且恒定不可變化,MP模型不具備人工神經(jīng)網(wǎng)絡的基本特征――學習性;而Hebb雖然提出了權重變化的一條有效法則,但卻未將其應用到人工神經(jīng)網(wǎng)絡中來。真正將神經(jīng)元連接成網(wǎng)絡的思想與借助于權重更新使網(wǎng)絡具有學習性的思想綜合在一起的要屬Rosenblatt。
Rosenblatt(1958)提出了第一個真正意義上的人工神經(jīng)網(wǎng)絡模型――感知器(Perceptron)[5]。其基本工作原理為:整個感知器由多個不同層次的加工單元組成,每個加工單元的功能類似于單個神經(jīng)元或一組神經(jīng)元,它能接收來自前一層的幾個加工單元的激活,并綜合這些激活,對此進行簡單運算(例如:判斷總激活量是否達到某一閾限),然后將運算的結果傳遞給下一層的加工單元。第一層單元的激活模式反映了外部刺激狀態(tài),即模型的輸入,而最后一層單元的激活模式則為模型的輸出反應。某個單元對下一層的另一個單元的影響取決于兩個單元之間連接的強度(權重)。為了在給定輸入的情況下,使模型獲得類似于人類被試的輸出反應,必須不停地調節(jié)單元與單元間的連接權重。所以,在構建合適的人工神經(jīng)網(wǎng)絡模型時,研究者往往會先設置一系列初始權重,然后不斷地給予模型不同的輸入模式,在每個特定輸入后,比較模型輸出與正確輸出間的差異,并據(jù)此調整單元間的連接權重,這一過程不斷進行,直到模型輸出和正確輸出間的差異達到最小值,此時,模型便完成了整個學習過程。圖1為一個典型感知器的例子,它旨在判斷呈現(xiàn)于視網(wǎng)膜的光條是垂直的還是水平的。整個感知器由3個加工單元層組成,第一層為網(wǎng)膜層,即將整個視網(wǎng)膜分割為10×10的網(wǎng)格,用每個網(wǎng)膜單元對應于一個網(wǎng)格,共100個單元,當光條落
圖1 感知器例子(資料來源:文獻[3])
在視網(wǎng)膜的某幾個網(wǎng)格上時,這些網(wǎng)格所對應的網(wǎng)膜單元被激活。第二層為聯(lián)系層,其中的每個單元總是和某些網(wǎng)膜單元間存在興奮或抑制連接,不論興奮還是抑制連接,強度都是恒定的1或-1,當與聯(lián)系單元連接的網(wǎng)膜單元的總激活量達到聯(lián)系單元的激活閾限時,聯(lián)系單元被激活,例如圖1,Aj的接收到的總激活量為1+1+1-1=2,如果Aj的閾限為2,那么2=2,Aj被激活。第三層為反應層,其中只包括一個反應單元,它與所有的聯(lián)系單元連接,連接權重為Wj,其中,j表示第j個聯(lián)系單元。反應單元將綜合來自聯(lián)系單元的激活信息,即將每個聯(lián)系單元的激活量乘以它們之間的連接權重,然后簡單求和,得出總激活量,并判斷激活是否達到閾限,公式表示如下:
aR為反應單元的激活水平,aj為聯(lián)系單元的激活水平,θ為閾限值。如果,總激活量達到反應單元的閾限,反應單元被激活(激活量為1),感知器決定光條為垂直,否則,反應單元不被激活(激活量為0),感知器反應光條為水平。當然,感知器必須經(jīng)過一個漫長的學習階段,才能完成這一簡單的判斷任務。在學習階段,感知器接受各種不同的水平和垂直光條刺激,并一一做出反應,當反應正確時,連接權重不做任何調整,一旦反應錯誤,感知器會自動調整聯(lián)系單元與反應單元間的權重,比如:當反應單元的激活量為0時,而實際光條為垂直,說明反應單元所接收到的總激活量小于閾限,此時,則應增大那些被激活的聯(lián)系單元與反應單元間的連接權重,以提高總激活量,使其更有可能達到閾限,致使在下次刺激呈現(xiàn)時,感知器更易做出正確反應。當然,Rosenblatt的感知器除了能調整權重外,還會調整反應單元閾限。這種通過逐步調整連接權重和閾限,以減少感知器反應和正確反應間的差距的方法就是著名的感知器收斂法則(perceptron convergence rule)。不過,調整閾限的方法對于擁有多個反應單元的模型來說過于復雜,所以未被以后的人工神經(jīng)網(wǎng)絡模型采納。
可見,Rosenblatt的貢獻是卓越的,他給出了人工神經(jīng)網(wǎng)絡的基本工作原理,基于感知器收斂法則發(fā)展而來的delta法則與斜率遞減(gradient descent)法已成為如今人工神經(jīng)網(wǎng)絡最主要的算法,本文第3點中將對此做詳細介紹。然而,值得注意的一點是感知器僅在聯(lián)系層和反應層間使用了權重概念,學習過程也僅發(fā)生在這兩層之間,所以從本質上講,感知器只屬于包含一個輸入層和一個輸出層的單層網(wǎng)絡(single layer network),這種單層網(wǎng)絡在解決某些實際問題時,遇到了障礙。Minsky等(1969)指出感知器甚至無法模擬諸如XOR(異或)等簡單運算[3]。因此,在接下來的將近20年中,人工神經(jīng)網(wǎng)絡的發(fā)展一度進入低迷期。直到80年代中期,逆向傳導法(back propagation)[6]、自動聯(lián)系者(atuoassociator)[7]、循環(huán)模型(recurrent model)[8,9]一一提出,多層網(wǎng)絡廣泛應用智能模擬任務中,人工神經(jīng)網(wǎng)絡才得以迅速發(fā)展。然而,這些算法和模型的基本工作原理與最初的感知器卻并無兩樣。
2.2 人工神經(jīng)網(wǎng)絡模型研究內(nèi)隱學習的適用性
如上述,人工神經(jīng)網(wǎng)絡的工作原理為通過調整權重逐步學會正確反應。那么,這些基于調整權重來學習正確反應的人工神經(jīng)網(wǎng)絡模型是否適于研究內(nèi)隱學習呢?內(nèi)隱學習這一概念強調的是兩個特征:第一,它是學習的一種形式;第二,這種學習是內(nèi)隱的、無需意識努力的。人工神經(jīng)網(wǎng)絡的工作原理極好地匹配了這兩個特征。首先,要建立針對某一心理活動的合適的網(wǎng)絡模型,必須要經(jīng)過長期的訓練和學習過程,即向模型呈現(xiàn)許多刺激,要求其做出反應,并將模型反應與要求的正確反應進行比較,據(jù)此逐步調整內(nèi)部結構,使模型在以后的刺激情景中,更易做出正確反應。這種學習過程和人類的學習有著驚人的相似,人類在幼年時,雖然腦神經(jīng)已發(fā)展完全,但是他們?nèi)匀徊荒軋?zhí)行各種認知任務,這時候的人腦就好比初始狀態(tài)的神經(jīng)網(wǎng)絡模型,雖然,已對模型基本結構做了設定(比如,模型由幾個加工單元層組成,每層有幾個單元,哪些單元和哪些單元間存在聯(lián)系),但是由于所有的連接權重都是隨機設置的,模型不知道刺激與反應間的聯(lián)系,常常會給出錯誤反應,而當經(jīng)過幾年的學習之后,人類嬰孩不斷地從外界接收刺激,做出反應,并接收來自外界的反饋,將之與自己的反應做比較,逐步通過內(nèi)部結構的改變,來調整自己的行為,從而能夠知覺事物、理解言語、控制自身的機體運動,這就好比初始狀態(tài)的網(wǎng)絡模型,能夠通過調整權重,達到穩(wěn)定狀態(tài),對刺激模式做出正確反應。可見,人工神經(jīng)網(wǎng)絡模型很好地匹配了內(nèi)隱學習地第一個特征――兩者都是學習過程。其次,內(nèi)隱學習強調學習是內(nèi)隱地進行的。由于無法直接探索學習過程是否是內(nèi)隱的,研究者往往通過驗證學習中所獲得的知識是內(nèi)隱的來間接推斷學習過程是內(nèi)隱的,當被試在分類或選擇任務中的表現(xiàn)高于隨機,卻不知道自己是依據(jù)何種知識做出正確判斷時,習得的知識被認為是內(nèi)隱的,從而進一步推斷學習過程也是內(nèi)隱的[10~12]。人工神經(jīng)網(wǎng)絡模型也一樣,從根據(jù)輸出結構來調整權重的過程來看,根本無法判斷學習過程是否是內(nèi)隱的,而類似的,人工神經(jīng)網(wǎng)絡的知識表征形式顯示神經(jīng)網(wǎng)絡模型所獲得的知識很有可能是內(nèi)隱的。當人工神經(jīng)網(wǎng)絡能做到正確反應時,指導模型該如何反應的知識似乎是存在于單元的組織結構和他們之間的連接權重上,根本無法直接從這種無序而雜亂的結構和權重上看出什么規(guī)則,例如:上述判斷光條垂直和水平的感知器,我們并無法從直觀上判斷哪些單元表征垂直光條,哪些單元表征水平光條,這種知識表征形式很有可能是內(nèi)隱的。這種知識的表征形式被稱為分布式表征(distributed representation),它和傳統(tǒng)的局部表征(local representation)很不一樣,局部表征中,每個用不同的單元表征不同的事物,例如:單元1表征事物1,單元2表征事物2……,在知識提取時,就好比查字典一樣,根據(jù)不同的事物,找到表征的位置,便可以獲悉有關事物的各種知識。而分布表征可以將不同的事物表征在同一組單元中,比如垂直光條和水平光條,在知識提取時,往往只需輸入新刺激的內(nèi)容,比如光條激活了視網(wǎng)膜的哪些區(qū)域,便能根據(jù)內(nèi)容找到合適的反應。
3 廣泛應用于內(nèi)隱學習領域的兩種人工神經(jīng)網(wǎng)絡模型
人工神經(jīng)網(wǎng)絡模型很好地匹配內(nèi)隱學習的兩大基本特征。因此,許多研究者針對不同的內(nèi)隱學習任務,選擇不同的人工神經(jīng)網(wǎng)絡模型來擬合內(nèi)隱學習過程,以探討內(nèi)隱學習的本質和機制[13~17]。
縱觀近40年來的內(nèi)隱學習研究,雖然不同的研究者開發(fā)了許多不同的任務形式,獲得了許多可喜的研究成果,但是這些任務都離不開兩種根本的任務形式――人工語法學習和序列學習。相應地,根據(jù)兩個任務的不同特點,研究者選擇了兩種不同的模型――自動聯(lián)系者和簡單循環(huán)網(wǎng)絡(simple recurrent network,簡稱SRN)――分別對之加以模擬。
3.1 人工語法學習與自動聯(lián)系者
人工語法學習任務通常是:在學習階段,要求被試在不知道內(nèi)在規(guī)則的情況下記憶一大堆合法字符串,然后,在測試階段,向被試呈現(xiàn)一批新的合法和非法字符串,并告知前面學習的字符串是一類符合語法規(guī)則的合法字符串,要求被試根據(jù)前面的學習,判斷新的字符串是否合法[10]。從測試階段的要求、學習階段的要求和所學習的知識這三個不同的角度來看,人工語法學習具有三個主要特征:
第一,測試階段要求被試進行的是一項典型的分類任務。相應地,檢索1943年以來,人工神經(jīng)網(wǎng)絡模型發(fā)展的這段歷史,便可以發(fā)現(xiàn)只有模式聯(lián)系者(pattern associator)是專門針對模式識別和分類而開發(fā)出來的模型。模式聯(lián)系者的誕生源自于條件反射的思想,即建立刺激和反應間的聯(lián)系。用模式聯(lián)系者的話說,就是對于特定的輸入刺激模式,給出相應的反應模式。有趣的是,當用一組單元表示輸入模式,另一組單元表示輸出模式,它們兩兩連接在一起(如圖2),并使用Hebb法則Wij=εαiαi更新權重時(其中,ΔWij為輸入單元j和輸出單元i之間權重的變化量,ε為學習速率,是常數(shù),aWi為輸出單元的激活量,aWj為輸入單元的激活量),模式聯(lián)系者便能在同一個模型中存儲不同的輸入模式,將反應模式相同的輸入模式歸于同一類,并且當模式中的某些量缺失時,比如某個輸入單元損壞,模型仍能正常運行[3]??梢?,模式聯(lián)系者能夠有效地模擬分類任務,甚至是某些腦神經(jīng)受損病人(相當于某些輸入或輸出單元受損)的分類活動。然而,人工語法學習并不僅是單純的分類任務,它還具有其他特征,因此,只模擬測試階段的分類任務是遠遠不夠的。
第二,人工語法學習的另一個特征是,學習階段要求被試在沒有任何指導(反饋)的情況下學習字符串,即并沒有在被試學習某一字符串的同時,告訴他們這一字符串屬于哪一類,合法還是非法。投射到模式聯(lián)系者中,就是在學習對特定刺激模式的分類時,不伴隨相應的反應模式,即沒有輸出單元。事實上,人類的許多學習過程都是在沒有外部指導的情況下進行的。比方說,當孩子看到麻雀和燕子(刺激模式)時,家長告訴他這是鳥(反應模式),但很多時候,家長并不在身邊,比如,當孩子看到鴿子時,沒有外在反應模式指導,孩子仍能反應為鳥,人類似乎能夠在沒有外在的反應模式引導教育的情況下,學會分類。人工語法學習也是一樣,雖然在學習時,沒有被告知哪些合法,哪些不合法,但是被試仍能學會分類規(guī)則。這些事實提示研究者:必須開發(fā)一種沒有外在引導者的自適應模型。于是,McClelland 和Rumelhart(1985)在對模式聯(lián)系者稍做調整的基礎上,提出了模式聯(lián)系者的一個自適應特例――自動聯(lián)系者[7]。由于沒有外部引導,任何自適應模型必須具備自我反饋的功能,自動聯(lián)系者也一樣,如圖3所示,每個單元除了接收外部輸入(e)以外,還必須接收來自其他單元的內(nèi)部輸入(i),這種存在內(nèi)部反饋的模型被稱為循環(huán)模型。為了達到分類的目的,自動聯(lián)系者旨在再現(xiàn)單元的外部輸入模式,就好像人工語法學
圖3 含有8個單元的自動聯(lián)系者(資料來源:文獻[7])
習中,記憶字符串一樣。而為了達到這一點,必須調節(jié)連接權重,使單元的內(nèi)部輸入能匹配外部輸入,用公式表示為:
aWj為單元j的激活量。雖然,自動聯(lián)系者模型沒有可比對的反應模式,但是,上述算法的核心仍是用內(nèi)部狀態(tài)去匹配外部狀態(tài),盡量減少兩者間的差異,因此,上述公式仍可看成delta法則*的變式。當然,除了使用delta法則來訓練自動聯(lián)系者外,也有研究者(例如,文獻[14])使用類似模式聯(lián)系者的Hebb法則訓練該模型。和模式聯(lián)系者一樣,自動聯(lián)系者也能習得不同的外部輸入模式,并對此做出分類。可見,自動聯(lián)系者能夠很好地模擬人工語法學習任務學習和測試階段的表面屬性――無外部引導的分類學習任務。然而,它是否能模擬語法學習這一內(nèi)部屬性呢?
第三,人工語法學習的本質特征在于所獲得的是有關語法的知識。雖然,如前所述,自動聯(lián)系者獲得的是一種無法外顯的分布性表征的知識,但是,有意思的是這種表征似乎代表了某一類別的原型。而原型或許就好比語法的抽象表示方法。McClelland 和Rumelhart(1985)曾構建了一個由24個單元組成的自動聯(lián)系者,將一些有關狗的信息輸入這24個單元[7],其中前8個單元輸入的是狗的名字信息,后16個單元輸入的是狗的外貌信息,結果發(fā)現(xiàn)經(jīng)過訓練后,模型的權重矩陣呈現(xiàn)出特殊的構造,即前8個單元之間及前3個單元與后16個單元間的權重處于隨機水平,而后16個單元間的權重卻出現(xiàn)某種固定的模式,McClelland和Rumelhart認為這種固定的模式就是狗視覺表象的原型。雖然,無法從這種固定的權重模式中,看出典型的狗應該具有哪些特征,但是至少可以認為,如果兩個單元間的連接權重比較大,那么當這兩個單元同時被激活時,模型有可能將目標判斷為狗。也就是說,原型所表征的是每個視覺特征間的聯(lián)系。這就好比,人工語法學習中的語法知識,語法或許是由字母間的聯(lián)系所表征的。所以,從這點意義上來,自動聯(lián)系者習得的原型或許就是語法知識。
3.2 序列學習和簡單循環(huán)網(wǎng)絡
序列學習任務要求被試對一系列規(guī)則序列進行選擇反應,其假設為:如果被試習得了序列間存在的固定規(guī)則,則他們可以依據(jù)前面呈現(xiàn)的序列來預測下一個項目是什么,成功的預測將會縮短被試的反應時[11]。序列學習和人工語法學習之間的本質區(qū)別在于:它是一項預測任務,而非分類任務,被試對某一項目的反應依賴于前面的項目。
1990年,Elman開發(fā)了簡單循環(huán)網(wǎng)絡,專門用來模擬這類預測任務[9]。簡單循環(huán)網(wǎng)絡的目的是根據(jù)當前輸入的項目來預測下一個項目,它的基本結構如圖4所示,由4個加工單元層組成,它們分別是輸入單元層、隱含單元層、上下文單元層和輸出單元層。輸入單元層用于表征當前輸入的項目,輸出單元層用于表征模型所預測的項目,上下文單元層用于表征在當前項目之前出現(xiàn)的項目序列,而隱含單元層負責在輸入、輸出和上下文單元層間的信息傳遞。簡單循環(huán)網(wǎng)絡的工作原理為:在接收第一
圖4 簡單循環(huán)網(wǎng)絡的基本結構(資料來源:文獻[16])
個項目時,輸入層中的某些單元被激活,并將激活傳遞給隱含層中的單元,隱含層除了將激活進一步傳遞給輸出層,由輸出層預測第二個項目外,還將自己的激活水平復制于上下文層,當接收第二個項目時,隱含層除了收到來自輸入層的激活外,還將收到來自上下文層的激活,因此,它向輸出層傳遞的激活則包含了第一和第二兩個項目的信息,依此類推,輸出層所做出的預測是基于包含當前項目之內(nèi)的所有項目的信息。當然,和其他許多人工神經(jīng)網(wǎng)絡模型一樣,簡單循環(huán)模型依據(jù)delta法則來調整權重的,即將模型給出的預測與真實出現(xiàn)的后續(xù)項目進行比較,來調整權重。不過,簡單循環(huán)網(wǎng)絡所使用的delta法則和自動聯(lián)系者有兩點差異:(1)權重調整是通過斜率遞減法進行的,即尋求預測反應和真實項目之間誤差方差的最小值,用公式表示為:
其中,tout為真實的正確輸出,aout為模型的預測輸出;(2)不同于自動聯(lián)系者,簡單循環(huán)網(wǎng)絡是多層模型,當調整輸出層單元和隱含層單元間的權重時,計算預測和真實項目間的誤差方差是可以直接計算獲得的,然而當要調整隱含層單元與輸入層單元或上下文層單元間的權重時,由于不存在真實的正確反應,誤差方差則無從計算,所以Rumelhart和McClelland(1986)提出可以用輸出層單元的誤差來估計隱含層單元的誤差,即某一隱含單元的誤差為所有與之連接的輸出層單元的誤差與它們之間權重乘積求和的函數(shù)[6]
然后,同樣用斜率遞減法求出權重的變化量,這種誤差計算的法則和簡單循環(huán)網(wǎng)絡中原有的信息流方向正好相反,所以又被稱為逆向推導。
簡單循環(huán)網(wǎng)絡能有效地模擬序列學習中的預測機制,因此,它剛提出不久,就被用于模擬內(nèi)隱序列學習,用來研究序列學習的抽象性等問題[13,15,16]。
總之,針對不同的內(nèi)隱學習任務,為了得到更佳的模擬效果,研究者往往傾向于選擇不同人工神經(jīng)網(wǎng)絡模型加以模擬。然而,就像是任務之間的劃分并不絕對一樣(比如:Cleeremans等就曾將人工語法和序列學習結合在同一個任務中),神經(jīng)網(wǎng)絡模型和內(nèi)隱學習任務間的匹配也并不絕對,比如:Boucher等(2003)就層用簡單循環(huán)網(wǎng)絡來模擬序列學習[17]。
4 小結
基于權重調整來學習正確反應的人工神經(jīng)網(wǎng)絡模型和內(nèi)隱學習的兩大本質特征間有著極優(yōu)的匹配,人工神經(jīng)網(wǎng)絡模型在內(nèi)隱學習領域的適用性毋庸置疑。在這樣的背景下,出于深入探討內(nèi)隱學習的目的,研究者紛紛根據(jù)不同的內(nèi)隱學習任務,選用不同的人工神經(jīng)網(wǎng)絡模型對之加以模擬[18]。到目前為止,針對兩種較為普遍的內(nèi)隱學習任務,也相應地出現(xiàn)了兩種使用較為廣泛的神經(jīng)網(wǎng)絡模型――自動聯(lián)系者和簡單循環(huán)網(wǎng)絡。在實際研究中,合理地使用這兩個模型,必將為內(nèi)隱學習的理論和人工模擬提供更有力的證據(jù)。
參考文獻
[1] Cleeremans A. Mechanisms of Implicit Learning: Connectionist Models of Sequence Processing. In: Jeffrey L E ed. Neural Network Modeling and Connectionism. London: MIT Press, 1993
[2] Dienes Z, Perner J. Implicit knowledge in people and connectionist networks. In: Underwood G.. Implicit cognition. Oxford: Oxford University Press, 1996
[3] McLeod P, Plunkett K, Rolls E T. Introduction to Connectionist Modelling of Cognitive Processes. Oxford: Oxford University Press, 1998
[4] Milner P. A Brief History of the Hebbian Learning Rule. Canadian Psychology, 2003, 44(1): 5~9
[5] Rosenblatt F. The perceptron: A probabilistic model for information storage and organization in the brain. Psychological Reviews, 1958, 65: 386~408
[6] Rumelhart D, McClelland J. Parallel distributed processing (vol. 1). Cambridge: MIT press, 1986a
[7] McClelland J, Rumelhart D. Distributed Memory and the Represantation of General and Specific Information. Journal of Experimental Psychology: General, 1985, 114(2): 159~188
[8] Jordan M. An introduction to linear algebra in parallel distributed processing. In: Rumelhart D, McClelland J ed. Parallel distributed processing (vol. 1). Cambridge: MIT press, 1986a. 365~422
[9] Elman J. Finding structure in time. Cognitive Science, 1990, 14(2): 179~212
[10] Reber A S. Implicit learning of artificial grammars. Journal of Verbal Learning and Verbal Behavior, 1967, 6(2): 317~327
[11] Nissen M J, Bullemer P. Attentional requirement of learning: Evidence from performance measures. Cognitive Psychology, 1987, 19(1): 1~32
[13] 郭秀艷, 鄒玉梅, 李強等. 中學生顏色內(nèi)隱學習特征的實驗研究. 心理與行為研究, 2003, 1(2): 122~127
[14] Cleeremans A, McClelland J L. Learning the Structure of Event Sequence. Journal of Experimental Psychology: General, 1991, 120(3): 235~253
[15] Dienes Z. Connectionist and Memory-Array Models of Artificial Grammar Learning. Cognitive Science, 1992, 16(1): 41~79
[16] Jiménez L, Méndez C, Cleeremans A. Comparing Direct and Indirect Measures of Sequence Learning. Journal of Experimental Psychology: Learning, Memory, and Cognition, 1996, 22(4): 948~969
神經(jīng)網(wǎng)絡是一個具有高度非線性的超大規(guī)模連續(xù)時間動力系統(tǒng)。是由大量的處理單元(神經(jīng)元)廣泛互連而形成的網(wǎng)絡。它是在現(xiàn)代神經(jīng)科學研究成果的基礎上提出的,反映了腦功能的基本特征。但它并不是人腦的真實描寫,而只是它的某種抽象、簡化與模擬。網(wǎng)絡的信息處理由神經(jīng)元之間的相互作用來實現(xiàn);知識與信息的存儲表現(xiàn)為網(wǎng)絡元件互連間分布式的物理聯(lián)系;網(wǎng)絡的學習和計算決定于各神經(jīng)元連接權系的動態(tài)演化過程。因此神經(jīng)元構成了網(wǎng)絡的基本運算單元。每個神經(jīng)元具有自己的閾值。每個神經(jīng)元的輸入信號是所有與其相連的神經(jīng)元的輸出信號和加權后的和。而輸出信號是其凈輸入信號的非線性函數(shù)。如果輸入信號的加權集合高于其閾值,該神經(jīng)元便被激活而輸出相應的值。在人工神經(jīng)網(wǎng)絡中所存儲的是單元之間連接的加權值陣列。
神經(jīng)網(wǎng)絡的工作過程主要由兩個階段組成,一個階段是工作期,此時各連接權值固定,計算單元的狀態(tài)變化,以求達到穩(wěn)定狀態(tài)。另一階段是學習期(自適應期,或設計期),此時各計算單元狀態(tài)不變,各連接權值可修改(通過學習樣本或其他方法),前一階段較快,各單元的狀態(tài)亦稱短期記憶(STM),后一階段慢的多,權及連接方式亦稱長期記憶(LTM)〔1〕。
根據(jù)網(wǎng)絡的拓撲結構和學習規(guī)則可將人工神經(jīng)網(wǎng)絡分為多種類型,如不含反饋的前向神經(jīng)網(wǎng)絡、層內(nèi)有相互結合的前向網(wǎng)絡、反饋網(wǎng)絡、相互結合型網(wǎng)絡等〔2〕。本文的人工神經(jīng)網(wǎng)絡模型是采用BP算法的多層前饋網(wǎng)絡。
該模型的特點是信號由輸入層單向傳遞到輸出層,同一層神經(jīng)元之間互不傳遞信息,每個神經(jīng)元與鄰近層所有神經(jīng)元相連,連接權用Wij表示。各神經(jīng)元的作用函數(shù)為Sigmoid函數(shù),設神經(jīng)網(wǎng)絡輸入層的p個節(jié)點,輸出層有q個節(jié)點,k-1層的任意節(jié)點用l表示,k層的任意節(jié)點用j表示,k+1層的任意節(jié)點用l表示。Wij為k-1層的第i個神經(jīng)元與k層的第j個神經(jīng)元相連接的權值。k-1層的節(jié)點i輸出為O(k-1)i,k層節(jié)點j的輸出為:
k層節(jié)點j的輸出為:
Okj=f(netkj)
設訓練樣本為(X,Ye),X為p維向量,加到輸入層;Ye為q維向量,對應于期望輸出;網(wǎng)絡的實際輸出Y也是q維向量。網(wǎng)絡在接受樣本對的訓練過程中,采用BP算法,其權值調整量為:
ΔWij=-ηδkjO(k-1)i
其中,對于輸出層為:
δkj=yj(1-yj)(yej-yj)
對于非輸出層為:
η為訓練步長,取0<η<1。
用樣本集合反復訓練網(wǎng)絡,并不斷修改權值,直到使實際輸出向量達到要求,訓練過程結束〔3〕。
上述人工神經(jīng)網(wǎng)絡可以完成多種信息處理任務,如從二進制數(shù)據(jù)中提取相關知識,完成最近鄰模式分類,實現(xiàn)數(shù)據(jù)聚集等。而本文要用的是其極強的數(shù)學逼近映射能力,即開發(fā)合適的函數(shù)f:ARnBRn,以自組織的方式響應以下的樣本集合:(x1,y1),(x2,y2)…,(xm,ym),其中yi=f(xi)。這里描述的是一般的數(shù)學抽象,像識別與分類這些計算都可以抽象為這樣的一種近似數(shù)學映射。
所謂診斷,實質上是一個分類問題。即根據(jù)候診者的癥狀,醫(yī)學檢查結果(如體溫、心跳等)等一些情況,它們可以用一向量(e1,e2,…,em)來表示,將其歸類為病人或非病人。這也可以轉化為尋找一差別函數(shù)f使得:
(1)f(e1,e2,…,em)>ε, (e1,e2,…,em)∈T
(2)f(e1,e2,…,em)>ε, (e1,e2,…,em)T
其中集合T表示患病。
因此,病情診斷最終也可作為一類函數(shù)的逼近問題。
而許多研究已表明,前向神經(jīng)網(wǎng)絡可作為非線性逼近的標準型。對于實數(shù)空間的任一函數(shù),只要它滿足一定的條件,一定存在唯一的具有單一隱層的前向網(wǎng)絡作為它的最優(yōu)最佳逼近。而含有兩個隱含層的前向網(wǎng)絡可在任意的平方誤差內(nèi)逼近某一實函數(shù)〔3〕。
診斷步驟
肺癌病例數(shù)據(jù)選自1981~1994年在某醫(yī)院住院的病人,共計551例。其中486例(88%)經(jīng)病理學、細胞學診斷證實為肺癌。每一病例都包括多項數(shù)據(jù),其中用于診斷的數(shù)據(jù)項有:病人的一般情況(如年齡、性別等),家族史、既往史、吸煙史、術后病理、X射線檢查、CT檢查、纖維支氣管鏡檢查、PAT痰檢等多達58項。因此,原則上 58項數(shù)據(jù)應作為神經(jīng)網(wǎng)絡的輸入項,而神經(jīng)網(wǎng)絡的輸出值就是病人是否患肺癌的結果。
1.網(wǎng)絡訓練集的確定:在最原始的551例病人數(shù)據(jù)中存在著各種各樣的差別,如性別差異(419例男性,132例女性),診斷結果的差異(486例經(jīng)證實為肺癌),所患肺癌種類的差異(鱗癌、小細胞癌、大細胞癌等),患病程度上的差異(早、中晚期的不同)等等。顯然,訓練數(shù)據(jù)集應最大限度地保證兼顧各種病例情況。經(jīng)過仔細篩選,選擇了含有460個病例的集合作為肺癌診斷用的網(wǎng)絡的訓練集。
2.神經(jīng)網(wǎng)絡輸入和輸出數(shù)據(jù)的預處理
按照人工神經(jīng)網(wǎng)絡的理論,神經(jīng)網(wǎng)絡的輸入輸出數(shù)據(jù)都應該屬于(0,1)區(qū)間的實數(shù),為此我們需對原始數(shù)據(jù)進行如下的規(guī)一化處理:
其中xi為原始數(shù)據(jù)項,而Max=max{xi∶xi∈X},Min=min{xi∶xi∈X}。這里X為原始數(shù)據(jù)集。經(jīng)過(7)式變換后,yi將在(0,1)區(qū)間。因此,可作為神經(jīng)網(wǎng)絡的輸入輸出。
3.應用神經(jīng)網(wǎng)絡進行肺癌診斷
將描述病人各種情況的數(shù)據(jù)作為前向網(wǎng)絡的輸入數(shù)據(jù)加到其輸入端,并按(1)~(6)式計算各神經(jīng)元的輸入和輸出,同時調整神經(jīng)元之間的連接權值以使網(wǎng)絡的輸出和實際的病例情況相符。即當病人確實患肺癌時網(wǎng)絡的輸出結果也恰好指示為肺癌,反之亦然。如果對所有的訓練樣本集網(wǎng)絡的輸出基本上(95%或更高)能保證與實際結果一致,則訓練過程結束。我們認為神經(jīng)網(wǎng)絡已建立起病人的各種因素與他是否是肺癌患者之間的函數(shù)映射關系。對于一個新的候診病人來說,只要將他的情況輸入到訓練好的神經(jīng)網(wǎng)絡中去,根據(jù)網(wǎng)絡的輸出結果就可以知道他是否已患肺癌。
表1 基于不同發(fā)病因素的診斷網(wǎng)絡模型
類
型 訓練集精度 測試集精度
基于遺傳因素的診斷網(wǎng) 53.8% 46.3%
基于個人生活習慣的診斷網(wǎng) 57.1% 44.9%
基于病癥的診斷網(wǎng) 89.4% 83.3%
基于醫(yī)學檢查結果的診斷網(wǎng) 98.5% 92.6%
上述結果表明不同類型的因素應分開來考慮。于是我們將58項輸入數(shù)據(jù)分成四類,這四類有各自的BP診斷網(wǎng),依次稱為診斷一、診斷二、診斷三、診斷四。它們先單獨測定,然后再將它們各自的結果綜合起來得出最后的判斷。
上述四種診斷網(wǎng)絡所得結果的可靠性各不相同。其中,根據(jù)醫(yī)學檢查結果所作的診斷準確性最高,因此在最后的綜合分析中要重點考慮它的診斷結果,我們給它設一個相對最高的權值。其次,根據(jù)病人的癥狀所作的診斷往往也具有較高的準確性,因此給它的權值也較高,但比醫(yī)學檢查結果的稍低。其他兩類因素在有關肺癌的診斷中僅具參考作用,因而所設的權值相對較小。
最后的結果O為:
O=a1.O1+a2.O2+a3.O3+a4.O4
a1+a2+a3+a4=1
其中Oi,ai,i=1,2,3,4分別為各診斷網(wǎng)的輸出及其對應的權值。
當O>0.5時最后的診斷結果為患肺癌,反之則正常。對所有的病例數(shù)據(jù)經(jīng)上述方法的診斷結果見表2。
表2 神經(jīng)網(wǎng)絡對肺癌診斷結果分析
神經(jīng)網(wǎng)絡
診斷結果 訓練數(shù)據(jù) 測試數(shù)據(jù)
肺癌患者 非肺癌患者 肺癌患者 非肺癌患者
+ 460 2 25 3
- 0 38 1 22
其中對于訓練集,肺癌病人的正確檢出率為100%,非肺癌病人誤診率為5%。對于測試集,肺癌病人的正確檢出率為96.2%;非肺癌患者正確檢出率為88%,誤診率為12%。
討 論
1.本研究所采用的人工神經(jīng)網(wǎng)絡的肺癌診斷方法的結果較好地符合了已知數(shù)據(jù),具有較高的準確性,特別是對于肺癌患者一般都能準確地做出診斷,有利于肺癌的早期發(fā)現(xiàn)和治療。
2.要想進一步提高該方法的準確性,應該注意收集更多更全面的病例數(shù)據(jù)。人工神經(jīng)網(wǎng)絡主要是利用它能自動從數(shù)據(jù)集中抽取函數(shù)的關系的功能。如果我們所使用的數(shù)據(jù)越多越全面,則其中所蘊含的事物本身的規(guī)律性就越強,利用人工神經(jīng)網(wǎng)絡從中所抽取的函數(shù)關系就越具有普遍性,因而就更準確。
3.實現(xiàn)對肺癌的診斷的關鍵在于準確找到罹患肺癌的判定函數(shù),可利用前向網(wǎng)絡的函數(shù)逼近功能來實現(xiàn)。但是這里涉及到兩個問題。首先,由于差別函數(shù)和預測率函數(shù)都是利用人工神經(jīng)網(wǎng)絡從已知的病例數(shù)據(jù)集中抽取出來的,它實際反映的是這些數(shù)據(jù)集中輸入輸出對的映射關系。因此要想保證診斷具有較高的準確性,就應該使用來建立函數(shù)關系的這些數(shù)據(jù)集(稱訓練集)具有充分的代表性,即這些數(shù)據(jù)應基本蘊含肺癌診斷的醫(yī)學原理。這就涉及到如何選擇網(wǎng)絡合理的訓練集及關鍵的輸入項。另一個問題涉及到神經(jīng)網(wǎng)絡本身的要求,即網(wǎng)絡的輸入輸出數(shù)據(jù)值都應在區(qū)間(0,1)中。這可以通過數(shù)據(jù)的編碼和歸一化來實現(xiàn)。
4.由于某些原因有些病人的病例數(shù)據(jù)不完整,約占總病例數(shù)據(jù)的10%左右。顯然,如果按照傳統(tǒng)的方法來建立肺癌病人的診斷模型〔4〕,這些有缺項的數(shù)據(jù)是不太好處理的,但是由于人工神經(jīng)網(wǎng)絡有較強的容錯性,輸入數(shù)據(jù)在某些項上的錯誤對網(wǎng)絡最終結果的正確性影響不大。
參考文獻
1.焦李成.神經(jīng)網(wǎng)絡系統(tǒng)理論.第1版.西安:西安電子科技大學出版社,1995,3
中圖分類號:TU375.3 文獻標識碼:A
文章編號:1674-2974(2015)11-0017-08
隨著社會經(jīng)濟的發(fā)展,以及對近些年大地震的不斷反思,基于性能的結構抗震設計已成為地震工程領域研究的熱點問題和前沿發(fā)展方向,為眾多國家的規(guī)程所提及或者采用(如FEMA273[1],F(xiàn)EMA356[2],ASCE41[3]和Eurocode8[4]).柱子作為實際結構中承受豎向荷載和抵抗水平荷載的關鍵構件,其屈服位移的合理評估對于性能化結構抗震設計中結構的動力響應、結構性能水準的評估和抗震延性設計有很大影響.綜合以往對柱子屈服位移的研究,其定義不明確,經(jīng)驗理論模型預測結果離散度較大的特點,使柱屈服位移的合理取值成為一個亟待解決的問題.
對于柱屈服位移的定義,國內(nèi)外研究者提出了不同的看法,如Park在文獻\[5\]中總結了4種不同的定義方法,并推薦使用割線剛度的方法定義屈服位移.Panagiakos[6]認為判定柱屈服的條件是柱中縱向鋼筋屈服或者混凝土發(fā)生嚴重的非線,并在此基礎上給出了對應的經(jīng)驗公式.Montes[7]基于柱中鋼筋屈服,提出了對應不同強度等級鋼筋的柱有效屈服曲率計算公式.Berry[8]等模擬了PEER[9]柱性能數(shù)據(jù)庫中255根矩形截面混凝土柱的屈服位移.錢稼茹[10]亦對該數(shù)據(jù)庫中144根剪跨比大于2的矩形柱考慮軸壓比的影響進行回歸分析,提出了修正的柱屈服轉角表達式.蔣歡軍[11]綜合Berry[8]關于屈服位移以及Priestley[12]對于屈服曲率的定義,在計算屈服位移的公式中加入了考慮柱端鋼筋滑移和柱子剪切變形影響的修正項.Peru[13]基于Eurocode8[14]中柱屈服位移的定義,利用CAE方法對PEER柱性能數(shù)據(jù)庫的柱屈服位移進行了預測.
柱屈服過程中鋼筋和混凝土都發(fā)生了復雜的非線,加之影響屈服性能的因素也非常多,上述基于經(jīng)驗理論的非線性擬合公式預測柱屈服性能時存在預測結果離散度非常大的問題.人工神經(jīng)網(wǎng)絡作為一種在數(shù)據(jù)稀少的情況下能夠有效預測數(shù)據(jù)輸入和輸出關系的手段而進入研究者的視野.人工神經(jīng)網(wǎng)絡是以人類神經(jīng)活動為基礎而發(fā)展起來的一項新穎的計算手段,適合處理復雜線性及非線性映射問題.由于其強大的非線性映射能力,神經(jīng)網(wǎng)絡在工程領域被用于預測圓柱形混凝土柱約束狀態(tài)的極限壓應力和對應的壓應變[15],模擬金屬疲勞裂紋開展速率[16].神經(jīng)網(wǎng)絡的其它工程應用還有如混凝土柱在彎曲失效模式下的極限變形預測[17],邊坡穩(wěn)定性分析[18],修正結構有限元模型[19]等.
本文基于經(jīng)驗理論模型對彎曲型混凝土柱屈服性能影響因素的研究,利用神經(jīng)網(wǎng)絡預測PEER柱性能庫210組矩形混凝土柱的屈服性能,并以此來探討神經(jīng)網(wǎng)絡對柱性能預測的可行性和有效性.通過對比神經(jīng)網(wǎng)絡的預測結果與實驗結果以及經(jīng)驗理論模型估算結果,評價神經(jīng)網(wǎng)絡預測模型的效果.最后基于Carson敏感性分析方法驗證所選神經(jīng)網(wǎng)絡輸入?yún)?shù)的合理性并得到輸入各參數(shù)對混凝土柱屈服位移的貢獻程度.
1 經(jīng)驗模型預測實驗數(shù)據(jù)庫柱屈服轉角
1.1 實驗數(shù)據(jù)庫
本文對彎曲型失效為主的柱屈服轉角進行預測,在PEER[9]柱性能數(shù)據(jù)庫中通過以下標準:1)柱子截面形狀為矩形;2)柱子受往復荷載作用直至失效;3)柱子的實驗失效模式為彎曲失效.選擇210組實驗數(shù)據(jù),作為神經(jīng)網(wǎng)絡預測數(shù)據(jù)庫.該預測數(shù)據(jù)庫的主要屬性參數(shù)范圍如圖1所示.
從圖1中可看出本文所選數(shù)據(jù)庫主要參數(shù)分布覆蓋了常規(guī)設計的參數(shù)取值范圍,具有廣泛的代表性.
從圖2和表1中可以看出,利用4種經(jīng)驗模型估算構件的屈服轉角時,預測值與實驗值的比值分布相當離散,ASCE41模型計算結果變異系數(shù)相對較小為0.443,而利用ACI318-08(b)變異系數(shù)則達到0.65.針對上述預測結果離散的問題,本文采用BP神經(jīng)網(wǎng)絡預測PEER數(shù)據(jù)庫柱的屈服轉角.
2 神經(jīng)網(wǎng)絡預測柱屈服轉角方法
2.1 BP神經(jīng)網(wǎng)絡
BP神經(jīng)網(wǎng)絡作為前向型多層神經(jīng)網(wǎng)絡的一種,其實質是利用誤差反向傳播算法(Back-Propagation)對神經(jīng)網(wǎng)絡進行訓練.BP神經(jīng)網(wǎng)絡結構由輸入層、隱含層和輸出層三個部分組成,Hornik[22]已經(jīng)證明單隱層的神經(jīng)網(wǎng)絡可以實現(xiàn)任意精度的非線性映射關系.BP神經(jīng)網(wǎng)絡訓練分為信息的正向輸入和誤差的反向傳播兩個階段.在信息正向輸入階段,輸入?yún)?shù)通過閥值和權值的調節(jié),再經(jīng)激活函數(shù)傳遞對計算結果進行輸出;而在誤差反向傳播階段則是通過計算輸出層的結果和目標值之間的誤差來反向調節(jié)各神經(jīng)元的權值和閥值;在實際訓練中這兩個階段交替進行,直至達到訓練的性能目標為止.
但由于BP學習算法其本質是梯度下降學習算法,權值的修正是沿性能函數(shù)梯度的反向進行,使普通的BP神經(jīng)網(wǎng)絡在訓練時有以下不足:1)作為一種局部搜索的方法,容易陷入局部極小值而不能得到全局最優(yōu)的結果;2)由于BP算法本身反向傳播的特點,使其在求解矩陣時耗費大量的計算時間,致使神經(jīng)網(wǎng)絡收斂速度很慢.針對上述不足,眾多學者對其進行修正,其中L-M(Levenberg-Marquardt)[23] 算法因其能夠進行快速迭代,又具有全局優(yōu)化的特點而在小型神經(jīng)網(wǎng)絡中得以廣泛應用.L-M算法中迭代項如式(3)所示:
綜合以上討論,可以確定影響柱屈服轉角的主要參數(shù)有:混凝土的抗壓強度、軸壓比、剪跨比、縱向鋼筋的屈服強度、配筋率以及縱向鋼筋直徑,并將作為神經(jīng)網(wǎng)絡預測模型的輸入?yún)?shù).
2.3 構建BP網(wǎng)絡預測模型
根據(jù)前述從PEER數(shù)據(jù)庫中遴選出的210組數(shù)據(jù),180組作為BP神經(jīng)網(wǎng)絡的訓練集,30組作為測試集.將2.2節(jié)討論的6個主要參數(shù)作為神經(jīng)網(wǎng)絡輸入?yún)?shù),柱的屈服轉角為輸出結果,在MATLAB中建立如圖3所示的3層BP神經(jīng)網(wǎng)絡N 6-H-1(其中輸入層節(jié)點數(shù)為6,H為隱含層的節(jié)點數(shù),輸出層節(jié)點數(shù)為1).
利用MATLAB神經(jīng)網(wǎng)絡工具箱建立神經(jīng)網(wǎng)絡模型需要確定以下參數(shù):學習函數(shù)、學習速率、激活函數(shù)、訓練函數(shù)、學習周期、性能目標和隱含層節(jié)點數(shù).神經(jīng)網(wǎng)絡參數(shù)選擇如下:
利用BP網(wǎng)絡進行預測分析,為避免因輸入因子數(shù)量級差別而引起較大的網(wǎng)絡誤差,一般先將輸入因子進行歸一化處理.為避免激活函數(shù)其極值0和1附近飽和而伴隨出現(xiàn)“麻痹現(xiàn)象”,這里采用如式(12)所示方法將神經(jīng)網(wǎng)絡的輸入和輸出規(guī)格化:
2.4 BP網(wǎng)絡預測結果
根據(jù)以上討論對圖3中BP神經(jīng)網(wǎng)絡進行訓練、測試,得到如表2所示的預測結果.
從表2中可以看出當隱含層節(jié)點數(shù)為13和15時,其測試集和訓練集的性能函數(shù)值分別達到最小;而當隱含層節(jié)點數(shù)為17和21時,神經(jīng)網(wǎng)絡訓練集和測試集的性能函數(shù)均有相對較好的取值.限于篇幅,本文只以13和15節(jié)點神經(jīng)網(wǎng)絡為例,討論其對混凝土柱屈服性能預測的適用性.
圖4和表3列出了對應節(jié)點數(shù)目為13和15的BP神經(jīng)網(wǎng)絡模型預測結果.為了進一步檢驗神經(jīng)網(wǎng)絡的預測能力,將這兩組預測結果與實驗結果進行線性回歸分析,結果如圖5所示.
根據(jù)表2和圖5給出的預測結果以及對應的線性回歸結果,其對應較小的性能函數(shù)MSE的值和較高的相關系數(shù)R的值,可以看出神經(jīng)網(wǎng)絡能夠準確預測混凝土柱的屈服轉角.
在表3和圖4中可以看出,2種不同節(jié)點數(shù)的神經(jīng)網(wǎng)絡均能取得較好的預測結果,表3中訓練集和測試集的最大變異系數(shù)僅為0.164和0.179.從圖4~圖5以及表2~表3分析可以看到,利用BP網(wǎng)絡預測柱的屈服位移可以得到相當滿意的結果.
2.5 BP網(wǎng)絡預測結果與經(jīng)驗模型比較
為了對比說明神經(jīng)網(wǎng)絡預測結果的準確性,本文也將Elwood在文獻\[20\]基于理論推導的有效剛度模型帶入式(2),計算結果列于圖6(a)中.同時對應式(1)中屈服位移的定義,計算對比文獻\[11\]所提出的經(jīng)驗模型屈服轉角:
從圖6和表4中可以看出:在利用Elwood計算模型估算構件的屈服轉角時,估算精度高于前述4種規(guī)范模型,但是也看出Elwood模型和Jiang經(jīng)驗模型估算結果依舊相當離散,其中Elwood模型計算結果變異系數(shù)較小為0.365,而Jiang模型的計算結果則為0.477.相對于上述6種經(jīng)驗理論模型,本文所提的13和15節(jié)點神經(jīng)網(wǎng)絡模型,其預測結果與實驗值的比值均值為1;變異系數(shù)僅為0.16和0.13.
相對于前述6種經(jīng)驗理論模型中僅考慮其中一部分因素的影響或者用一個數(shù)學表達式描述輸入?yún)?shù)和柱子屈服位移之間的關系,神經(jīng)網(wǎng)絡綜合考慮輸入?yún)?shù)之間的相互影響,通過權值和閥值矩陣的調節(jié)得到更為準確的預測結果.
2.6 BP網(wǎng)絡敏感性分析
為得到輸入?yún)?shù)對混凝土柱屈服位移的影響程度以及驗證2.2節(jié)通過經(jīng)驗模型選用神經(jīng)網(wǎng)絡輸入?yún)?shù)方法的合理性,本文采用基于Garson算法[28]的神經(jīng)網(wǎng)絡敏感性分析.作為基于連接權神經(jīng)網(wǎng)絡敏感性分析方法的代表,該方法通過連接權的乘積計算輸入變量對輸出變量的貢獻程度.對于一個N X-H-1的神經(jīng)網(wǎng)絡,其計算表述如式(14)所示:
3 結 論
為了能夠準確地預測混凝土柱構件的屈服性能,建立一種基于BP神經(jīng)網(wǎng)絡預測混凝土柱的屈服性能的方法.本文首先利用以往的經(jīng)驗理論模型詳細解構了影響混凝土柱屈服性能的因素,并將混凝土強度、軸壓比、剪跨比、縱向鋼筋配筋率、縱向鋼筋直徑及縱向鋼筋屈服強度作為BP神經(jīng)網(wǎng)絡的輸入?yún)?shù)預測混凝土柱的屈服性能.通過與已有估算模型結果的對比,顯示出利用BP神經(jīng)網(wǎng)絡預測模型的高效性.最后通過利用Garson敏感性分析方法證明了本文選擇預測模型輸入?yún)?shù)合理性,并評估了各個輸入因素對混凝土柱屈服位移影響的程度.本文通過利用神經(jīng)網(wǎng)絡預測矩形混凝土柱的屈服性能,說明在數(shù)據(jù)不充分的情況下神經(jīng)網(wǎng)絡對于預測工程結果是一種很有潛力的手段.
參考文獻
[1] FEMA 273 Guidelines for the seismic rehabilitation of buildings[S]. Washington: Federal Emergency Management Agency, 1997:13-14.
[2] FEMA 356 Prestandard and commentary for the seismic rehabilitation of buildings \[S\]. Washington: Federal Emergency Management Agency, 2000:218-218.
[3] ASCE/SEI41 Seismic rehabilitation of existing buildings \[S\]. American Society of Civil Engineers, Reston, VA. 2007:354-354.
[4] Eurocode 8:Design of Structures for earthquake resistance Part 1: General rules, seismic actions and rules for buildings\[S\]. Brussels European Committee for Standardization,1998:219-219.
[5] PARK R. Ductility evaluation from laboratory and analytical testing \[C\]// Proceedings 9th World Conference on Earthquake Engineering.Tokyo-Kyoto, Japan. 1988:VIII,605-616.
[6] PANAGIOKOS T B, FARDIS M N. Deformations of reinforced concrete members at yielding and ultimate \[J\]. ACI Structural Journal, 2001, 98(2): 135-148.
[7] MONTES H E, ASCHLEIM M. Estimates of the yield curvature for design of reinforced concrete columns \[J\]. Magazine of Concrete Research, 2003, 55(4): 373-383.
[8] BERRY M, EBERHARD M O. Performance models for flexural damage in reinforced concrete columns \[R\]. Pacific Earthquake Engineering Research Center, College of Engineering, University of California, 2004:158-158.
[9] PEER. Peer structural performance database \[DB/OL\]. \[2003-12-29\]. http: // nisee. berkeley. edu / spd.
[10]錢稼茹,徐福江.鋼筋混凝土柱基于位移的變形能力設計方法\[J\]. 建筑結構, 2007(12): 30-32.
QIAN Jia-ru, XU Fu-jiang. Displacement-based deformation capacity design of RC columns \[J\]. Building Structure, 2007(12): 30-32.(In Chinese)
[11]JIANG Huan-jun, LU Xi-lin, KUBO T. Damage displacement estimation of flexure-dominant RC columns[J]. Advances in Structural Engineering, 2010, 13(2): 357-368.
[12]PRIESTLEY M. Brief comments on elastic flexibility of reinforced concrete frames and significance to seismic design \[J\]. Bulletin of the New Zealand National Society for Earthquake Engineering, 1998,31(4): 246-259.
[13]PERU I, FAJFAR P. Prediction of the forceCdrift envelope for RC columns in flexure by the CAE method \[J\]. Earthquake Engineering & Structural Dynamics, 2007,36(15): 2345-2363.
[14]Eurocode 8: design of structures for earthquake resistance CPart 2: Bridge\[S\]. Brussels European Committee for Standardization, 2005:133-133.
[15]ORETA A W, KAWASHIMA K. Neural network modeling of confined compressive strength and strain of circular concrete columns \[J\]. Journal of Structural Engineering, 2003, 129(4): 554-561.
[16]羅廣恩,崔維成. 金屬疲勞裂紋擴展速率的貝葉斯正則化BP神經(jīng)網(wǎng)絡預測\[J\]. 船舶力學, 2012, 16(4): 433-441.
LUO Guang-en, CUI Wei-cheng. Prediction of fatigue crack growth rate of metal based on Bayesian regularized BP neural network \[J\]. Journal of Ship Mechanics, 2012, 16(4): 433-441. (In Chinese)
[17]INEL M. Modeling ultimate deformation capacity of RC columns using artificial neural networks \[J\]. Engineering Structures, 2007, 29(3): 329-335.
[18]劉思思,趙明華,楊明輝,等. 基于自組織神經(jīng)網(wǎng)絡與遺傳算法的邊坡穩(wěn)定性分析方法\[J\]. 湖南大學學報:自然科學版,2008,35(12): 7-12.
LIU Si-si, ZHAO Ming-hua, YANG Ming-hui, et al. Slope stability analysis method based on self-organizing neural network and genetic algorithm\[J\]. Journal of Hunan University: Natural Sciences, 2008, 35(12): 7-12. (In Chinese)
[19]王蕾,郁勝,李賓賓,等. 基于徑向基神經(jīng)網(wǎng)絡的橋梁有限元模型修正\[J\]. 土木工程學報, 2012,45(S2): 11-15.
WANG Lei, YU Shen, LI Bin-bin, et al. Bridge model updating based on radial basis function neural network \[J\]. China Civil Engineering Journal, 2012,45(S2): 11-15. (In Chinese)
[20]ELWOOD K J, EBERHARD M O. Effective stiffness of reinforced concrete columns \[J\]. ACI Structural Journal, 2009, 106(4):483-483.
[21]ACI 318-2008 Building Code requirements for structural concrete and commentary \[S\]. Farmington Hills: 2008, American Concrete Institute, 2008:143-143.
[22]HORNIK K, STINCHCOMBE M, WHITE H. Multilayer feedforward networks are universal approximators \[J\]. Neural Networks, IEEE Transactions on, 1989, 2(5): 359-366.
[23]HAGAN M T, MENHAJ M B. Training feedforward networks with the Marquardt algorithm \[J\]. Neural Networks, IEEE Transactions on, 1994, 5(6): 989-993.
[24]鄭罡,李貴乾. 鋼筋混凝土橋墩有效剛度\[J\]. 土木工程學報, 2013,46(6):44-52.
ZHENG Gang, LI Gui-qian. Effective stiffness of reinforced concrete bridges piers \[J\]. China Civil Engineering Journal, 2013,46(6):44-52. (In Chinese)
[25]SEZEN H, MOEHLE J P. Bond-slip behavior of reinforced concrete members \[C\]//Proceedings of fib symposium on concrete structures in seismic regions. Athens, Greece. CEB-FIP. 2003.