卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)點范文

時間:2024-03-28 16:38:53

導(dǎo)語:如何才能寫好一篇卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)點,這就需要搜集整理更多的資料和文獻(xiàn),歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。

卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)點

篇1

關(guān)鍵詞關(guān)鍵詞:人臉識別;卷積神經(jīng)網(wǎng)絡(luò);圖像識別;深度學(xué)習(xí);模式識別

DOIDOI:10.11907/rjdk.171043

中圖分類號:TP317.4

文獻(xiàn)標(biāo)識碼:A文章編號文章編號:16727800(2017)005018603

0引言

人臉識別是近年來模式識別、圖像處理、機(jī)器視覺、神經(jīng)網(wǎng)絡(luò)及認(rèn)知科學(xué)領(lǐng)域的研究熱點[12]。所謂人臉識別,是指給定一個靜態(tài)人臉圖像或動態(tài)視頻,利用存儲有若干已知身份的人臉數(shù)據(jù)庫驗證單個或多個人的身份[1]。作為生物特征識別的一個重要方面,人臉識別有著廣泛的應(yīng)用場景,如:檔案管理系統(tǒng)、公安系統(tǒng)的犯罪身份識別、銀行和海關(guān)的監(jiān)控、安全驗證系統(tǒng)、信用卡驗證等領(lǐng)域。在人臉識別巨大魅力的影響下,國內(nèi)互聯(lián)網(wǎng)公司也開始了人臉識別應(yīng)用的探索,如百度推出的人臉考勤系統(tǒng)、阿里支付寶的刷臉登錄等功能都是人臉識別的具體應(yīng)用。目前,人臉識別的代表性方法主要有以下幾種:Turk和Pentland[3]提出的特征臉(Eigenface)方法;基于線性區(qū)別分析,Belhumeur 等[4]提出了Fisherface方法;基于統(tǒng)計理論,劍橋大學(xué)的 Samaria和Fallside[5]提出了隱馬爾科夫模型[5](HMM),Lawrence 等[6]提出的通過多級自組織映射神經(jīng)網(wǎng)絡(luò)(SOM)[6]與卷積神經(jīng)網(wǎng)絡(luò)相結(jié)合進(jìn)行人臉識別。上述方法雖然獲得了良好的識別正確率,但需要人工參與特征提取,然后將提取的特征送入分類器進(jìn)行識別,過程較為復(fù)雜。

卷積神經(jīng)網(wǎng)絡(luò)[79]是近年發(fā)展起來,并引起廣泛重視的一種高效深度學(xué)習(xí)識別算法,其已成為當(dāng)前語音分析和圖像處理領(lǐng)域的研究熱點。相比傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)而言,卷積神經(jīng)網(wǎng)絡(luò)具有權(quán)值共享、局部感知的優(yōu)點。局部感知的網(wǎng)絡(luò)結(jié)構(gòu)使其更接近于生物神經(jīng)網(wǎng)絡(luò),權(quán)值共享大大減少了模型學(xué)習(xí)參數(shù)的個數(shù),同時降低了神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的復(fù)雜性。在圖像處理領(lǐng)域,卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)點體現(xiàn)得更為突出,多維的圖像數(shù)據(jù)可以直接作為網(wǎng)絡(luò)的輸入,特征提取和分類均集成在網(wǎng)絡(luò)中,避免了傳統(tǒng)識別算法中復(fù)雜的特征提取和訓(xùn)練分類器過程。除此之外,卷積神經(jīng)網(wǎng)絡(luò)對圖像中的位移、比例縮放、旋轉(zhuǎn)、傾斜或其它形式的變形具有很好的魯棒性。為了解決傳統(tǒng)人臉識別算法特征提取和訓(xùn)練分類器困難的問題,本文借鑒Lenet-5[10]的結(jié)構(gòu),設(shè)計一個適合ORL數(shù)據(jù)集人臉識別任務(wù)的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。

1卷積神經(jīng)網(wǎng)絡(luò)

1.1用于ORL人臉識別的CNN

本文提出的7層卷積神經(jīng)網(wǎng)絡(luò)模型由輸入層、2個卷積層、2個降采樣層、一個全連接層和一個Sigmoid輸出層組成。卷積核的大小均為5×5,降采樣層Pooling區(qū)域的大小為2×2,采用Average Pooling(相鄰小區(qū)域之間無重疊),激活函數(shù)均采用Sigmoid函數(shù)。每一個卷積層或降采樣層由多個特征圖組成,每個特征圖有多個神經(jīng)元,上層的輸出作為下一層的輸入。此外,本文實驗學(xué)習(xí)率的取值為常數(shù)1.5,該卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。

1.2卷積層

卷積神經(jīng)網(wǎng)絡(luò)中的卷積層一般稱C層[11](特征提取層)。卷積層的輸入來源于輸入層或者采樣層。卷積層中的每一個特征圖都對應(yīng)一個大小相同的卷積核,卷積層的每一個特征圖是不同的卷積核在前一層輸入的特征圖上作卷積,然后將對應(yīng)元素累加后加一個偏置,最后通過激活函數(shù)得到。假設(shè)第l層榫砘層,則該層中第j個特征圖的計算表達(dá)式如式(1)。

xlj=f(∑i∈Mjxl-1iklij+blj)(1)

這里的Mj表示選擇的上一層輸出特征圖的集合。

1.3降采樣層

降采樣層是對上一層的特征圖進(jìn)行下采樣處理,處理方式是在每一個特征圖內(nèi)部的相鄰小區(qū)域進(jìn)行聚合統(tǒng)計。常見的下采樣方式有兩種:Average Pooling和Max Pooling。其中,Average Pooling是取小區(qū)域內(nèi)像素的平均值,而Max Pooling是取小區(qū)域內(nèi)像素的最大值。降采樣層只是對輸入的特征圖進(jìn)行降維處理,不改變特征圖的個數(shù)。假設(shè)down表示下采樣操作,βlj表示乘性偏置,blj表示加性偏置,則降采樣層中某個特征圖的計算表達(dá)式如下:

xlj=f(βljdown(xl-1j)+blj)(2)

1.4輸出層

卷積神經(jīng)網(wǎng)絡(luò)的輸出層一般為分類器層,常用的有徑向基(RBF)函數(shù)輸出單元、Sigmoid輸出單元和Softmax回歸分類器。在ORL人臉識別任務(wù)中,采用Sigmoid函數(shù)輸出單元,輸出層的編碼采用非分布編碼“one-of-c”的方式。由于采用Sigmoid函數(shù),每一個單元輸出值是0-1范圍內(nèi)的一個正數(shù),代表該樣本屬于該單元對應(yīng)類別的概率。數(shù)值最大的那個單元即為樣本的預(yù)測類別。假設(shè)x為全連接層的輸出,則輸出層輸出結(jié)果的計算表達(dá)式如下:

y=f(wTx+b)(3)

其中,f表示激活函數(shù),這里采用Sigmoid函數(shù),Sigmoid函數(shù)表達(dá)式如下:

f(x)=11+e-x(4)

2實驗結(jié)果與分析

實驗在Windows7 64位下的Matlab 2014a中進(jìn)行,采用Matlab深度學(xué)習(xí)工具箱DeepLearnToolbox。PC的內(nèi)存8G,CPU主頻為3.2GHZ。

ORL人臉數(shù)據(jù)集是在1992年至1994年之間由AT &T Cambridge實驗室拍攝的人臉圖像所構(gòu)成。數(shù)據(jù)集中包含40個不同人物的臉部圖像,每個人物包含10張圖像,總共400張。每個類別中的臉部圖像在不同的時間拍攝得到,存在如下差異:①光線;②面部表情,如眼睛的閉合和睜開狀態(tài),面部是否帶有微笑的表情等;③一些面部細(xì)節(jié)上的差異,如是否佩戴眼鏡等。該數(shù)據(jù)集中所有人臉圖像均為灰度圖像,且圖像中人物面部朝向基本一致,都朝向正前方。

圖2為ORL數(shù)據(jù)集中部分人臉圖像。數(shù)據(jù)集中每個原始圖像大小為92*112像素,本文實驗中對這些圖像進(jìn)行預(yù)處理,使每一幅圖像的尺寸調(diào)整為28*28,并對每一副圖像進(jìn)行歸一化處理,這里采用簡單的除255的方式。隨機(jī)選取每一個類別的8張圖像作為訓(xùn)練樣本,剩下的2張作為測試樣本。因此,訓(xùn)練集有320個樣本,測試集有80個樣本。

2.1改變C3層卷積核個數(shù)對網(wǎng)絡(luò)的影響

卷積神經(jīng)網(wǎng)絡(luò)性能的好壞與卷積層卷積核的個數(shù)密切相關(guān),但每一個卷積層應(yīng)該設(shè)置多少個卷積濾波器,目前并沒有數(shù)學(xué)理論指導(dǎo)。為了研究卷積核個數(shù)對網(wǎng)絡(luò)最終識別準(zhǔn)確率的影響,本文保持C1層卷積核個數(shù)不變,通過改變C3層卷積核的個數(shù),形成新的網(wǎng)絡(luò)結(jié)構(gòu),用訓(xùn)練集訓(xùn)練網(wǎng)絡(luò),訓(xùn)練迭代次數(shù)均為60次,然后用測試集對每一種網(wǎng)絡(luò)結(jié)構(gòu)的性能進(jìn)行測試。實驗結(jié)果如表1所示。

從表1可以看出,當(dāng)C3層有10個卷積核時,網(wǎng)絡(luò)模型對測試集的識別正確率最高。卷積核的個數(shù)與識別準(zhǔn)確率并不成正比關(guān)系,當(dāng)卷積核個數(shù)過多時,網(wǎng)絡(luò)的識別準(zhǔn)確率會下降,這是因為在卷積核個數(shù)增加的同時,需要學(xué)習(xí)的參數(shù)也隨之增加,而數(shù)據(jù)集中訓(xùn)練樣本的規(guī)模較小,已不能滿足學(xué)習(xí)的要求。

2.2改變C1層卷積核個數(shù)對網(wǎng)絡(luò)的影響

由上述實驗結(jié)果可知,C3層卷積核個數(shù)為10時,網(wǎng)絡(luò)識別效果最好。因此,為了研究卷積層C1層卷積核個數(shù)對識別準(zhǔn)確率的影響, C3層保留10個卷積核,改變C1層卷積核的個數(shù)構(gòu)造新的網(wǎng)絡(luò)結(jié)構(gòu),用測試集針對不同網(wǎng)絡(luò)結(jié)構(gòu)就測試集和訓(xùn)練集的識別準(zhǔn)確率進(jìn)行測試。實驗結(jié)果如表2所示。

從表2的實驗結(jié)果可以得到相同結(jié)論:卷積層卷積核的個數(shù)并非越多越好,卷積核個數(shù)過多,網(wǎng)絡(luò)需要學(xué)習(xí)的參數(shù)也隨之增加,當(dāng)訓(xùn)練集中樣本個數(shù)無法滿足學(xué)習(xí)需要時,網(wǎng)絡(luò)識別準(zhǔn)確率就會下降。

2.3與其它算法比較

為進(jìn)一步說明本文所提卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的有效性和優(yōu)越性,將該結(jié)構(gòu)(C1層6個卷積核,C3層10個卷積核,學(xué)習(xí)率1.5)的實驗結(jié)果與其它識別方法在ORL數(shù)據(jù)集上的實驗結(jié)果進(jìn)行對比,結(jié)果如表3所示??梢钥闯?,本文所提方法比Eigface、ICA的識別效果好,與2DPCA方法的識別準(zhǔn)確率一樣,比FisherFace方法的識別準(zhǔn)確率只低了0.20%,這進(jìn)一步證實了本文所提網(wǎng)絡(luò)結(jié)構(gòu)的有效性。

3結(jié)語

本文在理解Lenet-5結(jié)構(gòu)的基礎(chǔ)上,提出一種適用于ORL人臉數(shù)據(jù)集的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。實驗結(jié)果表明,本文提出的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),不僅避免了復(fù)雜的顯式特征提取過程,在ORL數(shù)據(jù)集上獲得98.30%的識別正確率,而且比大多數(shù)傳統(tǒng)人臉識別算法的效果都好。此外,本文還通過大量驗就每個卷積層卷積核個數(shù)對網(wǎng)絡(luò)識別準(zhǔn)確率的影響進(jìn)行了詳細(xì)研究與分析,這對設(shè)計CNN網(wǎng)絡(luò)結(jié)構(gòu)具有一定的參考意義。

參考文獻(xiàn)參考文獻(xiàn):

[1]李武軍,王崇駿,張煒,等.人臉識別研究綜述[J].模式識別與人工智能,2006,19(1):5866.

[2]張翠平,蘇光大.人臉識別技術(shù)綜述[J].中國圖象圖形學(xué)報,2000,5(11):885894.

[3]YANG M H.Face recognition using kernel methods[J].Nips,2002(2):14571464.

[4]祝秀萍,吳學(xué)毅,劉文峰.人臉識別綜述與展望[J].計算機(jī)與信息技術(shù),2008(4):5356.

[5]SAMARIA F,YOUNG S.HMMbased architecture for face identification[J].Image and Vision Computing,1994,12(8):537543.

[6]LAWRENCE S,GILES C L,TSOI A C.Convolutional neural networks for face recognition[C].Proceedings CVPR'96,1996 IEEE Computer Society Conference on Computer Vision and Pattern Recognition,1996:217222.

[7]陳耀丹,王連明.基于卷積神經(jīng)網(wǎng)絡(luò)的人臉識別方法[J].東北師范大學(xué)學(xué)報:自然科學(xué)版,2016,48(2):7076.

[8]盧官明,何嘉利,閆靜杰,等.一種用于人臉表情識別的卷積神經(jīng)網(wǎng)絡(luò)[J].南京郵電大學(xué)學(xué)報:自然科學(xué)版,2016,36(1):1622.

[9]李彥冬,郝宗波,雷航.卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J].計算機(jī)應(yīng)用,2016,36(9):25082515.

[10]LCUN Y,BOTTOU L,BENGIO Y,et al.Gradientbased learning applied to document recognition[J].Proceedings of the IEEE,1998,86(11):22782324.

篇2

關(guān)鍵詞:諧波分析;FFT;加窗插值;多譜線插值;小波變換

引言

隨著我國電網(wǎng)規(guī)模的日益擴(kuò)大,電網(wǎng)的諧波污染也逐漸嚴(yán)重,如何快速有效地檢測和分析網(wǎng)絡(luò)中的諧波成分是一個大家非常關(guān)心的問題。

1電力系統(tǒng)諧波分析的常用方法

1.1采用模擬濾波器硬件電路檢測諧波的方法

模擬濾波器諧波檢測如圖1所示。該法原理直觀明了,成本低,但其測量精度依賴于濾波器的元件參數(shù)[1]。

1.2基于神經(jīng)網(wǎng)絡(luò)理論的諧波檢測方法

文獻(xiàn)[2]提出了一種基于固定三角基函數(shù)的人工神經(jīng)網(wǎng)絡(luò)諧波分析方法,新模型更直觀,收斂速度快。但構(gòu)建神經(jīng)網(wǎng)絡(luò)需要時間來訓(xùn)練樣本、神經(jīng)網(wǎng)絡(luò)構(gòu)造方法缺乏統(tǒng)一的規(guī)范、訓(xùn)練樣本數(shù)量龐大。

1.3基于傅里葉變換的諧波檢測方法

為盡可能地減少FFT算法中出現(xiàn)的頻譜泄漏效應(yīng)和柵欄效應(yīng)以及其他的誤差,現(xiàn)總結(jié)兩種方法:(1)插值算法加窗插值法通過加窗減小頻譜泄漏、插值消除柵欄效應(yīng)引起的誤差。理想的窗函數(shù)需同時具有兩個特性:一是主瓣窄;二是低旁瓣峰值和高旁瓣衰減率。研究比較成熟的窗函數(shù)有:三角窗、矩形窗、Blackman窗、Nuttall窗等[3-5]。常用窗的頻域特性如表1所示。(2)雙峰譜線修正算法文[6]提出了一種基于兩根譜線的加權(quán)平均來修正幅值的雙峰譜線修正算法,實驗結(jié)果證明了其有效性和易實現(xiàn)性。

1.4基于小波分析的諧波檢測方法

三層小波包分解示意圖如圖2所示。單一的諧波檢測方法已經(jīng)不能滿足要求,所以現(xiàn)在就是要集合幾種諧波檢測方法的優(yōu)點來提取更精確更合理的方法。小波變換和加窗的FFT結(jié)合也得到了廣泛研究[7],圖3、圖4仿真出了小波變換的頻域?qū)崿F(xiàn)和FFT實現(xiàn)。綜上所述,研究加混合卷積窗以及多譜線插值的改進(jìn)FFT有更大的應(yīng)用前景,小波包對高、低頻段進(jìn)行相同尺度的分解,提高信號分析分辨率,提供了更多的信號特征。

2諧波測量的發(fā)展趨勢

隨著電網(wǎng)相關(guān)技術(shù)和設(shè)備不斷的變化,需要不斷改進(jìn)和更新諧波檢測方法,未來諧波檢測的主要發(fā)展趨勢為:(1)電力系統(tǒng)受非穩(wěn)態(tài)諧波影響,諧波檢測需要逐步由穩(wěn)態(tài)諧波檢測轉(zhuǎn)向非穩(wěn)態(tài)諧波檢測。針對非穩(wěn)態(tài)波形畸變,尋求新方法,如神經(jīng)網(wǎng)絡(luò)、小波變換等。(2)諧波測量需要由確定性、慢時變性轉(zhuǎn)為隨機(jī)性、快速性以及諧波實時跟蹤,研究新的諧波特性辨識方法。(3)諧波檢測需要諧波監(jiān)測、實時分析與控制目標(biāo)相結(jié)合,實現(xiàn)測量與控制網(wǎng)絡(luò)化、智能化、集成一體化。(4)諧波檢測需要建立一套完整的諧波檢測理論體系和完善的功率定義和理論,通過新理論提出新方法滿足研究實踐需求。

3結(jié)束語

集合多種諧波分析方法的優(yōu)點研制出一種高精度、高速度的混合諧波分析法勢在必行,這必將推動學(xué)術(shù)領(lǐng)域研究新的諧波特性辨識和快速變化諧波跟蹤方法,為諧波研究和治理提供有力的保障。

參考文獻(xiàn):

[1]陳冬紅.電力系統(tǒng)諧波測量和分析方法研究[D].南京:河海大學(xué),2005.

[2]王小華,何怡剛.基于神經(jīng)網(wǎng)絡(luò)的電力系統(tǒng)高精度頻率諧波分析[J].中國電機(jī)工程學(xué)報,2007,27(34):102-106.

[3]溫和,騰召勝,曾博,等.基于三角自卷積窗的介損角測量算法及應(yīng)用[J].電工技術(shù)學(xué)報,2010,25(7):192-198.

[4]溫和,騰召勝,卿柏元,等.Hanning自卷積窗及其在諧波分析中的應(yīng)用[J].電工技術(shù)學(xué)報,2009,24(2):164-169.

[5]曾博,唐求,卿柏元,等.基于Nuttall自卷積窗的改進(jìn)FFT譜分析方法[J].電工技術(shù)學(xué)報,2014,29(7):59-65.

[6]龐浩,李東霞,俎云霄,等.應(yīng)用FFT進(jìn)行電力系統(tǒng)諧波分析的改進(jìn)型算法[J].中國電機(jī)工程學(xué)報,2003,23(6):50-54.

篇3

關(guān)鍵詞:深度學(xué)習(xí);器材管理;深度信念網(wǎng)絡(luò);效率;損耗

1.引言

深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的延伸和進(jìn)一步發(fā)展,它基于機(jī)器學(xué)習(xí),從廣義上講是機(jī)器學(xué)習(xí)的一種,但與機(jī)器學(xué)習(xí)有較大不同,深度學(xué)習(xí)的模型和人腦皮層結(jié)構(gòu)有較大相似,從某種意義上講,深度學(xué)習(xí)是智能學(xué)習(xí),可對復(fù)雜數(shù)據(jù)進(jìn)行有效處理[1]。深度學(xué)習(xí)模型既可以作為特征提取器,也可以用作特征分類器,并且二者可以同時應(yīng)用,直接得到想要的分類結(jié)果。器材有成千上萬種,每種器材的性能、數(shù)量、有效期、生產(chǎn)廠家這些基本要素Ю戳舜罅康氖據(jù),而深度學(xué)習(xí)應(yīng)用于大數(shù)據(jù)挖掘方面,實踐中已經(jīng)取得較好的效果?,F(xiàn)在是一個“大數(shù)據(jù)+深度學(xué)習(xí)”的時代。本文研究在器材管理中如何運用深度學(xué)習(xí),來探尋器材管理中蘊(yùn)含的內(nèi)在規(guī)律,通過得出的管理規(guī)則進(jìn)行器材管理,來提高器材管理的信息化水平。

2.深度學(xué)習(xí)的典型模型

深度學(xué)習(xí)基礎(chǔ)是受限玻爾茲曼機(jī)(RBM),玻爾茲曼機(jī)( BM)可以認(rèn)為是一種能量模型。即參數(shù)空間中每一種情況均有一個標(biāo)量形式的能量與之對應(yīng)。對全連通玻爾茲曼機(jī)進(jìn)行簡化,其限制條件是在給定可見層或者隱層中的其中一層后,另一層的單元彼此獨立,即為受限玻爾茲曼機(jī)。深度學(xué)習(xí)的典型模型主要有:自動編碼器(AE),卷積神經(jīng)網(wǎng)絡(luò)(CNN),深度信念網(wǎng)絡(luò)(DBN)三種[2]。

(1)自動編碼器

自編碼器的基本原理:將輸入的原始信號進(jìn)行編碼,使用編碼得到的新信號重建原始信號,求得重建的元信號與原始信號相比重建誤差最小。它的優(yōu)點是可以有效的提取信號中的主要特征,減少信息冗余,提高信息處理效率。模式分類中經(jīng)常用到的以下方法:K均值聚類、稀疏編碼、主成分分析等均可理解為是一個自動編碼器。

(2)卷積神經(jīng)網(wǎng)絡(luò)

卷積神經(jīng)網(wǎng)絡(luò)(CNN)善于提取數(shù)據(jù)局部特征,模型復(fù)雜度較低,權(quán)值的數(shù)量較少,它組合局部感受野(滑動窗口)、權(quán)重共享(減少自由參數(shù)數(shù)量)、和空間或時間上的子采樣這3 種結(jié)構(gòu)去確保平移和變形上的不變性。

(3)深度信念網(wǎng)絡(luò)

深度信念網(wǎng)絡(luò)(DBN)主要采用貪婪逐層訓(xùn)練方法。簡言之通過預(yù)先訓(xùn)練與反向調(diào)節(jié)來訓(xùn)練整個DBN網(wǎng)絡(luò):在預(yù)先訓(xùn)練階段,先逐個訓(xùn)練每一個受限玻爾茲曼機(jī)RBM,逐層疊加,并將下一層的RBM 的輸出作為上一層RBM 的輸入; 在反向調(diào)節(jié)階段可以采用BP訓(xùn)練,通過誤差函數(shù)進(jìn)行反向調(diào)節(jié).

3.基于深度信念網(wǎng)絡(luò)(DBN)的器材管理方法

器材管理的目的是在最大器材利用率下所用資金最少,耗費管理人員精力最少。從模型分析上來說,這是一個求最優(yōu)化模型的問題。深度信念網(wǎng)絡(luò)在求取最優(yōu)化方面具有一定的優(yōu)越性。深度信念網(wǎng)絡(luò)(DBN)的優(yōu)點:(1)采用并行結(jié)構(gòu),可同時處理多組數(shù)據(jù),計算效率得到較大提升,對處理大數(shù)據(jù)有優(yōu)勢;(2)可以用較小的模型參數(shù)波動得到較高的分類結(jié)果,模型穩(wěn)定性較好[3]。

對器材管理者來說如何制定性價比最高的器材采購方案,最優(yōu)的器材下發(fā)方案,最優(yōu)的器材存儲方案是急需解決的三個問題。

器材采購方案:其制定主要基于器材的價格,儲存年限,采購批次,采購量,售后服務(wù)等因素,針對每種器材的上述指標(biāo)進(jìn)行量化打分,再根據(jù)每種器材的側(cè)重點分配量化系數(shù),整合成10種數(shù)據(jù)輸入。將這些數(shù)據(jù)輸入到訓(xùn)練好的深度信念網(wǎng)絡(luò)(DBN)中得出每種器材的采購點數(shù),根據(jù)點數(shù)決定采購的器材數(shù)量、品種、規(guī)格和型號。

器材的下發(fā)方案:器材的下發(fā)要考慮不同單位的需求,現(xiàn)有庫存情況,近期器材補(bǔ)充情況,近期大項工作需求情況,根據(jù)不同情況對不同單位,不同器材,具體工作設(shè)定不同顏色的標(biāo)簽,通過標(biāo)簽整合,將這些數(shù)據(jù)輸入到訓(xùn)練好的深度信念網(wǎng)絡(luò)(DBN)中得到具體的下?lián)芊桨浮?/p>

器材儲存方案:儲存主要包括使用單位庫存情況,倉庫庫存情況,供貨單位協(xié)議代儲情況,運用深度信念網(wǎng)絡(luò)(DBN)對器材消耗情況進(jìn)行分析,進(jìn)而得出,單位庫存的數(shù)質(zhì)量,使用單位庫存的數(shù)質(zhì)量,供貨單位協(xié)議代儲數(shù)質(zhì)量,使三者處于一個最優(yōu)化狀態(tài),既不影響使用,又可降低庫存空間的需求,減少資金占用。

4. 實驗結(jié)果

本文采用深度信念網(wǎng)絡(luò)(DBN)對1000種器材采購、運輸、庫存、消耗使用以及不同品牌的通用器材采購成本進(jìn)行了實驗分析,通過深度信念網(wǎng)絡(luò)(DBN)的優(yōu)化,采購效率提高10%,運輸時間縮短20%,庫存量降低15%,使用消耗準(zhǔn)確度提高5%,采購成本降低18%。

5. 未來發(fā)展與展望

深度學(xué)習(xí)方法在器材管理中的應(yīng)用還處于初步探索之中,但是初步運用表明,其在“大數(shù)據(jù)+云計算”時代,對提高器材管理的信息化水平具有較大的實用價值和經(jīng)濟(jì)價值,用于器材管理的深度學(xué)習(xí)模型,還較為簡單,還有進(jìn)一步發(fā)展的空間,實踐應(yīng)用中對器材數(shù)據(jù)特征的提取還有待加強(qiáng),只有深刻的理解器材管理的特征及需求,才能有針對性的建立模型,提高模型的可靠性和有效性。使器材管理水平更上一層樓,使器材管理跟上信息化發(fā)展的步伐。

參考文獻(xiàn):

[1] 孫志軍,薛磊,許陽明.基于深度學(xué)習(xí)的邊際Fisher分析特征提取算法[J].電子與信息學(xué)報,2013,35(4):805-811.

[2] 孫志軍,薛磊,許陽明,等.深度學(xué)習(xí)研究綜述[J].計算機(jī)應(yīng)用研究, 2012, 29( 8) : 2806 - 2810.

[3] 胡曉林,朱軍.深度學(xué)習(xí)―――機(jī)器學(xué)習(xí)領(lǐng)域的新熱點[J].中國計算機(jī)學(xué)會通訊, 2013,9( 7) : 64 - 69.

作者簡介:

康克成(1981.04-)河北昌黎人,研究生,碩士,工程師,中國人民92819部隊,研究方向:信息與通信工程;

王強(qiáng)(1981.02-)山東膠州人,本科,助理工程師,中國人民92819部隊,研究方向:裝備管理;

篇4

【關(guān)鍵詞】:高速公路 防逃 人臉識別 高清視

中圖分類號:U412.36+6 文獻(xiàn)標(biāo)識碼:A

人臉識別的分類與概述

人臉識別就是通過計算機(jī)提取人臉的特征,并根據(jù)這些特征進(jìn)行身份驗證。人臉與人體的其他生物特征(指紋、虹膜等)一樣與生俱來,它們所具有的唯一性和不易被復(fù)制的良好特性為身份鑒別提供了必要的前提;同其他生物特征識別技術(shù)相比,人臉識別技術(shù)具有操作簡單、結(jié)果直觀、隱蔽性好的優(yōu)越性。人臉識別一般包括三個步驟:人臉檢測、人臉特征提取和人臉的識別與驗證。其處理流程如圖

輸入圖像 人臉圖像人臉特征輸出結(jié)果

人臉識別的一般步驟

人臉識別方法繁多,早期研究較多的方法有基于幾何特征的人臉識別方法和基于模板匹配的人臉識別方法。目前人臉識別方法主要研究及應(yīng)用的是基于統(tǒng)計的識別方法、基于連接機(jī)制的識別方法以及其它一些綜合方法。下面是這幾類方法的基本介紹:[2]

(1)基于幾何特征的人臉識別方法

幾何特征矢量是以人臉器官如眼睛、鼻子、嘴巴等的形狀和幾何關(guān)系為基礎(chǔ)的特征矢量,其分量通常包括人臉指定兩點間距離、曲率、角度等。早期的研究者Brunelli[3]等人采用改進(jìn)的積分投影法提取出用歐式距離表征的35維人臉特征矢量用于人臉識別。Huang Chung Lin等人[4]采用動態(tài)模板[5,6,7]與活動輪廓模型提取出人臉器官的輪廓[8,9,10]?;趲缀翁卣鞯娜四樧R別方法有如下優(yōu)點:符合人類識別人臉的機(jī)理,易于理解;對每幅圖像只需要存儲一個特征矢量,存儲量小;對光照變化不敏感。但這種方法同樣存在一些問題,如從圖像中提取這些特征比較困難;對強(qiáng)烈的表情變化和姿態(tài)變化的魯棒性差等。

(2)基于模板匹配的人臉識別方法

模板匹配大都采用歸一化相關(guān),直接計算兩幅圖之間的匹配程度。最簡單的人臉模板就是將人臉看成一個橢圓[10,11]。另一種方法就是將人臉用一組獨立的小模板表示,如眼睛模板、嘴巴模板、鼻子模板等,采用彈性模板方法提取這些模板特征[12]。Brunelli等人專門比較了基于幾何特征的人臉識別方法和基于模板匹配的人臉識別方法,他們得出的結(jié)論是:基于幾何特征的人臉識別方法具有識別速度快和內(nèi)存要求小等優(yōu)點,但基于模板匹配的識別率要高于基于幾何特征的識別率。

(3)基于統(tǒng)計的人臉識別方法

基于統(tǒng)計特征的識別方法包括基于特征臉的方法和基于隱馬爾可夫模型的方法。特征臉(Eigenface)方法[13]是從主成分分析導(dǎo)出的一種人臉識別和描述技術(shù)。主成分分析實質(zhì)上是K-L展開的網(wǎng)絡(luò)遞推實現(xiàn),K-L變換是圖像壓縮中的一種最優(yōu)正交變換,其生成矩陣一般為訓(xùn)練樣本的總體散布矩陣。特征臉方法就是將包含人臉的圖像區(qū)域看作是一種隨機(jī)向量,因此可以采用K-L變換獲得其正交K-L基底。對應(yīng)其中較大特征值的基底具有與人臉相似的形狀,因此又稱之為特征臉。

隱馬爾可夫模型(HMM)是用于描述信號統(tǒng)計特性的一組統(tǒng)計模型?;谌四槒纳系较?、從左到右的結(jié)構(gòu)特征,Samaria等人[14]首先將1-D HMM和2-D Pseudo HMM用于人臉識別。Kohir等[15]采用1-D HMM將低頻DCT系數(shù)作為觀察矢量獲得了好的識別效果。Eickeler等[16]采用2-DPseudo HMM識別DCT壓縮的JPEG圖像中的人臉圖像。Nefian等[17]采用嵌入式HMM識別人臉。

(4)基于連接機(jī)制的人臉識別方法(神經(jīng)網(wǎng)絡(luò)彈性圖匹配)

基于連接機(jī)制的識別方法,包括一般的神經(jīng)網(wǎng)絡(luò)方法和彈性圖匹配(Elastic Graph Matching)方法。神經(jīng)網(wǎng)絡(luò)在人臉識別應(yīng)用中有很長的歷史[18]。Demers 等[19]提出采用PCA方法提取人臉圖像特征,用自相關(guān)神經(jīng)網(wǎng)絡(luò)進(jìn)一步壓縮特征,最后采用一個多層處理器來實現(xiàn)人臉識別。Laurence等[20]通過一個多級的SOM實現(xiàn)樣本的聚類,將卷積神經(jīng)網(wǎng)絡(luò)(CNN)用于人臉識別。Lin等[21]采用基于概率決策的神經(jīng)網(wǎng)絡(luò)(PDBNN)方法。最近,徑向基函數(shù)RBF神經(jīng)網(wǎng)絡(luò)因具有逼近性好、空間描述緊湊和訓(xùn)練速度快等特點而被用于人臉識別。Gutta等[22]提出了將RBF與樹分類器結(jié)合起來進(jìn)行人臉識別的混合分類器結(jié)構(gòu),后來他們用RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行了針對部分人臉的識別研究[23],他們的研究表明利用部分人臉也可以有效地識別人臉。Er等[24]采用PCA進(jìn)行維數(shù)壓縮,再用LDA抽取特征,然后基于RBF進(jìn)行人臉識別。Haddadnia 等[25]基于PZMI(Pseudo Zernike Moment Invariant)特征,并采用混合學(xué)習(xí)算法的RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行人臉識別。此外,Lucas 等采用連續(xù)的n-tuple網(wǎng)絡(luò)識別人臉。

彈性圖匹配方法是一種基于動態(tài)鏈接結(jié)構(gòu)的方法[26]。在人臉圖像上放置一組矩形網(wǎng)格節(jié)點,每個節(jié)點的特征用該節(jié)點處的多尺度Gabor幅度特征描述,各節(jié)點之間的連接關(guān)系用幾何距離表示,從而構(gòu)成基于二維拓?fù)鋱D的人臉描述。根據(jù)兩個圖像中各節(jié)點和連接之間的相似性可以進(jìn)行人臉識別。Wiskott等[27]將人臉特征上的一些點作為基準(zhǔn)點,強(qiáng)調(diào)了人臉特征的重要性。他們采用每個基準(zhǔn)點存儲一串具有代表性的特征矢量,大大減少了系統(tǒng)的存儲量。Würtz 等[28]只使用人臉面部的特征,進(jìn)一步消除了結(jié)構(gòu)中的冗余信息和背景信息,并使用一個多層的分級結(jié)構(gòu)。Grudin等[29]也采用分級結(jié)構(gòu)的彈性圖,通過去除了一些冗余節(jié)點,形成稀疏的人臉描述結(jié)構(gòu)。Nastar等[30]提出將人臉圖像I(x,y)表示為可變形的3D網(wǎng)格表面(x, y, I(x,y)),將人臉匹配問題轉(zhuǎn)換為曲面匹配問題,利用有限元分析的方法進(jìn)行曲面變形,根據(jù)兩幅圖像之間變形匹配的程度識別人臉。

(5)基于形變模型的方法

基于形變模型的方法是一個受到重視的方法。通過合成新的視覺圖像,可以處理姿態(tài)變化的問題。Lanitis等[31]通過在人臉特征邊沿選擇一些稀疏的基準(zhǔn)點描述人臉的形狀特征,然后將形狀變形到所有人臉圖像的平均形狀,再根據(jù)變形后的形狀進(jìn)行紋理(灰度)變形,形成與形狀無關(guān)的人臉圖像。然后分別對形狀和灰度進(jìn)行PCA變換,根據(jù)形狀和紋理的相關(guān)性,用PCA對各自的結(jié)果進(jìn)一步分析,最終得到描述人臉的AAM(Active Appearance Model)模型。通過改變這些參數(shù)可得到不同變化的人臉圖像,模型參數(shù)能夠用于人臉識別。Romdhani 等[32]采用激光掃描儀獲得人臉的3D數(shù)據(jù),分別對一些基準(zhǔn)點構(gòu)成的形狀和基準(zhǔn)點的灰度(或彩色)完成PCA,得到3D人臉形狀和灰度(彩色)基圖像,通過變化參數(shù)就可獲得不同的3D人臉模型。通過施加一些先驗約束可以避免合成不真實的人臉圖像。利用線性形狀和紋理誤差,通過3D模型向2D輸入圖像的自動匹配實現(xiàn)人臉識別。

項目采用的識別算法

人臉自動識別技術(shù)經(jīng)過多年來的研究已經(jīng)積累了大量研究成果。但是仍然面臨很多問題,尤其是在非約束環(huán)境下的人臉識別。結(jié)合本研究項目及應(yīng)用環(huán)境綜合考慮,采用特征臉方法對視屏資料中的司機(jī)臉部進(jìn)行提取識別。

特征臉方法是90年代初期由Turk和Pentland提出算法,具有簡單有效的特點, 也稱為基于主成分分析(principal component analysis,簡稱PCA)的人臉識別方法。把人臉圖像空間線性投影到一個低維的特征空間。PCA實質(zhì)上是K-L展開的網(wǎng)絡(luò)遞推實現(xiàn)。K-L變換是圖像壓縮技術(shù)中的一種最優(yōu)正交變換。人們將它用于統(tǒng)計特征提取。從而形成子空間法模式識別的基礎(chǔ)。若將K-L變換用于人臉識別,則需假設(shè)人臉處于低維線性空間。由高維圖像空間K-L變換后,可得到一組新的正交基,由此可以通過保留部分正交基獲得正交K-L基底。如將子空間對應(yīng)特征值較大的基底按照圖像陣列排列,則可以看出這些正交基呈現(xiàn)出人臉的形狀。因此這些正交基也稱為特征臉,這種人臉的識別方法也叫特征臉法。

特征子臉技術(shù)的基本思想是:從統(tǒng)計的觀點,尋找人臉圖像分布的基本元素,即人臉圖像樣本集協(xié)方差矩陣的特征向量,以此近似地表征人臉圖像。這些特征向量稱為特征臉(Eigenface)。

利用這些基底的線性組合可以描述、表達(dá)和逼近人臉圖像,因此可以進(jìn)行人臉識別與合成。識別過程就是將人臉圖像映射到由特征臉張成的子空間上,比較其與已知人臉在特征臉空間中的位置,具體步驟如下:[33]

(1)初始化,獲得人臉圖像的訓(xùn)練集并計算特征臉,定義為人臉空間;

(2)輸入待識別人臉圖像,將其映射到特征臉空間,得到一組權(quán)值;

(3)通過檢查圖像與人臉空間的距離判斷它是否為人臉;

(4)若為人臉,根據(jù)權(quán)值模式判斷它是否為數(shù)據(jù)庫中的某個人。

1. 計算特征臉

假設(shè)人臉圖像包含個像素,因此可以用維向量Γ表示。如人臉訓(xùn)練集由幅人臉圖像構(gòu)成,則可以用表示人臉訓(xùn)練集。

其均值為:

(2-1)

每幅圖像與均值的差為:

(2-2)

構(gòu)造人臉訓(xùn)練集的協(xié)方差矩陣:

(2-3)

其中 。

協(xié)方差矩陣的正交分解向量即為人臉空間的基向量,也即特征臉。

一般比較大(通常大于1000),所以對矩陣直接求解特征向量是不可能的,為此引出下列定理:

SVD定理:設(shè)是一秩為的維矩陣,則存在兩個正交矩陣:

(2-4)

(2-5)

以及對角陣:

(2-6)

滿足

其中:為矩陣和的非零特征值,和分別為和對應(yīng)于的特征矢量。上述分解成為矩陣的奇異值分解(SVD),為的奇異值。

推論:

(2-7)

由上述定理可知:

人臉訓(xùn)練集所包含的圖像一般要比圖像的像素數(shù)小的多,因此可以轉(zhuǎn)求矩陣

(2-8)

的特征向量,M為人臉訓(xùn)練集圖像總數(shù)。

矩陣的特征向量由差值圖像與線性組合得到:

=(2-9)

實際上,m(m

(2-10)

識別

基于特征臉的人臉識別過程由訓(xùn)練階段和識別階段兩個階段組成。在訓(xùn)練階段,每個己知人臉映射由特征臉張成的子空間上,得到m維向量:

(2-11)

距離閾值定義如下:

(2-12)

在識別階段,首先把待識別的圖像映射到特征臉空間,得到向量

(2-13)

與每個人臉集的距離定義為

(2-14)

為了區(qū)分人臉和非人臉,還需計算原始圖像與其由特征臉空間重建的圖像之間的距離:

(2-15)

其中:

(2-16)

采用最小距離法對人臉進(jìn)行分類,分類規(guī)則如下:

(1)若,則輸入圖像不是人臉圖像;

(2)若,則輸入圖像包含未知人臉;

(3)若,則輸入圖像為庫中的某個人臉。

實際上,特征臉反映了隱含在人臉樣本集合內(nèi)部的信息和人臉的結(jié)構(gòu)關(guān)系。將眼睛、面頰、下頜的樣本集協(xié)方差矩陣的特征向量稱為特征眼、特征頜和特征唇,統(tǒng)稱特征子臉。特征子臉在相應(yīng)的圖像空間中生成子空間,稱為子臉空間。計算出測試圖像窗口在子臉空間的投影距離,若窗口圖像滿足閾值比較條件,則判斷其為人臉。

基于特征分析的方法,也就是將人臉基準(zhǔn)點的相對比率和其它描述人臉臉部特征的形狀參數(shù)或類別參數(shù)等一起構(gòu)成識別特征向量,這種基于整體臉的識別不僅保留了人臉部件之間的拓?fù)潢P(guān)系,而且也保留了各部件本身的信息,而基于部件的識別則是通過提取出局部輪廓信息及灰度信息來設(shè)計具體識別算法?,F(xiàn)在Eigenface(PCA)算法已經(jīng)與經(jīng)典的模板匹配算法一起成為測試人臉識別系統(tǒng)性能的基準(zhǔn)算法;而自1991年特征臉技術(shù)誕生以來,研究者對其進(jìn)行了各種各樣的實驗和理論分析,F(xiàn)ERET測試結(jié)果也表明,改進(jìn)的特征臉?biāo)惴ㄊ侵髁鞯娜四樧R別技術(shù),也是具有最好性能的識別方法之一。

該方法是先確定眼虹膜、鼻翼、嘴角等面像五官輪廓的大小、位置、距離等屬性,然后再計算出它們的幾何特征量,而這些特征量形成一描述該面像的特征向量。其技術(shù)的核心實際為"局部人體特征分析"和"圖形/神經(jīng)識別算法。"這種算法是利用人體面部各器官及特征部位的方法。如對應(yīng)幾何關(guān)系多數(shù)據(jù)形成識別參數(shù)與數(shù)據(jù)庫中所有的原始參數(shù)進(jìn)行比較、判斷與確認(rèn)。Turk和Pentland提出特征臉的方法,它根據(jù)一組人臉訓(xùn)練圖像構(gòu)造主元子空間,由于主元具有臉的形狀,也稱為特征臉,識別時將測試圖像投影到主元子空間上,得到一組投影系數(shù),和各個已知人的人臉圖像比較進(jìn)行識別。

結(jié)束語

從目前國情來講,在一段時間內(nèi)高速公路收費還會繼續(xù)存在,某些司機(jī)逃費的僥幸心也同樣會有。通過帶路徑識別功能的 RFID 復(fù)合卡作為通行卡,利用 RFID 卡的信息對車輛進(jìn)行跟蹤,在不增加硬件投入的情況下,直接可以給車道收費系統(tǒng)提供抓拍高清圖像,以及其它報警聯(lián)動系統(tǒng)提供圖像等,可有效解決高速公路沖卡逃費問題,可廣泛應(yīng)用于封閉式管理的公路收費系統(tǒng)。

參考文獻(xiàn):

[1]江艷霞. 視頻人臉跟蹤識別算法研究. 上海交通大學(xué)博士學(xué)位論文,2007.

[2]Brunelli R and Poggio T., Feature Recognition: Features Versus Templates. IEEE Transactions on

PAMI, 1993, 15(10):1042 -1052.

[3]李剛. 基于特征臉法的正面人臉識別研究. 國防科學(xué)技術(shù)大學(xué)碩士學(xué)位論文,2002.11

[4]JOHN CANNY. A Computational Approach to Edge Detection. IEEE TRANSACTIONS ON PATTERN

ANALYSIS AND MACHINE INTELLIGENCE, VOL.PAMI-8, NO.6, NOVEMBER 1986.

[5]張建飛、陳樹越等. 基于支持向量基的交通視頻人車識別研究[J]. 電視技術(shù),2011

[6]肖波、樊友平等. 復(fù)雜背景下基于運動特征的人面定位[J]. 重慶大學(xué)學(xué)報,2002

[7] 《中華人民共和國交通部公路聯(lián)網(wǎng)收費技術(shù)要求》,交通部

[8] 《廣東省高速公路聯(lián)網(wǎng)收費系統(tǒng)》,DB44 127-2003,廣東省質(zhì)量技術(shù)監(jiān)督局

[9] 《視頻安防監(jiān)控數(shù)字錄像設(shè)備》,GB 20815-2006

[10]《安全防范工程技術(shù)規(guī)范》,GB 50348-2004

篇5

獨立分量分析(independentcomponentanalysis,ICA)是基于信號高階統(tǒng)計量的信號處理方法,其基本含義是將多道觀測信號按照統(tǒng)計獨立的原則通過優(yōu)化算法分解為若干獨立成分,前提是各源信號為彼此統(tǒng)計獨立的非高斯信號。與主分量分析(prin-cipalcomponentanalysis,PCA)相比,ICA不僅實現(xiàn)了信號的去相關(guān),而且要求各高階統(tǒng)計量獨立。1994年,Comon[1]系統(tǒng)地分析了瞬時混迭信號盲源分離問題,提出了ICA的概念與基本假設(shè)條件,并基于累積量直接構(gòu)造了目標(biāo)函數(shù),進(jìn)而指出ICA是PCA的擴(kuò)展和推廣。20世紀(jì)90年代中期,Bell和Sejnowski[2]提出隨機(jī)梯度下降學(xué)習(xí)算法,即最大熵ICA算法(Infomax-ICA)。近年ICA在眾多領(lǐng)域得到廣泛應(yīng)用,主要得益于Lee等提出的擴(kuò)展ICA算法[3]、Hyvarinen的定點ICA算法[4]與Cardoso的JADE算法[5]。

2ICA模型

設(shè)有m個未知的源信號si(t),i=1~m,構(gòu)成一個列向量s(t)=[s1(t),s2(t),…,sm(t)]T,設(shè)A是一個n×m維矩陣,一般稱為混合矩陣(mixingmatrix)。設(shè)x(t)=[x1(t),x2(t),…,xn(t)]T是由n個觀測信號xi(t),i=1~n構(gòu)成的列向量,n(t)為n維附加噪聲,其瞬時線性混合模型(圖1)表示為下式:x(t)=As(t)+n(t),n≥m(1)一般情況下,噪聲可以忽略不計。則ICA模型可以簡化為:x(t)=As(t),n≥m(2)ICA的命題是:對任何t,根據(jù)已知的x(t)在A生物醫(yī)學(xué)工程研究JournalofBiomedicalEngineeringResearch未知的條件下求解未知的s(t)。這就構(gòu)成一個無噪聲的盲分離問題。ICA的思路是設(shè)置一個解混矩陣W(W∈Rm×n),使得x經(jīng)過W變換后得到n維輸出列向量y(t),即y(t)=Wx(t)=WAs(t)(3)如果通過學(xué)習(xí)實現(xiàn)了WA=I(I為單位陣),則y(t)=s(t),從而達(dá)到分離源信號的目的。根據(jù)概率論中心極限定理,兩個獨立隨機(jī)變量和的高斯性通常比原來任何一個的高斯性都要強(qiáng)。信號分離的過程,就是神經(jīng)網(wǎng)絡(luò)輸出的各分量非高斯性(即獨立性)增強(qiáng)的過程。由于沒有任何參照目標(biāo),學(xué)習(xí)只能是自組織的。學(xué)習(xí)過程的第一步是建立以W為變量的目標(biāo)函數(shù)L(W),如果某個W能使L(W)達(dá)到極值,該W即為所需的解;第二步是用一種有效的算法求解W。按照L(W)定義的不同和求W的算法不同,可以構(gòu)成各種ICA算法。目標(biāo)函數(shù)的定義可以分為基于高階統(tǒng)計和基于信息論的方法。

3ICA判據(jù)與算法

用ICA解決BSS問題,一般基于以下假設(shè):①各源信號si(t)統(tǒng)計獨立;②觀測信號數(shù)n≥源信號數(shù)m;③各源信號si(t)中至多允許有一個高斯分布的信號源;④各傳感器引入的噪聲很小。ICA理論及分離算法的關(guān)鍵在于如何度量分離結(jié)果的獨立性。

3.1基于非高斯最大化的ICA

直觀的說,非高斯性是ICA模型估計的關(guān)鍵。采用峭度(kurtosis)和負(fù)熵(negentropy)可以度量非高斯性的大小。

3.1.1基于峭度高階統(tǒng)計量的判據(jù)隨機(jī)變量y(t)沒有歸一化的峭度,也稱作四階累積量,定義為:kurt(y)=E{y4}-3(E{y2})2=C4[y4](4)對高斯信號變量來說,它的kurtosis等于零;但對大多數(shù)非高斯隨機(jī)變量而言,它們的kurtosis有正也有負(fù)。聲音信號等具有正kurtosis值的信號稱為超高斯信號,生物醫(yī)學(xué)信號、圖像信號、通信信號等具有負(fù)kurtosis值的信號稱作亞高斯信號。由于該度量方法在理論和計算上都非常簡單,因此廣泛用于ICA和相關(guān)領(lǐng)域。

3.1.2基于負(fù)熵的ICA目標(biāo)函數(shù)由信息論理論可知,在所有具有等方差的隨機(jī)變量中,高斯分布的隨機(jī)變量的信息熵最大,非高斯性越強(qiáng),其信息熵越小。這表明熵能用于非高斯性的測量。負(fù)熵定義如下:J(y)∝H(ygauss)-H(y)(5)其中,H(y)=∫f(y)logf(y)dy,ygauss是一與y具有相同協(xié)方差的高斯隨機(jī)變量。負(fù)熵總是非負(fù)的,并只有當(dāng)y是高斯分布時為零。實際應(yīng)用中為簡化計算,通常要對負(fù)熵加以近似[6]:J(y)∝[E{G(y)}-E{G(ν)}]2(6)其中,ν為零均值單位方差的高斯向量,y的均值為零,且是單位方差;G(•)可取為G1(u)=1a1log-cosha1u(1≤a1≤2)或G2(u)=-exp(-u2/2)等非二次函數(shù)。這種近似得到的負(fù)熵,給出了古典的kurto-sis和負(fù)熵在非高斯性測量上的一種很好的折衷,其近似概念簡單,計算快速,具有較好的魯棒性。

3.2基于信息論的ICA

3.2.1基于極大似然(ML)估計的ICA在ICA模型中可以直接定義似然函數(shù)(對數(shù)形式)如下:logL=∑Tt=1∑ni=1logfi(wWix(t))+Tlog|detW|(7)其中,fi為獨立分量si的密度函數(shù)(假設(shè)pdf已知),x(t)(t=1,2,…,T)是x的實現(xiàn),該式也可表示為:1TlogL=E{∑ni=1logfi(wTix)}+log|detW|(8)在實際的ML估計中,獨立分量的pdf也不必精確的估計出來。事實上,只要能夠確定獨立分量的超高斯或亞高斯性即可。但是,對獨立分量先驗知識的錯誤認(rèn)知,會導(dǎo)致完全錯誤的結(jié)果。

3.2.2基于信息最大化的ICAInfomax算法充分利用神經(jīng)網(wǎng)絡(luò)的知識,其原理是最大化一個具有非線性輸出神經(jīng)網(wǎng)絡(luò)的輸出熵(或信息流)。假設(shè)x是一個輸出形式為Φi(wiTx)的神經(jīng)網(wǎng)絡(luò)輸入,這里Φi是一些非線性標(biāo)量函數(shù),wi是神經(jīng)網(wǎng)絡(luò)的權(quán)向量,得到最大化輸出的熵為:H(Φ1,…,Φn)=H(x)+E{log│detF/W(x)│}(9)式中F(x)=(Φ1(w1Tx),…,Φn(wnTx))。57第4期趙浩等•獨立分量分析在生物醫(yī)學(xué)信號處理中的應(yīng)用E{log│detF/W(x)│}=∑Ni=1E{logΦ′i(wiTx)}+log│detW│(10)比較式(8)與式(10),可以看出輸出熵同似然函數(shù)的期望值有相同的形式。在此處,獨立分量的pdf被函數(shù)Φ′i代替。如果此處的非線性函數(shù)Φ′i采用相應(yīng)于累計的分布函數(shù),比如說Φ′I(•)=fi(•),那么輸出熵則等于似然值。所以Infomax和MLE是等價的。

3.2.3基于最小互信息(MMI)的ICA根據(jù)信息論中互信息的定義,考慮到線性關(guān)系y(t)=Wx(t),可得基于最小互信息的目標(biāo)函數(shù)I(y1,y2,…yn)=∑iH(yi)-H(x)-log|detW|(11)最小化該式即可得到分離矩陣W,使yi(t)趨于相互獨立。

3.3ICA的學(xué)習(xí)算法

ICA的學(xué)習(xí)算法可分為兩類,一類是求取相關(guān)目標(biāo)函數(shù)的極值,另一類是基于隨機(jī)梯度方法的自適應(yīng)算法。一種好的學(xué)習(xí)算法應(yīng)保證解的正確性,并且算法簡單,收斂速度快。近年Lee等提出了擴(kuò)展ICA算法[3],該算法在迭代過程中不需要計算信號的高階統(tǒng)計量,收斂速度快,可實現(xiàn)亞高斯和超高斯信號的同步分離。FastICA算法是一種基于負(fù)熵或極大似然估計等獨立性判決準(zhǔn)則的分離算法[4],該算法是基于定點遞推算法得到的。FastICA收斂速度快,不需要選擇步長,獨立成分可以逐個估計,并具有很多神經(jīng)算法的優(yōu)點,如計算簡單,需求的內(nèi)存小,是并行的。基于負(fù)熵的一維FastICA算法能估計其中的一個獨立分量,或者說是一個投影,其步驟如下:(1)中心化觀測數(shù)據(jù),使其均值為零;并對觀測數(shù)據(jù)進(jìn)行白化預(yù)處理,初始權(quán)值向量W;(2)利用定點準(zhǔn)則計算下一個ICA基本向量的估計:W(k)=E{xg(W(k-1)Tx)}-E{g′(WT(k-1)x)}W(12)式中g(shù)(•)為g1(u)=tanh(a1u)(1<a1<2,經(jīng)常置a1=1)或g2(u)=uexp(-u2/2);(3)將W(k)標(biāo)準(zhǔn)化,即W(k)除以它的范數(shù),W(k)=W(k)/W(k);(4)如果不收斂,則返回第2步。

4ICA在生物醫(yī)學(xué)信號處理中的應(yīng)用

生物醫(yī)學(xué)信號的采集設(shè)備一般由各類傳感器、運算放大器、濾波器、AD/DA轉(zhuǎn)換、預(yù)處理等模塊構(gòu)成,生物醫(yī)學(xué)信號比較微弱,一般處在微伏級,暴露于大量的背景噪聲和傳感器噪聲中,并且電路可能存在不同的內(nèi)部時鐘和傳輸轉(zhuǎn)換時延,各通道間存在串?dāng)_和迭加,干擾信號的幅度可能比有用信號的幅度還要強(qiáng),具有較強(qiáng)的非平穩(wěn)性和隨機(jī)性等普遍特征。如何在保證信號特征基本不變的前提下,對其進(jìn)行去噪提純,繼而進(jìn)行信號的特征提取和壓縮,改善其存儲、檢索及模式自動識別等問題,是醫(yī)療自動化和信息化的重要課題。由于ICA是根據(jù)觀測信號和源信號的概率分布來估計各源信號,考慮信號的高階統(tǒng)計特性,因而能有效的提升信號的信噪比,是一種非常有效的處理方法。眾多的科技工作者已經(jīng)把ICA用于生物醫(yī)學(xué)信號的研究。其中,Lee等把擴(kuò)展ICA用于EEG和fM-RI數(shù)據(jù)的處理[3];Common提出的基于高階累計量的算法也被用于分離胎兒和母體的ECG[7];FastICA固定點算法也被用于EEG和MEG數(shù)據(jù)———腦的電子和電磁活動行為[8],等等。但是,各算法的最優(yōu)結(jié)果和各算法的魯棒性還有待進(jìn)一步確定,這也正是我們當(dāng)前的研究方向。

4.1分離生物醫(yī)學(xué)信號中干擾或噪聲

醫(yī)學(xué)信號中常用的腦電信號是利用放置在頭皮不同位置的導(dǎo)聯(lián)紀(jì)錄的一組數(shù)據(jù),極易受一些干擾成分的影響,如眼球運動偽跡、眨眼、心電偽跡和工頻干擾,這些干擾成分會對腦電信號的分析處理產(chǎn)生很多不良的影響。作為研究和臨床使用的EEG信號,如何在有非自然信號污染的EEG信號中提取神經(jīng)元基本特征是研究人員面臨的問題[9,10]。文獻(xiàn)[11]將小波分析和ICA相結(jié)合,用小波軟門限法提高腦電的信噪比,再利用ICA分離出源信號,有效地去除了腦電中的噪聲和心電干擾。應(yīng)用ICA分離這些信號和噪聲的根據(jù)是:腦活動與其他信號(如眼電、心電等)是不同的生理過程,即它們相互之間是統(tǒng)計獨立的,符合ICA模型的假設(shè)條件。在噪聲干擾確定并可人為生成(如腦電中的工頻干擾)時[12],或干擾具有明確生理意義時,即干擾信號和有用生理信號可被看作是由相對獨立的不同的源產(chǎn)生的情況下,可將噪聲或干擾分離成獨立的源信號。我們利用MATLAB進(jìn)行如下試驗:圖3為3路同步測量的腦電和眼動信號,從原信號及其功率譜可見,腦電信號中含有眼動干擾和60Hz的工頻干擾。由于腦電數(shù)據(jù)庫沒有提供同步測量的工頻信號,我們構(gòu)造兩個60Hz工頻干擾源P1=sin(2*pi*60*t);P2=cos(2*pi*60*t),與3路源信號構(gòu)成5路信號,然后采用FastICA算法分離這5路信號。將分離后的眼電、工頻干擾信號置零后,再重構(gòu)源信號。圖4為不含眼動和工頻干擾的腦電信號,從重構(gòu)結(jié)果及其頻譜可見,腦電信號在100點和700點附近的眼動干擾明顯消除,60Hz的工頻干擾也得到了很好的抑制,試驗取得了良好效果。

4.2特征提取

在生物醫(yī)學(xué)信號和圖像處理中,常需要提取信號的狀態(tài)特征,作為診斷和識別的依據(jù),通常提取特征都是基于信號的低階統(tǒng)計特性,而ICA充分利用了信號的高階相關(guān)性,能有效的提取信號在生理意義上的本質(zhì)特征,分離出與待分析信號相對穩(wěn)定的獨立分量模式,進(jìn)而可以用作信號的特征提取或分類[13,6]。郭曉靜,等[13]分析處理不同心理作業(yè)的思維腦電信號,初步發(fā)現(xiàn)了與心理作業(yè)相對應(yīng)的腦電獨立分量的特征,并用于心理作業(yè)的分類,為腦機(jī)接口技術(shù)提供了新的方法。

篇6

關(guān)鍵詞:航空器損傷探測;智能識別;航空器無人機(jī)巡檢;點云數(shù)據(jù)

近年來,我國航空運輸業(yè)處于高速發(fā)展時期,擁有世界前列的民航客機(jī)保有量和客運總周轉(zhuǎn)量,但民航客機(jī)數(shù)量的不斷增多也帶來了更多的航空器損傷事件。航空器的損傷形式一般包括疲勞損傷、應(yīng)力腐蝕裂紋、耐環(huán)境退化、磨損、摩擦、碎裂、凹陷、劃傷、外來物損傷(FOD)以及由雷擊或強(qiáng)熱導(dǎo)致的損傷。不同類型的損傷在航空器各個區(qū)域所發(fā)生的概率不同,如飛機(jī)大翼前緣容易受到FOD損傷,飛機(jī)頂部區(qū)域容易出現(xiàn)疲勞損傷等。對于航空器而言,一個微小的損傷有可能導(dǎo)致重大空難事故,及時預(yù)防檢測航空器損傷是保證航空器持續(xù)適航的重要手段,對飛行安全起到至關(guān)重要的作用。如何采用更加有效的技術(shù)手段確保精準(zhǔn)探測航空器損傷是現(xiàn)今需要研究的課題。

1航空器損傷檢測通用方法

航空器損傷檢測有多種方法,較為明顯的損傷在例行檢查過程中可通過肉眼或借助手電筒、反光鏡、放大鏡等簡單輔助工具識別。雖然每次短停都檢查飛機(jī)的外表面,但是因環(huán)境影響和損傷的細(xì)微特性,僅依靠目視和簡單工具容易出現(xiàn)漏檢,采用技術(shù)更先進(jìn)的無損檢測方法對飛機(jī)外表面進(jìn)行檢測將更有保證。根據(jù)損傷檢測手段的不同,航空器損傷檢測大致可分為目視檢測法和無損檢測法兩類。

1.1目視檢測法

目視檢查是航空器完整性檢查中最基本、最常用的方法,也是保證飛行安全的重要檢查手段之一,指通過人眼或輔助設(shè)備對飛機(jī)表面進(jìn)行直接觀察以發(fā)現(xiàn)表面損傷,并根據(jù)技術(shù)規(guī)范對損傷做出判斷和評價。在進(jìn)行其他無損檢測之前,凡是能目視的部分都必須經(jīng)過目視檢查,包括:從飛行前繞機(jī)一周檢查,借助照明設(shè)備和放大鏡對機(jī)體表面仔細(xì)檢查;借助內(nèi)窺鏡和反光鏡對機(jī)體內(nèi)部表面檢查等。目視檢查的優(yōu)勢是簡單易操作,不足之處是人眼和工具存在局限性,以及一些特定區(qū)域接近困難,對航空器某些細(xì)微損傷不能有效檢測。檢查過程中需要檢測人具備細(xì)致入微的觀察力和準(zhǔn)確的工具使用方法,人為因素影響較大,個體的先天差異性很可能會影響到檢測結(jié)果的精確程度。

1.2無損檢測法

無損檢測(NDT)指在不改變、不損害材料和工件的狀態(tài)及性能的情況下,對材料和/或制件進(jìn)行宏觀缺陷檢測、幾何特性測量以及化學(xué)成分、組織結(jié)構(gòu)和力學(xué)性能變化的評定,并就材料或制件對特定應(yīng)用的適用性進(jìn)行評價的一種方法。在檢查微小缺陷或目視檢查不能勝任的情況下,需采用無損檢測方法對飛機(jī)是否存在損傷進(jìn)行檢測。根據(jù)物理原理的不同,有多種無損檢測方法,工程應(yīng)用中普遍采用渦流檢測(ET)、滲透檢測(PT)、磁粉檢測(MT)、射線照相檢測(RT)和超聲檢測(UT)五種常規(guī)無損檢測方法。其中,射線照相檢測和超聲檢測用于檢測結(jié)構(gòu)內(nèi)部缺陷,磁粉檢測和渦流檢測可以檢測結(jié)構(gòu)表面和近表面缺陷,滲透檢測只能檢測結(jié)構(gòu)表面開口缺陷。已獲工程應(yīng)用的其他無損檢測方法包括聲發(fā)射檢測、計算機(jī)層析成像檢測、全息干涉/錯位散斑干涉檢測、泄漏檢測、目視檢測和紅外檢測等。相比目視檢測,無損檢測優(yōu)勢明顯,檢查精準(zhǔn)度更高,檢查效果更為直觀,缺點是設(shè)備針對性過強(qiáng),通用性不足,某些設(shè)備操作復(fù)雜程度高影響到檢測效率,檢測人員需掌握更多的設(shè)備使用方法以達(dá)到應(yīng)對飛機(jī)不同種類缺陷檢測的目的。

2無人機(jī)損傷智能識別巡檢方案

隨著人工智能、大數(shù)據(jù)挖掘分析等科學(xué)技術(shù)的發(fā)展及設(shè)備制造工業(yè)的不斷成熟,無人機(jī)產(chǎn)品體系愈發(fā)豐富,應(yīng)用范圍越來越廣闊。由于無人機(jī)具備高空、遠(yuǎn)距離、快速、自行作業(yè)的能力,在巡檢領(lǐng)域的應(yīng)用可突破現(xiàn)有技術(shù)手段的局限性,實現(xiàn)范圍大、效率高、檢測準(zhǔn)、無死角的檢測效果,是未來替代人工檢測的一種新的補(bǔ)充手段。

2.1無人機(jī)巡檢檢測流程設(shè)計

航空器損傷的形態(tài)及類別相當(dāng)復(fù)雜,既有常見的已知類別的損傷樣本,也存在部分損傷類別樣本極少甚至缺失的情況??紤]到航空器無人機(jī)巡檢的要求,如何從復(fù)雜背景中準(zhǔn)確地識別少樣本甚至零樣本航空器損傷(可能是很細(xì)小的目標(biāo)),是航空器無人機(jī)巡檢的重點及難點工作。如圖1所示,航空器無人機(jī)巡檢一般涵蓋下面幾個重要節(jié)點和程序。第一步:需對航空器劃分測區(qū),進(jìn)行激光雷達(dá)掃描,生成航空器三維模型;第二步:以航空器三維模型為基礎(chǔ),設(shè)置關(guān)鍵掃描點,自動生成精細(xì)化巡檢航線,可以保證預(yù)設(shè)高精度圖像采集和采集點位的一致性;第三步:將精細(xì)化巡檢航線導(dǎo)入無人機(jī),搭載載荷一鍵起飛,自動化巡檢,獲取可見光和點云數(shù)據(jù);配合無人機(jī)指揮保障系統(tǒng),可以實現(xiàn)不同環(huán)境下高頻次、全自主經(jīng)常巡檢和定期巡檢;第四步:對可見光和點云數(shù)據(jù)進(jìn)行分析,生成民航航空器狀態(tài)評定記錄;第五步:對分析數(shù)據(jù)進(jìn)行歸類整理,建立民航航空器的全壽命健康數(shù)據(jù)管理記錄,形成合理的檢查周期和標(biāo)準(zhǔn)的“經(jīng)常、定期”檢查方案。

2.2航空器智能識別算法應(yīng)用分析

上述第四步對可見光和點云數(shù)據(jù)分析、生成民航航空器狀態(tài)評定記錄是航空器無人機(jī)巡檢的關(guān)鍵核心技術(shù)和技術(shù)難點。目前,主流的深度學(xué)習(xí)算法需要大量樣本數(shù)據(jù)集進(jìn)行訓(xùn)練才能取得比較好的結(jié)果,項目早期存在樣本不足的問題。為此,擬首先采用傳統(tǒng)模型驅(qū)動的識別算法,對可能的損傷目標(biāo)進(jìn)行識別和初篩,再對初篩得到的疑似區(qū)域以人機(jī)交互的方式進(jìn)行人工復(fù)檢,去除識別錯誤的損傷,這樣既能大大減小人工的工作量,又能實現(xiàn)全覆蓋檢測。在進(jìn)行上述檢測的同時積累損傷數(shù)據(jù)圖片,當(dāng)數(shù)據(jù)集充分時即可建立深度學(xué)習(xí)模型進(jìn)行訓(xùn)練,實現(xiàn)更好更快的智能損傷識別算法。綜上分析,為了克服初期損傷樣本少和圖像干擾強(qiáng)的雙重影響,民航航空器無人機(jī)巡檢項目擬采用以“模型+數(shù)據(jù)”驅(qū)動的航空器損傷智能識別算法,算法整體結(jié)構(gòu)如圖2所示。擬采用的航空器損傷智能識別算法包括兩個階段:基于模型驅(qū)動的損傷識別階段和基于模型及數(shù)據(jù)融合的損傷識別階段。1)基于模型驅(qū)動的損傷識別階段首先,基于可見光相機(jī)和激光雷達(dá),分別采集彩色圖像和三維點云,將兩類數(shù)據(jù)進(jìn)行空間及時間上的像素級對齊配準(zhǔn);然后,分析不同類型表觀損傷的發(fā)生機(jī)理、空間分布特性、圖像特征和形態(tài)幾何特征,分別提取典型損傷的時頻空間紋理特征和幾何特征;最后,構(gòu)建融合紋理特征和幾何特征的航空器損傷模型,基于該模型實現(xiàn)候選損傷區(qū)域的識別。該階段中,由于圖像數(shù)據(jù)中存在大量噪聲干擾,檢測結(jié)果不可避免地存在錯檢。為此,設(shè)計人機(jī)交互模式,通過人工核查的方式對該階段發(fā)現(xiàn)的可疑目標(biāo)進(jìn)行確認(rèn)。經(jīng)過確認(rèn)的損傷不僅能夠作為檢測結(jié)果直接應(yīng)用,還將作為樣本數(shù)據(jù)進(jìn)行積累,用于第二階段中深度學(xué)習(xí)模型的訓(xùn)練。2)基于模型及數(shù)據(jù)融合的損傷識別階段首先,構(gòu)建航空器損傷圖像的模擬樣本庫和真實樣本庫,其中,模擬樣本庫通過對抗生成網(wǎng)絡(luò)構(gòu)建,真實樣本庫通過人工標(biāo)注和第一階段人工核查確認(rèn)兩種途徑不斷積累損傷圖像樣本;然后,構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)模型,通過從第一階段建立的損傷檢測模型中提取損傷先驗知識,結(jié)合先驗知識與小樣本、弱監(jiān)督學(xué)習(xí),實現(xiàn)融合先驗知識與模擬樣本數(shù)據(jù)的卷積神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練;在此基礎(chǔ)上,利用不斷擴(kuò)增的真實樣本庫,將損傷識別能力從模擬樣本遷移到真實樣本,獲得基于數(shù)據(jù)驅(qū)動的檢測結(jié)果;最后,將模型驅(qū)動檢測結(jié)果與數(shù)據(jù)驅(qū)動檢測結(jié)果進(jìn)行目標(biāo)級融合,從而完成最終的航空器損傷識別任務(wù)。擬采用方案的優(yōu)點包括:不需要前期漫長的數(shù)據(jù)積累,在早期缺乏有效樣本的階段,以模型驅(qū)動方式提取可疑目標(biāo),并通過人機(jī)交互方式實現(xiàn)檢測結(jié)果的核查,在有效降低工作量的同時保證識別準(zhǔn)確性;使用過程中數(shù)據(jù)樣本不斷增加,算法的識別精度也將隨之提升。

2.3建立航空器檢測體系

通過可見光數(shù)據(jù)和激光點云,分析生成航空器巡檢報告,通過無人機(jī)巡檢及時發(fā)現(xiàn)故障隱患,有效提高了航空器運行狀態(tài)的可靠性,同時,通過持續(xù)的信息監(jiān)控,建立航空器的科學(xué)管理體系。1)提升航空器檢查和監(jiān)控能力。監(jiān)測和監(jiān)控是航空器日常維護(hù)的“眼睛”,只有對航空器的各部件的運行狀態(tài)進(jìn)行全面、合理的監(jiān)控,才能及時了解航空器及部件的狀況,從而對航空器進(jìn)行綜合評估。重點是做好關(guān)鍵部件的狀態(tài)監(jiān)測。2)積累數(shù)據(jù)分析和問題判別的經(jīng)驗。在日常維護(hù)中注重經(jīng)驗的積累,做好數(shù)據(jù)的收集和分析過程的記錄,將設(shè)備問題與解決方案進(jìn)行系統(tǒng)的對比,積累經(jīng)驗。3)建立科學(xué)的維護(hù)管理體系。深化運維計劃的管理,支撐合理的維護(hù)周期和標(biāo)準(zhǔn)的維護(hù)方案,并根據(jù)實際情況對不同機(jī)型航空器制定差異化的維護(hù)計劃,同時強(qiáng)化維護(hù)過程管理,保障和提高維護(hù)質(zhì)量。

3結(jié)束語

本文探討了通過內(nèi)置航空器損傷智能識別算法的無人機(jī)巡檢技術(shù)對航空器實施探測的一種理論方法,其中具體細(xì)節(jié)仍有待實現(xiàn)和標(biāo)準(zhǔn)化,如無人機(jī)自主飛行、無人機(jī)航線定位、無人機(jī)探測航線的確立、激光雷達(dá)三維建模等。利用無人機(jī)巡檢技術(shù)實施航空器損傷檢測仍處于探索研究階段,本文提出的方法可為未來各航空公司、飛機(jī)制造商建立更完善更有效的無人機(jī)巡檢損傷探測方法提供初步的解決方案及設(shè)計思路。

參考文獻(xiàn)

[1]謝小榮,楊小林.飛機(jī)損傷檢測[M].北京:航空工業(yè)出版社,2006.

篇7

關(guān)鍵詞:內(nèi)部威脅;檢測模型;信息泄露;網(wǎng)絡(luò)安全;

作者:吳良秋

0、引言

隨著大數(shù)據(jù)、云計算蓬勃發(fā)展,計算機(jī)相關(guān)產(chǎn)品在我們生活中扮演著重要角色,我們在享受的同時,信息安全成了不可忽視的安全隱患,數(shù)據(jù)的非法獲取成了互聯(lián)網(wǎng)環(huán)境下的巨大威脅,特別是內(nèi)部威脅,具有一定的透明性,發(fā)生在安全邊界之內(nèi),相對于外部攻擊更隱蔽,對整個網(wǎng)絡(luò)安全環(huán)境提出了嚴(yán)峻挑戰(zhàn)。

美國防部海量數(shù)據(jù)庫[1]監(jiān)測、分析和識別單位雇員的行為是否給國防部帶來危險;2013年斯諾登事件中內(nèi)部人員通過私人渠道公開內(nèi)部數(shù)據(jù)引起媒體廣泛關(guān)注;2017年3月,Dun&Bradstreet(鄧白氏)的52GB數(shù)據(jù)庫遭到泄露,這個數(shù)據(jù)庫中包括了美國一些大型企業(yè)和政府組織(包括AT&T,沃爾瑪、WellsFargo,美國郵政甚至美國國防部)的3300多萬員工的信息和聯(lián)系方式等;2014年1月,韓國信用局內(nèi)部員工竊取了2000萬銀行和信用卡用戶的個人數(shù)據(jù),造成韓國歷史上最嚴(yán)重的數(shù)據(jù)泄露事件,但這只是內(nèi)部威脅安全的冰山一角。SailPoint的調(diào)查顯示,被調(diào)查者中20%的人表示只要價錢合適會出賣自己的工作賬號和密碼。即時內(nèi)部威脅檢測系統(tǒng)(ITDS)是一項昂貴而復(fù)雜的工程,但是情報界,國防部,公司都在研究相關(guān)檢測模型。

截止2016年4月公安部部署打擊整治網(wǎng)絡(luò)侵犯公民個人信息犯罪專項行動以來,全國公安機(jī)關(guān)網(wǎng)絡(luò)安全保衛(wèi)部門已經(jīng)查破刑事案件1200余起,抓獲犯罪嫌疑人3300余人,其中銀行、教育、電信、快遞、證券、電商網(wǎng)站等行業(yè)內(nèi)部人員270余人[2]。

國內(nèi)外內(nèi)部威脅事件不斷發(fā)生,內(nèi)部威脅應(yīng)對形式嚴(yán)峻,需要社會各界的高度重視,首要工作是分析內(nèi)部威脅的特征,從而研究可能的應(yīng)對方案。

1、內(nèi)部威脅的產(chǎn)生

1.1、相關(guān)術(shù)語

內(nèi)部威脅,一般存在于某一個企業(yè)或組織的內(nèi)部,內(nèi)部的人員與外界共同完成對團(tuán)隊信息的盜竊和交易。

定義1內(nèi)部威脅攻擊者一般是指企業(yè)或組織的員工(在職或離職)、承包商以及商業(yè)伙伴等,其應(yīng)當(dāng)具有組織的系統(tǒng)、網(wǎng)絡(luò)以及數(shù)據(jù)的訪問權(quán)。

內(nèi)部人外延是指與企業(yè)或組織具有某種社會關(guān)系的個體,如在職員工,離職員工,值得注意的是承包商與商業(yè)伙伴擴(kuò)展了內(nèi)部人的范圍,即“合伙人”也是潛在的內(nèi)部攻擊者;內(nèi)涵則是具有系統(tǒng)訪問權(quán)。

定義2內(nèi)部威脅是指內(nèi)部威脅攻擊者利用合法獲得的訪問權(quán)對組織信息系統(tǒng)中信息的機(jī)密性、完整性以及可用性造成負(fù)面影響的行為。

內(nèi)部威脅的結(jié)果是對數(shù)據(jù)安全造成了破壞,如機(jī)密性(如數(shù)據(jù)竊取)、完整性(如數(shù)據(jù)篡改)以及可用性(如系統(tǒng)攻擊)等。

企業(yè)或者組織信息化程度已經(jīng)深入日常管理,盡管企業(yè)或組織努力保護(hù)自身數(shù)據(jù),但身份盜竊、數(shù)據(jù)庫泄露和被盜密碼問題仍然是企業(yè)組織面臨的主要挑戰(zhàn)。如今,組織面臨的最大挑戰(zhàn)之一是內(nèi)部人士的系統(tǒng)濫用,他們的行為深深植根于不遵守監(jiān)管標(biāo)準(zhǔn)。已經(jīng)確定,信息安全防御中最薄弱的環(huán)節(jié)是人,這意味著最嚴(yán)重的威脅來自內(nèi)部人員。

因此,內(nèi)部威脅產(chǎn)生,主要有兩方面原因:(1)主體原因,即攻擊者有攻擊的能力,行為完成一次攻擊;(2)客體原因,一次攻擊能成功都是因為被攻擊對象存在漏洞或者缺乏監(jiān)管。

1.2、內(nèi)部威脅的分類

內(nèi)部威脅[3]有三種主要的分類:偶然的、惡意的和非惡意的。

偶然的威脅通常是由錯誤引起的。例如,由于粗心大意、對政策的漠視、缺乏培訓(xùn)和對正確的事情的認(rèn)識,員工可能不會遵循操作流程。惡意的威脅是指故意破壞組織或使攻擊者受益。例如,信息技術(shù)(IT)管理員因心懷不滿而破壞IT系統(tǒng),使組織陷入停頓。在許多事件中,當(dāng)前和以前的管理員都是因各種動機(jī)故意造成系統(tǒng)問題。非惡意的威脅是人們故意采取的行動,而不打算破壞組織。在非惡意威脅中,其動機(jī)是提高生產(chǎn)力,而錯誤的發(fā)生是由于缺乏培訓(xùn)或?qū)φ?、程序和風(fēng)險的認(rèn)識。

1.3、內(nèi)部威脅特征

⑴高危性內(nèi)部威脅危害較外部威脅更大,因為攻擊者具有組織知識,可以接觸核心資產(chǎn)(如知識產(chǎn)權(quán)等),從而對組織經(jīng)濟(jì)資產(chǎn)、業(yè)務(wù)運行及組織信譽(yù)進(jìn)行破壞以造成巨大損失。如2014年的美國CERT的網(wǎng)絡(luò)安全調(diào)查顯示僅占28%的內(nèi)部攻擊卻造成了46%的損失。

⑵隱蔽性由于攻擊者來自安全邊界內(nèi)部,所以內(nèi)部威脅具有極強(qiáng)的偽裝性,可以逃避現(xiàn)有安全機(jī)制的檢測。

⑶透明性攻擊者來自安全邊界內(nèi)部,因此攻擊者可以躲避防火墻等外部安全設(shè)備的檢測,導(dǎo)致多數(shù)內(nèi)部攻擊對于外部安全設(shè)備具有透明性.

⑷復(fù)雜性(1)內(nèi)外勾結(jié):越來越多的內(nèi)部威脅動機(jī)與外部對手關(guān)聯(lián),并且得到外部的資金等幫助;(3)合伙人:商業(yè)合作伙伴引發(fā)的內(nèi)部威脅事件日益增多,監(jiān)控對象群體擴(kuò)大;(3)企業(yè)兼并:當(dāng)企業(yè)發(fā)生兼并、重組時最容易發(fā)生內(nèi)部威脅,而此時內(nèi)部檢測難度較大;(4)文化差異:不同行為人的文化背景會影響其同類威脅時的行為特征。

2、內(nèi)部威脅模型

學(xué)界曾經(jīng)對內(nèi)部威脅提出過諸多的行為模型,希望可以從中提取出行為模式,這部分主要的工作開始于早期提出的SKRAM模型與CMO模型,兩個模型都從內(nèi)部攻擊者的角度入手,分析攻擊者成功實施一次攻擊所需要具備的要素,其中的主觀要素包括動機(jī)、職業(yè)角色具備的資源訪問權(quán)限以及技能素養(yǎng),客觀要素則包括目標(biāo)的內(nèi)部缺陷的訪問控制策略以及缺乏有效的安全監(jiān)管等。

根據(jù)內(nèi)部威脅產(chǎn)生的原因,內(nèi)部威脅的模型也可分為兩類:基于主體和基于客體。其中基于主體模型主要代表有CMO模型和SKRAM模型,這也是最早的內(nèi)部威脅模型。

2.1、基于主體的模型

CMO模型[4]是最早用于內(nèi)部攻擊的通用模型,這都是單純從攻擊者的主觀方面建立的模型,沒有考慮到客觀因素,如由于資源所有者內(nèi)部缺陷的訪問控制策略及其缺乏切實有效的安全監(jiān)管。攻擊者成功實施一次攻擊主觀方面所需要具備的要素即:(1)能力(Capability),進(jìn)行內(nèi)部攻擊的能力,包括文化層次,技術(shù)水平等能力;(2)動機(jī)(Motive),內(nèi)部攻擊的動機(jī),有因為工作不滿,換取利益等;(2)機(jī)會(Opportunity),不是每個人都有機(jī)會攻擊,有攻擊的能力,也有動機(jī),但是還得有合適的機(jī)會把動機(jī)轉(zhuǎn)化人實際行動。

SKRAM模型[5]是Parker等人在早期的CMO模型基礎(chǔ)上進(jìn)行的改進(jìn),即需要具備的要素有:(1)技能(Skills),也即是內(nèi)部攻擊者的能力;(2)知識(Knowledge),包括內(nèi)部攻擊者的知識水平,文化素養(yǎng);(3)資源(Resources),職業(yè)角色具備的資源訪問權(quán)限;(4)Authority;(5)動機(jī)(Motives)。

Jason等人[6]提出內(nèi)部人員成為了具有攻擊動機(jī)的內(nèi)部攻擊者,主觀要素是用戶的自身屬性,主要影響、反映內(nèi)部人的當(dāng)前心理狀態(tài),這些要素主要包括三類:一類是包括內(nèi)部人的人格特征等內(nèi)在心理特征,另一類包括精神病史或違法犯罪史等檔案信息以及現(xiàn)實中可以表征心理狀態(tài)變化的諸多行為,最后一類則是內(nèi)部人在組織中的職位、能力等組織屬性。

2.2、基于客體的模型

CRBM模型[7](Role-BasedAccessControl)是基于角色訪問控制。通過擴(kuò)展基于角色的訪問控制模型來克服內(nèi)部威脅的局限性,引入了CRBM(復(fù)合基于角色的監(jiān)視)方法。CRBM繼承了RBAC的優(yōu)點,將角色結(jié)構(gòu)映射為三個:組織角色(OrganizationRole,OR)、應(yīng)用程序角色(ApplicationRole,AR)和操作系統(tǒng)角色(OperatingSystemRole,OSR)。

李殿偉等人[8]將訪問控制與數(shù)據(jù)挖掘相結(jié)合,設(shè)計了一種基于角色行為模式挖掘的內(nèi)部威脅檢測模型,提出了一種基于用戶角色行為準(zhǔn)則、行為習(xí)慣與實際操作行為匹配的內(nèi)部威脅預(yù)警方法。文雨等人[9]提出一種新的用戶跨域行為模式分析方法。該方法能夠分析用戶行為的多元模式,不需要依賴相關(guān)領(lǐng)域知識和用戶背景屬性,針對用戶行為模式分析方法設(shè)計了一種面向內(nèi)部攻擊的檢測方法,并在真實場景中的5種用戶審計日志,實驗結(jié)果驗證了其分析方法在多檢測域場景中分析用戶行為多元模式的有效性,同時檢測方法優(yōu)于兩種已有方法:單域檢測方法和基于單一行為模式的檢測方法。

2.3、基于人工智能的模型

傳統(tǒng)的內(nèi)部威脅檢測模型主要是基于異常檢測、基于角色等相關(guān)技術(shù),隨著人工智能的興起,利用機(jī)器學(xué)習(xí)等相關(guān)算法來建立內(nèi)部威脅模型占據(jù)主要地位。這種模型,建立網(wǎng)絡(luò)用戶的正常行為輪廓,并利用不同的機(jī)器學(xué)習(xí)算法進(jìn)行訓(xùn)練,實現(xiàn)了檢測準(zhǔn)確率高的優(yōu)點,但是效率較低。

Szymanski[10]等人使用遞歸數(shù)據(jù)挖掘來描述用戶簽名和監(jiān)視會話中的結(jié)構(gòu)和高級符號,使用一個類SVM來測量這兩種特征的相似性。郭曉明[11]等提出一種基于樸素貝葉斯理論的內(nèi)部威脅檢測模型。通過分析多用戶對系統(tǒng)的命令操作行為特征,對多用戶命令樣本進(jìn)行訓(xùn)練,構(gòu)建樸素貝葉斯分類器。Yaseen等人[12]研究了關(guān)系數(shù)據(jù)庫系統(tǒng)中的內(nèi)部威脅。介紹知識圖譜(KG),展示內(nèi)部人員知識庫和內(nèi)部人員對數(shù)據(jù)項的信息量;引入約束和依賴圖(CDG),顯示內(nèi)部人員獲取未經(jīng)授權(quán)知識的路徑;使用威脅預(yù)測圖(TPG),顯示內(nèi)部人員每個數(shù)據(jù)項的威脅預(yù)測價值(TPV),當(dāng)內(nèi)部威脅發(fā)生時,TPV被用來提高警報級別。梁禮[13]等人提出基于實時告警的層次化網(wǎng)絡(luò)安全風(fēng)險評估方法,包含服務(wù)、主機(jī)和網(wǎng)絡(luò)三級的網(wǎng)絡(luò)分層風(fēng)險評估模型,通過加權(quán)的方式計算網(wǎng)絡(luò)各層的安全風(fēng)險值。分別以實驗室網(wǎng)絡(luò)環(huán)境及校園網(wǎng)環(huán)境為實例驗證了方法的準(zhǔn)確性和有效性。

2.4、基于交叉學(xué)科的模型

隨著內(nèi)部威脅的不斷發(fā)展,內(nèi)部威脅的研究領(lǐng)域不斷擴(kuò)展,基于心理學(xué)、社會學(xué)等方面也出現(xiàn)新的研究思路。

TesleemFagade等人[14]提出了信息安全如何嵌入到組織安全文化中。組織文化被描述為在人、過程和政策之間保持聯(lián)系的共同價值觀、行為、態(tài)度和實踐。建議將安全管理與治理結(jié)合到組織行為和行動文化中,這是最有效的。習(xí)慣性行為傳播,通常需要共同努力打破常規(guī)。如果組織想要養(yǎng)成安全行為的習(xí)慣,那么也許一個與組織安全文化的方向一致的長期目標(biāo)是一種更好的方法,而不是專注于快速認(rèn)證狀態(tài),然后假設(shè)所有的技術(shù)和人工過程都是安全的。組織安全文化被定義為被接受和鼓勵的假設(shè)、態(tài)度和感知,目的是保護(hù)信息資產(chǎn),從而使信息安全的屬性和習(xí)慣得以實現(xiàn)。

匡蕾[15]采用了基于蜜罐技術(shù)的檢測模型;B.A.Alahmadi[16]等人對用戶的網(wǎng)絡(luò)行為建立關(guān)聯(lián),從而檢測出潛在的內(nèi)部威脅。首先從用戶瀏覽的網(wǎng)頁中提取出文本信息,建立向量;其次建立詞向量與語言獲得和詞匯計數(shù),然后通過建立的Word-LIWC關(guān)系矩陣與已有的LIWC-OCEAN關(guān)系矩陣結(jié)合得到詞向量的關(guān)系矩陣。OCEAN代表大五人格:開放性(Openness)、盡責(zé)性(Conscientiousness)、外傾性(Extraversion)、宜人性(Agreeableness)、情緒穩(wěn)定性(Neuroticism);計算用戶瀏覽的新網(wǎng)頁中的詞向量OCEAN值與日常值的歐氏距離,根據(jù)距離的大小判定行為的異常。

3、內(nèi)部威脅常用數(shù)據(jù)集

目前有很多公開的數(shù)據(jù)集,如:KDD99數(shù)據(jù)集,SEA數(shù)據(jù)集、WUIL數(shù)據(jù)集和CERT-IT數(shù)據(jù)集,表1對主要數(shù)據(jù)集進(jìn)行了對比。

⑴KDD99數(shù)據(jù)集:KDD99[17](DataMiningandKnowledgeDiscovery),記錄4,898,431條數(shù)據(jù),每條數(shù)據(jù)記錄包含41個特征,22種攻擊,主要分為以下四類攻擊:拒絕服務(wù)攻擊(denialofservice,DoS)、遠(yuǎn)程到本地的攻擊(remotetolocal,R2L)用戶到遠(yuǎn)程的攻擊(usertoremote,U2R)和探測攻擊(probing)。

Putchala[18]將GRU應(yīng)用于物聯(lián)網(wǎng)領(lǐng)域的入侵檢測,在KDD99數(shù)據(jù)集上進(jìn)行實驗,得到的準(zhǔn)確率高于99%?;诰矸e神經(jīng)網(wǎng)絡(luò)的入侵檢測算法在KDD99的實驗下,比經(jīng)典BP神經(jīng)網(wǎng)絡(luò)和SVM算法有提高。

⑵SEA數(shù)據(jù)集:SEA數(shù)據(jù)集涵蓋70多個UNIX系統(tǒng)用戶的行為日志,這些數(shù)據(jù)來自于UNIX系統(tǒng)acct機(jī)制記錄的用戶使用的命令。SEA數(shù)據(jù)集中每個用戶都采集了15000條命令,從用戶集合中隨機(jī)抽取50個用戶作為正常用戶,剩余用戶的命令塊中隨機(jī)插入模擬命令作為內(nèi)部偽裝者攻擊數(shù)據(jù)。

⑶WUIL數(shù)據(jù)集:WUIL數(shù)據(jù)集通過借助Windows的審計工具,他們實驗記錄20個用戶的打開文件/目錄的行為,每條記錄包含事件ID、事件時間以及事件對象及其路徑信息(如文件名與文件路徑)。

⑷CERT-IT數(shù)據(jù)集:CERT-IT(InsiderThreat)數(shù)據(jù)集[19]來源于卡耐基梅隆大學(xué)(CarnegieMellonUniversity)的內(nèi)部威脅中心,該中心由美國國防部高級研究計劃局(DARPA)贊助,與ExactData公司合作從真實企業(yè)環(huán)境中采集數(shù)據(jù)構(gòu)造了一個內(nèi)部威脅測試集。該中心迄今為止最富有成效的內(nèi)部威脅研究中心,其不僅建立了2001年至今的700多例內(nèi)部威脅數(shù)據(jù)庫,還基于豐富的案例分析不同內(nèi)部威脅的特征,提出了系統(tǒng)破壞、知識產(chǎn)權(quán)竊取與電子欺詐三類基本的攻擊類型,由此組合形成復(fù)合攻擊以及商業(yè)間諜攻擊;此外CERT還建立了內(nèi)部威脅評估與管理系統(tǒng)MERIT用于培訓(xùn)安全人員識別、處理內(nèi)部威脅。CERT完整數(shù)據(jù)集有80G,全部以csv格式記錄用戶行為,包括文件訪問權(quán)限、文件各種屬性以及用戶對文件的增刪改查、Email收發(fā)、移動存儲設(shè)備、打印機(jī)等硬件設(shè)備使用記錄、HTTP訪問及系統(tǒng)登錄、工作崗位及工作部門等信息。CERT數(shù)據(jù)集提供了用戶全面的行為觀測數(shù)據(jù)以刻畫用戶行為模型。

⑸MasqueradingUserData數(shù)據(jù)集:MasqueradingUserData[20],模擬真是用戶入侵系統(tǒng)。整個數(shù)據(jù)集由50個文件組成,每個文件對應(yīng)一個用戶。該文件包含100行和50列,每一列對應(yīng)于50個用戶中的一個。每一行對應(yīng)一組100個命令,從命令5001開始,以命令15000結(jié)束。文件中的條目是0或1。0代表相應(yīng)的100個命令沒有受到感染。狀態(tài)1代表它們被感染了。

⑹其他數(shù)據(jù)集:Mldata[21]數(shù)據(jù)集包含了869個公開的數(shù)據(jù)集,主要是基于機(jī)器學(xué)習(xí)的數(shù)據(jù),包含視頻流和鍵值集群和服務(wù)度量的Linux內(nèi)核統(tǒng)計數(shù)據(jù)、HDF5等。

表1常用數(shù)據(jù)集比較

表1常用數(shù)據(jù)集比較

4、展望

隨著網(wǎng)絡(luò)系統(tǒng)不斷龐大,互聯(lián)網(wǎng)技術(shù)不斷更新,防范網(wǎng)絡(luò)攻擊需要綜合網(wǎng)絡(luò)測量、網(wǎng)絡(luò)行為分析、網(wǎng)絡(luò)流量異常檢測及相關(guān)檢測模型在處理數(shù)據(jù)時的最新研究成果,并且還需要有能力分析國內(nèi)外各種最新網(wǎng)絡(luò)態(tài)勢。內(nèi)部威脅的傳統(tǒng)檢測方法在模型的特征抽取和模版匹配有一定的局限性,隨著人工智能、云計算、大數(shù)據(jù)等新技術(shù)的成熟,這些前沿技術(shù)在特征抽取和模式匹配時,檢測效率和準(zhǔn)確率有較大提升,目前內(nèi)部威脅熱門研究方向包括:

4.1、人工智能方向

人工智能已經(jīng)日趨成熟,各行各業(yè)都在融合人工智能、機(jī)器學(xué)習(xí)等相關(guān)算法技術(shù),在內(nèi)部威脅檢測領(lǐng)域也是一個熱點。

利用當(dāng)前互聯(lián)網(wǎng)領(lǐng)域前沿的數(shù)據(jù)分析技術(shù)、克隆技術(shù)、神經(jīng)網(wǎng)絡(luò)算法、人工智能算法等,在數(shù)據(jù)采集、身份認(rèn)證、日志管理、漏洞檢測、操作審計環(huán)節(jié)上改進(jìn),從而大力提高檢測的質(zhì)量和效率。

4.2、云平臺方向

篇8

【關(guān)鍵詞】3D打印;馬爾可夫隨機(jī)場;建筑結(jié)構(gòu)

0 引言

3D打印,是快速成型技術(shù)的一種,它是一種以三維設(shè)計軟件數(shù)據(jù)為基礎(chǔ),運用液體、粉末等可粘合材料,通過逐層累加的方式來構(gòu)造物體的技術(shù)[1]。以具有周期短、成本低、操作簡單、精準(zhǔn)度高為特點的3D打印技術(shù)的發(fā)展與逐漸成熟,是第三次工業(yè)革命的重要標(biāo)志之一[2]。

本文結(jié)合3D打印技術(shù)的主要特點,介紹在建筑結(jié)構(gòu)中應(yīng)用3D打印技術(shù)的方法,同時提出以照片建模方式來簡化3D建模過程,以改善傳統(tǒng)手動建模時間長、難度大的不足,并通過機(jī)器學(xué)習(xí)及遺傳算法給出合理的建筑結(jié)構(gòu),盡可能的減少不合理的結(jié)構(gòu)設(shè)計。

1 圖像處理

3D打印所需的數(shù)據(jù)通常是通過CAD等三維軟件制作生成,往往制作周期長、難度大,本文提出通過照片的方式建模。

1.1圖像去噪

與日常3D打印物體相比,建筑結(jié)構(gòu)的打印實體通常比較大,且圖像質(zhì)量無法保證,因此需對圖像進(jìn)行去噪處理。本文采用馬爾可夫去噪方法[3]:

1.將圖片轉(zhuǎn)換為灰度,便于簡化計算;

2.假設(shè)本圖片是理想圖片沒有噪點,而且有噪點的圖片噪點數(shù)量比較少,那么理想圖片和噪點圖片對應(yīng)像素間必然相關(guān);

3.我們同樣可以假設(shè)在一個小范圍內(nèi),每個像素同其周圍的像素間也必然存在聯(lián)系;

4.可以將他們之間的聯(lián)系用能量表示:

公式1-1

這里可以改變相鄰像素的位置,以期達(dá)到更好的效果

公式1-2

式中的m、n分別表示距離像素xi的距離。

1.2 圖像分割和輪廓提取

圖像分割可以看作是將有相似密度的像素群進(jìn)行分類的過程,同樣可以采用馬爾可夫方法[4]:

1.將圖像劃分為n個區(qū)域,使得同一區(qū)域的像素同其他區(qū)域像素相對獨立;

2.計算每個像素在這些區(qū)域的能量;

3.計算每個像素對應(yīng)區(qū)域:

公式1-3

其中如果考慮相鄰像素的影響,可以將加入公式中

公式1-4

公式中是對應(yīng)相鄰像素能量的變化閥值。

4.降溫并設(shè)置對應(yīng)閥值。

2 結(jié)構(gòu)建模

對于以上得到的輪廓信息,還不足以直接生成3D模型,因為該信息是在二維平面的,缺少深度信息。對于深度信息的恢復(fù),常見的方法有從明暗恢復(fù)形狀,從紋理恢復(fù)形狀,從陰影恢復(fù)形狀,利用多光源信息等。由于對于建筑結(jié)構(gòu),很多信息是已知的,所以可以直接從已知的知識中重建形狀。

2.1 3D重建

對于簡單的結(jié)構(gòu),比如立方體、圓柱體,可以根據(jù)立體幾何知識加以重建;對于復(fù)雜的結(jié)構(gòu),可以采用馬爾可夫隨機(jī)場確定相應(yīng)結(jié)構(gòu)[5]。

1.參數(shù)化每個超像素點的位置和方向信息;

2.發(fā)掘圖像特征和深度信息;

3.發(fā)掘連接結(jié)構(gòu)、共面結(jié)構(gòu)和共線結(jié)構(gòu);

4.采用機(jī)器學(xué)習(xí)技術(shù),利用以上知識恢復(fù)重建3D結(jié)構(gòu)。

實際操作中,對于不準(zhǔn)確的恢復(fù)可采用貝塞爾曲線加以修復(fù):

公式2-1

2.2 建筑構(gòu)造

對于建筑構(gòu)造,可以采用遺傳算法,給出合理的建筑結(jié)構(gòu),盡可能的減少不合理的結(jié)構(gòu)設(shè)計。以平屋面建筑構(gòu)造為例[6]:

1.初始化種群:立墻、女兒墻、變形縫、雨水口、煙囪、屋面檢修孔、屋面出入口、檐溝、挑檐等構(gòu)造;

2.適應(yīng)度計算:對構(gòu)造個體在不同位置及大小進(jìn)行適應(yīng)度計算;

3.選擇運算:選擇不同個體進(jìn)行遺傳操作;

4.交叉運算:以某一概率相互交換某兩個個體之間的部分染色體;

5.變異運算:對個體的某一個或某一些基因值按某一較小的概率進(jìn)行改變;

6.重復(fù)以上過程,直到得到可接受的結(jié)果。

3 探 討

圖像處理部分,圖像去噪本文采用了馬爾可夫去噪方法,針對不同圖像不同噪點強(qiáng)度,相鄰像素的選擇也不完全相同;圖像分割和輪廓提取,也同樣需要控制閥值和冷卻溫度來確保準(zhǔn)確度;結(jié)構(gòu)建模部分,機(jī)器學(xué)習(xí)實例的數(shù)量以及圖像與訓(xùn)練實例的相似度,對3D重建的準(zhǔn)確度影響很大;同時,遺傳算法中個體適應(yīng)度及變異運算也需要針對不同構(gòu)造加以修正。

由于機(jī)器學(xué)習(xí)技術(shù)的興起,也可以考慮將機(jī)器學(xué)習(xí)算法(比如卷積神經(jīng)網(wǎng)絡(luò))應(yīng)用于建模部分。比如訓(xùn)練二維圖像和3D結(jié)構(gòu)之間的關(guān)系,預(yù)測已知圖像的3D結(jié)構(gòu)。但這種方式目前訓(xùn)練樣本往往很大,訓(xùn)練速度慢,機(jī)器要求高。但其準(zhǔn)確性和智能性卻是其他算法無法比擬的。

因此,在實際建模過程中,每個環(huán)節(jié)都需要人工干預(yù),對錯誤和不足及時進(jìn)行修正;同時,這種建模方式的精度自然要低于純手動建模的方式,但效率要比純手動建模高很多。

4 結(jié) 語

本文介紹了3d打印在建筑結(jié)構(gòu)中的應(yīng)用,給出了一般的建模過程,并針對每個步驟給出了解決方案,同時也分析了照片建模的不足。相信隨著3D打印技術(shù)的進(jìn)步,必將推動建筑相關(guān)行業(yè)的發(fā)展與成熟。

[1] Huaiyu Wu. 3D printing: 3D creation via intelligent digitization. Beijing: Publishing House of Electronics Industry, 2014 (in Chinese) 吳懷宇. 3D打?。喝S智能數(shù)字化創(chuàng)造. 北京: 電子工業(yè)出版社, 2014

[2]The Third Industrial Revolution;The Digitisation of Manufacturing Will Transform the Way Goods are Made and Change the Politics of Jobs Too[J/OL].The Economist,2012.

[3]Z.Ghahramani.An introduction to Hidden Markov Models and Bayesian networks.International Journal of Pattern Recognition and Artificial Intelligence,15::9-42,2001.

[4]Tama?s Szira?nyi.Image Segmentation Using Markov Random Field Model in Fully Parallel Cellular Network Architectures.Real-Time Imaging 6, 195-211,2000.

[5]Ashutosh Saxena,Min Sun,Andrew Y. Ng.Learning 3-D Scene Structure from a Single Still Image. International Journal of Computer Vision (IJCV), Aug 2007.

[6]J. F. GONC?ALVES.A GENETIC ALGORITHM FOR THE RESOURCE CONSTRAINED

MULTI-PROJECT SCHEDULING PROBLEM.AT&T Labs Research Technical Report:TD- 668LM4.2006

姓名:宋全記

出生年月:1981年06月

性別:男

學(xué)歷:碩士

職稱:講師

工作單位及教學(xué)系:四川建筑職業(yè)技術(shù)學(xué)院 信息工程系

研究方向:計算機(jī)應(yīng)用

篇9

【關(guān)鍵詞】光學(xué)遙感觀測技術(shù);IDI保險;建筑高度;建筑陰影

1引言

建筑工程質(zhì)量潛在缺陷保險(InherentDefectsInsurance,以下簡稱IDI保險)是工程質(zhì)量類保險的一種,是承包建筑工程在竣工后的保險期限內(nèi),針對因勘察設(shè)計缺陷、施工缺陷或材料缺陷等竣工時尚未發(fā)現(xiàn)的潛在缺陷造成的建筑結(jié)構(gòu)、防水工程或其他約定項目出現(xiàn)影響安全或使用的物質(zhì)損失保險。我國于2005年引入IDI保險,先后在北京、上海等城市開展試點運行。目前,IDI保險在國內(nèi)處于推廣期,主要應(yīng)用于住宅項目。根據(jù)各試點城市制定的IDI保險實施細(xì)則,建筑結(jié)構(gòu)安全是IDI保險中風(fēng)險最大的一項,具體包括建筑整體或局部倒塌、地基不均勻沉降等[1]。因此,建筑物安全隱患排查、研究建筑基礎(chǔ)和主體結(jié)構(gòu)損壞的現(xiàn)象和機(jī)理,并實現(xiàn)快速準(zhǔn)確的風(fēng)險預(yù)測是IDI保險風(fēng)險管理的主要任務(wù)。當(dāng)前,IDI保險關(guān)于建筑物的監(jiān)測和風(fēng)險管理,主要依靠保險公司工作人員和第三方監(jiān)測機(jī)構(gòu)。隨著IDI保險的推廣以及投保項目數(shù)量和類型的增加,人工的監(jiān)測效率會大大降低[2]。所以需要一種技術(shù)手段,能夠?qū)δ繕?biāo)區(qū)內(nèi)所有建筑物進(jìn)行全覆蓋、長時間、連續(xù)和高精度的形變監(jiān)測與風(fēng)險分析,協(xié)助保險公司進(jìn)行風(fēng)險管理[3]。光學(xué)遙感觀測技術(shù)是一種監(jiān)測范圍廣、成本低、效率高,可以長期定點監(jiān)測的遙感觀測手段[4]。一方面,光學(xué)遙感觀測技術(shù)在建筑物識別、建筑物高度推算等方面都達(dá)到了較高的計算精度,可以對建筑物的主體結(jié)構(gòu)進(jìn)行大范圍、周期性的監(jiān)測;另一方面,對比多時相遙感數(shù)據(jù),可以掌握建筑的傾斜和沉降情況。光學(xué)遙感觀測技術(shù)在這兩方面的研究成果均可應(yīng)用于IDI保險行業(yè)的風(fēng)險評估,為IDI保險行業(yè)建立完善的建筑物風(fēng)險評估體系提供支持。

2光學(xué)遙感觀測技術(shù)在建筑高度計算方面應(yīng)用的研究概況

光學(xué)遙感觀測技術(shù)是遙感技術(shù)的一種,利用可見光、近紅外和短波紅外傳感器對地物進(jìn)行特定電磁譜段的成像觀測,獲取和分析被觀測對象的光學(xué)特征信息。近年來,光學(xué)成像、電子學(xué)與空間技術(shù)的飛速發(fā)展,高空間、高光譜和高時間分辨率遙感技術(shù)不斷取得突破,光學(xué)遙感觀測技術(shù)已成為目前對地觀測和空間信息觀測領(lǐng)域中應(yīng)用最為廣泛的技術(shù)手段[5]。在光學(xué)遙感觀測技術(shù)中,獲取建筑物高度的主要方法為陰影側(cè)高法,該方法根據(jù)遙感圖像中建筑陰影長度推算建筑高度,然后進(jìn)一步分析建筑變化。

2.1陰影測高法原理介紹

陰影與建筑物高度關(guān)系如圖1所示。其中,H為建筑物高度;L為陰影長度;α、β分別為衛(wèi)星和太陽的高度角;δ為太陽和衛(wèi)星方位角的交角。建筑物高度計算方法為:當(dāng)太陽和衛(wèi)星在建筑物兩側(cè)時,建筑物高度H的計算方法可簡化為[6]:陰影測高法首先在遙感圖像中識別和提取目標(biāo)建筑的陰影,然后根據(jù)陰影長度、衛(wèi)星方位角、太陽高度角計算建筑高度。該方法只需要單張高分辨率遙感影像就可建立建筑物與陰影的成像集合模型。常用的陰影側(cè)高法主要有分類法、邊緣檢測法、閾值法[7]。

2.2分類法

分類法首先對遙感圖像進(jìn)行分割,然后使用同質(zhì)像素組成大小不同的對象,最后根據(jù)對象的形狀、大小、紋理、空間關(guān)系等特征提取建筑物及其陰影。如田峰等[8]提出利用多尺度分割將遙感圖像分割成若干對象,結(jié)合光譜、形狀、形態(tài)學(xué)陰影指數(shù)等特征面向?qū)ο蠓诸?,相對?zhǔn)確提取出建筑物的陰影并計算陰影的長度,進(jìn)行城市建筑物高度估計。結(jié)果顯示,90%的估計結(jié)果絕對誤差小于1m。分類法是當(dāng)前應(yīng)用最廣泛的利用陰影計算建筑物高度的方法。該方法可以有效對遙感圖像進(jìn)行分割,準(zhǔn)確地提取建筑物和建筑陰影,具有較高的計算準(zhǔn)確度。近年來,隨著深度學(xué)習(xí)算法在圖像分割領(lǐng)域的快速發(fā)展,利用卷積神經(jīng)網(wǎng)絡(luò)模型對遙感圖像進(jìn)行特征提取、語義分割同樣取得了較好的效果。如徐昭洪等[9]提出利用改進(jìn)的U-net模型對建筑物區(qū)域進(jìn)行像素級分割,獲取其輪廓和尺寸信息,實驗結(jié)果表明改進(jìn)的U-net模型對遙感圖像中建筑物的分割提取具有更高的精度,且對建筑密集區(qū)的小間隔建筑物的區(qū)分能力更強(qiáng)。

2.3邊緣檢測法

邊緣檢測方法通過檢測遙感圖像中不同區(qū)域的邊界灰度變化實現(xiàn)區(qū)域分割。如張祚等[10]提出基于建筑陰影形成的原理,提出綜合利用邊緣密度和HSV(hue-saturation-value,色調(diào)-飽和度-明度模型)顏色模型識別GoogleEarth二維影像中的高層建筑陰影,利用在線計算太陽高度角的工具,快速完成建筑高度和陰影長度的估算。龍恩等[11]提出基于同名特征的思想,實現(xiàn)平頂直邊型建筑高度提取。在對同名直邊檢測與精確定位過程中,將其轉(zhuǎn)化為陰影邊界檢測,主要采用基于邊緣的圖像分割和專家知識相結(jié)合的建筑物陰影提取技術(shù)。邊緣檢測方法可以保留圖像重要的結(jié)構(gòu)信息,適合遮蔽少、房屋形體簡單且較為獨立的情況,當(dāng)影像空間分辨率不夠高、房屋類型多樣,或者樓房間相互遮擋時,會降低建筑物提取的精度,無法保證高精度的建筑物提取結(jié)果[12]

2.4閾值法

閾值分割是一種簡單有效的基于像素的圖像分割技術(shù),該方法根據(jù)每個像素點的特征值和閾值的大小關(guān)系,將像素點劃分為不同類別[13]。如XinHuang等[14,15]提出的形態(tài)學(xué)建筑指數(shù)(MBI)和形態(tài)學(xué)陰影指數(shù)(MSI)就是閾值分割方法中常用的特征依據(jù)。首先利用MBI和MSI構(gòu)建特征圖像,然后根據(jù)設(shè)定閾值將圖像劃分為建筑、陰影和其他地物,最后利用其他方法對目標(biāo)區(qū)域進(jìn)行細(xì)化處理。閾值法主要優(yōu)點在于實現(xiàn)簡單、運算效率高。但遙感圖像顏色復(fù)雜,包含圖像元素較多,要達(dá)到較高的圖像分割精度,需要在設(shè)計閾值計算方法時,結(jié)合圖像本身的顏色特征以及空間特征。

3其他應(yīng)用場景

隨著IDI保險行業(yè)的發(fā)展與推廣,其承保項目會從住宅項目逐漸擴(kuò)展到包括市政項目在內(nèi)的各類工程,例如,高速公路建造工程、地鐵建設(shè)工程、旅游區(qū)建設(shè)、橋梁、水壩等。光學(xué)遙感觀測技術(shù)憑借其長期大面積捕獲影像信息的優(yōu)勢可以在多個方面提供數(shù)據(jù)和技術(shù)支持。例如,高速公路建造工程中,選址期間可結(jié)合多期歷史遙感影像數(shù)據(jù)分析選址沿線的地址環(huán)境,以及發(fā)生自然災(zāi)害的可能性。同時,還可以對工程進(jìn)度進(jìn)行監(jiān)測。地鐵建設(shè)項目中,利用光學(xué)遙感觀測技術(shù)可以對沿線的地面沉降進(jìn)行監(jiān)測分析。旅游區(qū)建設(shè)中,可以利用該技術(shù)對地質(zhì)景觀元素特征進(jìn)行解譯以及進(jìn)行地質(zhì)景觀特征值的三維量測與統(tǒng)計。