當前位置: 首頁 > 新聞資訊 > 行業(yè)資訊

攝影測量與深度學習之間會產(chǎn)生怎樣的”火花“

發(fā)布日期:2019-07-04 00:00 瀏覽量:10989

攝影測量學的誕生與深度學習的起源

攝影測量學是一門“利用光學像片研究被攝物體的形狀、位置、大小、特性及相互位置關(guān)系”的學科。攝影測量誕生于19世紀早期。1838年,物理學家惠斯頓發(fā)明了實體鏡,第一次發(fā)現(xiàn)和定義了立體視覺。1839年,法國畫家達蓋爾發(fā)明了銀版攝影法,并制作了世界上第一臺真正的照相機。在此基礎(chǔ)上,法國測量學家Fourcade首先發(fā)現(xiàn)了用立體照片可重建立體視覺,從而促成了攝影測量學的誕生。攝影測量的第一個也是最重要的分支是航空攝影測量。

 

深度學習起源于20世紀中葉的人工智能。人工智能的兩個主要流派分別是符號主義(symbolism)和聯(lián)結(jié)主義(connectionism)。其中,符號主義者在1956年首次提出“人工智能”的概念,并統(tǒng)治了該領(lǐng)域近半個世紀;基于統(tǒng)計學習的思想被廣泛應用于機器學習、計算機視覺,以及攝影測量與遙感。

 

攝影測量與深度學習及計算機視覺的聯(lián)系

深度學習的最重要應用是在視覺圖像上,如手寫字體識別、自然圖像分類和檢索等。而攝影測量的研究對象就是視覺圖像,因此深度學習的成功和蓬勃發(fā)展,使得攝影測量也成為最受益的學科之一。

 

在語義上,攝影測量中的研究內(nèi)容就是采用智能方法為各行業(yè)提供專題圖。攝影測量的應用特性使得它并不關(guān)心諸如特征描述、上下文關(guān)系等中間結(jié)果。這種端到端的模式(end-to-end )特別適用深度學習方法。目前,深度學習已經(jīng)被廣泛用于遙感圖像的分類、識別、檢索和提取。與在幾何方面的欠佳表現(xiàn)不同,在語義上基本全面碾壓了傳統(tǒng)的方法。

 

1982年,Marr發(fā)表《視覺:從計算的視角研究人的視覺信息表達與處理》,是計算機視覺的開山之作。計算機視覺的最初研究:用計算機代替人眼,從圖片中重建3D世界。與攝影測量在幾何方面具有很高的重疊度。20世紀90年代,在語義方面計算機視覺開始蓬勃開展。其中運用了大量的機器學習知識。有學者分析指出機器學習與計算機視覺重疊度約在60%~70%,因此是非常緊密的兩門學科。

 

隨著深度學習成為機器學習的主流,深度學習在計算機視覺中得到廣泛應用。將深度學習引入到攝影測量中,特別是提高攝影測量后期語義處理的智能水平,是科學研究發(fā)展的必然途徑。

 

深度學習在攝影測量語義方面的應用

深度學習在遙感圖像語義提取方面的應用剛剛起步并逐漸普及。以下將從各類地物語義專題圖出發(fā),回顧深度學習的具體應用。

遙感圖像建筑、道路網(wǎng)等地物的提取一直是數(shù)十年來的熱門課題。雖然經(jīng)典方法取得一定的效果,但距離實用、市場、商業(yè)軟件尚有一定的距離。CNN目前正成為道路網(wǎng)提取的主流方法。通過級聯(lián)式端到端CNN同時實現(xiàn)了道路網(wǎng)提取及道路中心線提取,與其他方法比較,達到了更高的分類精度。通過CNN結(jié)合線積分卷積克服了樹木遮蔽、房屋陰影所造成的道路網(wǎng)殘缺問題。通過非監(jiān)督學習預處理和空間相關(guān)性的應用,利用深度學習極大地提高了復雜城市場景的道路提取精度。均為使用深度學習的方法進行道路提取并取得了良好的效果。

 

建筑物、農(nóng)作物、水體等專題的提取相對道路而言較少,但預期會有許多相關(guān)文獻近期發(fā)表。采用CNN實現(xiàn)高分辨率多光譜衛(wèi)星影像的建筑物提取。

首先采用AlexNet提取特征,最后的全連接層用于訓練SVM分類器并采用MRF模型精化。作物精細分類是攝影測量與遙感在農(nóng)業(yè)中的重要應用。在影像平面上進行2D卷積,在光譜方向上進行1D卷積,分別提取出影像空間特征和光譜特征,取得了比隨機森林和全連接MLP更好的作物分類精度。

為了從本質(zhì)上解決該問題,需要考慮兩點。

 

第一點是恰當?shù)倪w移學習方法。目前ImageNet等龐大的數(shù)據(jù)庫來自大眾攝影圖像,并不包括鳥瞰航攝圖像和衛(wèi)星遙感圖像。照片的標注諸如人、大象或椅子;遙感圖像中的標注諸如耕地、建筑、森林等。若直接將這些數(shù)據(jù)庫訓練得到的模型,用來進行遙感圖像直接分類,就要考慮遷移學習。遷移學習是將A數(shù)據(jù)集中訓練好的模型,應用在B數(shù)據(jù)集上。A與B可能是同源的,也可能存在巨大差異。這就要進一步發(fā)掘完善的遷移學習機制。

 

第二點是建立針對遙感圖像的開源的、完備的標簽數(shù)據(jù)庫。涵蓋足夠多的地物類別,每個類別包括足夠多的樣本。這樣的數(shù)據(jù)庫是攝影測量與遙感走向“自動化專題制圖”的必經(jīng)之路。然而,實現(xiàn)難度要比千萬圖像級別的ImageNet更大。首先,由于遠距成像的特性,圖像受到更多電磁輻射傳輸?shù)挠绊憽=?jīng)過大氣傳播的電磁輻射與地物間的相互作用機理更加復雜,同一標簽的樣本往往呈現(xiàn)明顯的差異。這種差異不但對樣本的選取造成不便,而且對深度學習模型的可區(qū)分性提出更大的挑戰(zhàn)。

 

第二,眾包模式并不能完全起作用。普通人可能很好地辨認出的區(qū)別,因此通過互聯(lián)網(wǎng)眾包能夠快速構(gòu)建一個巨大的標注數(shù)據(jù)庫;但是,小麥和水稻在遙感圖像上的差異,則需要專業(yè)人員的目視判讀。若影像分辨率較低,甚至可能需要實地調(diào)查。

 

第三,攝影測量與遙感界的科研模式尚需向開源發(fā)展。目前,遙感學界已經(jīng)開始走向開源模式,希望由公司、政府或科研機構(gòu)能夠在短期內(nèi)建立的針對遙感圖像分類的標簽數(shù)據(jù)庫,并實現(xiàn)完全開源。有了足夠的數(shù)據(jù)標簽庫或恰當?shù)倪w移學習方法,并借助深度學習的泛化能力,可以預期未來攝影測量與遙感專題制圖的精度將比傳統(tǒng)的特征分類方法得到明顯的改進。

 

文章來源于網(wǎng)絡,由飛燕遙感rczjd.cn編輯。登載此文出于傳遞更多信息之目的,版權(quán)歸原作者及刊載媒體所有,如本文中圖片或文字侵犯您的權(quán)益,請聯(lián)系我們。

 

猜你喜歡:

測繪4D產(chǎn)品中 DLG 數(shù)據(jù)是如何生產(chǎn)的?

激光LIDAR 航測技術(shù)應用在河道測繪


飛燕微信公眾號.jpg


猜你喜歡

相關(guān)設備
推薦服務
相關(guān)案例
新聞資訊

聯(lián)系方式

電話:025-83216189

郵箱:[email protected]

地址:江蘇省南京市玄武區(qū)紅山街道領(lǐng)智路56
號星河World產(chǎn)業(yè)園3號樓北8樓

微信公眾號

總經(jīng)理微信

025-83216189