視覺是人類強(qiáng)大的感知方式,它為人們提供了大量的關(guān)于周圍環(huán)境的信息,使人們能夠與周圍環(huán)境進(jìn)行有效的交互。據(jù)統(tǒng)計(jì),80%以上的人類從外部接收到的信息是通過視覺獲得的,50%的人類大腦皮層參與到視覺功能運(yùn)行中。
視覺對(duì)大多數(shù)動(dòng)物來說具有至關(guān)重要的意義。李飛飛是一位的計(jì)算機(jī)視覺學(xué)者,他描述了基本的動(dòng)物眼睛、視力和視力。在寒武紀(jì)生命大爆發(fā)之前,地球上的生物物種很少,都生活在水中,被動(dòng)獲得食物。在寒武紀(jì)生命大爆發(fā)階段,新的物種突然增加,生物物種在短短的1000萬年內(nèi)增加了數(shù)十萬次。寒武紀(jì)生命大爆發(fā)的原因至今尚不被認(rèn)可,但其中一個(gè)觀點(diǎn)是,這與視覺有很大關(guān)系。牛津大學(xué)生物學(xué)家安德帕克發(fā)現(xiàn),三葉蟲在5.4億年前通過研究生物化石(如下圖所示)進(jìn)化了眼睛。隨著捕食者和捕食者之間復(fù)雜行為的進(jìn)化,動(dòng)物在有了視覺后可以看到食物,然后開始主動(dòng)捕食,這使得動(dòng)物種類不斷增加。因此,許多科學(xué)家認(rèn)為,生命大爆發(fā)始于動(dòng)物獲得視覺后的生存過程,這在生物進(jìn)化過程中非常重要。
有許多有趣的視覺發(fā)現(xiàn),例如螳螂蝦的眼睛可以探測(cè)到偏振光。人類的眼睛和普通的攝像頭只能感受到光的強(qiáng)度信息,而不能探測(cè)到光的偏振信息。澳大利亞昆士蘭大學(xué)的研究人員發(fā)現(xiàn),螳螂蝦的復(fù)眼可以探測(cè)到偏振光。根據(jù)生物醫(yī)學(xué)和光學(xué)的理論知識(shí),生物組織的特征與偏振信息有關(guān),因此螳螂蝦的眼睛是因此,螳螂蝦的眼睛可以診斷出生物組織的病變。青蛙的眼睛只能看到動(dòng)態(tài)場(chǎng)景,狗對(duì)顏色信息的分辨率很低。
那生物視覺功能介紹后,什么是機(jī)器視覺呢?
機(jī)器視覺是機(jī)器(通常指的是數(shù)字計(jì)算機(jī))對(duì)圖像進(jìn)行自動(dòng)化處理并上報(bào)圖像是什么的過程,也就是來識(shí)別圖像中的內(nèi)容,如自動(dòng)識(shí)別目標(biāo)。
機(jī)器視覺覺傳感器、高速圖像采集系統(tǒng)視覺傳感器、高速圖像采集系統(tǒng)和特殊圖像處理系統(tǒng)等組成。
根據(jù)大衛(wèi)A.Forth和JeanPonce的定義,計(jì)算機(jī)視覺是一種借助幾何圖形、物理學(xué)和學(xué)習(xí)理論來建立模型的工作,從而利用統(tǒng)計(jì)學(xué)的方法來處理數(shù)據(jù)。它是指通過對(duì)每個(gè)像素值進(jìn)行簡單的推理,在徹底了解相機(jī)性能和物理成像過程的基礎(chǔ)上,將圖像中可能獲得的多幅信息綜合成一個(gè)相互關(guān)聯(lián)的整體,確定像素之間的聯(lián)系,以便相互分離,或者推斷出一些形狀信息,然后使用幾何信息或概率統(tǒng)計(jì)來識(shí)別物體。
考慮到系統(tǒng)的輸入和輸出模式,機(jī)器視覺系統(tǒng)的輸入是一個(gè)圖像或圖像序列,輸出是一個(gè)描述。此外,機(jī)器視覺由兩部分組成:基于這些特征的特征測(cè)量和模式識(shí)別。
機(jī)器視覺和圖像處理是有區(qū)別的。圖像處理的目的是使圖像處理后變好,圖像處理系統(tǒng)的輸出仍是圖像,機(jī)器視覺系統(tǒng)的輸出是與圖像內(nèi)容相關(guān)的信息。圖像處理可分為低級(jí)圖像處理、中級(jí)圖像處理和圖像處理,處理內(nèi)容包括圖像增強(qiáng)、圖像編碼、圖像壓縮、圖像恢復(fù)和重建等。
01
發(fā)展機(jī)器視覺。
為機(jī)器視覺從70年代到現(xiàn)在開始發(fā)展過程中的一部分主題,包括機(jī)器視覺發(fā)展初期(70年代)的數(shù)像處理和積木世界、80年代的卡爾曼濾波、正則化、90年代的圖像分割、基于統(tǒng)計(jì)的圖像處理、21世紀(jì)計(jì)算攝像和機(jī)器視覺中的深度學(xué)習(xí)等。
1.70年代,20世紀(jì)。
機(jī)器視覺始于20世紀(jì)70年代初,被認(rèn)為是人類智能模擬和賦予機(jī)器人智能行為的感知組成部分。當(dāng)時(shí),人工智能和機(jī)器人的一些早期研究人員(如麻省理工大學(xué)、斯坦福大學(xué)、卡內(nèi)基·梅隆大學(xué))認(rèn)為,解決視覺輸入問題應(yīng)該是解決高層推理、規(guī)劃等更難的問題的過程中的一個(gè)簡單步驟。比如,1966年,麻省理工大學(xué)的馬路米信讓他的本科生Geraldjaysssman在暑假期間將相機(jī)連接到電腦上,讓電腦描述他所看到的東西?,F(xiàn)在,大家都知道,這些看似簡單的問題其實(shí)并不好解決。
數(shù)像處理出現(xiàn)在20世紀(jì)60年代年代。與現(xiàn)有的數(shù)字圖像處理領(lǐng)域不同,機(jī)器視覺預(yù)期可以從圖像中恢復(fù)實(shí)物的三維結(jié)構(gòu),從而獲得完整的場(chǎng)景理解。早期的場(chǎng)景理解嘗試包括從二維線條的拓?fù)浣Y(jié)構(gòu)中提取物體(即積木世界)的邊緣,并推斷其三維結(jié)構(gòu)。當(dāng)時(shí),一些學(xué)者提出了一些線條標(biāo)記算法,此外,邊緣檢測(cè)也是一個(gè)活躍的研究領(lǐng)域。
上世紀(jì)70年代,人們還研究了物體的三維建模。Barrow,Tenenbaum和Marrr提出了一種方法來理解陰影變化的方法,并通過表面朝向和陰影來恢復(fù)三維結(jié)構(gòu)。當(dāng)時(shí),還有一些更定量的機(jī)器視覺方法,包括基于特征的三維視覺對(duì)應(yīng)算法和基于亮度的光流(OPTicalflow)算法,同時(shí)也開始研究恢復(fù)三維結(jié)構(gòu)和相機(jī)運(yùn)動(dòng)的工作。
此外,DavidMarr針對(duì)(視覺)信息處理系統(tǒng)avidMarr還特別介紹:
1)計(jì)算理論:計(jì)算(任務(wù))的目的是什么?有哪些約束是針對(duì)這個(gè)問題已知或可以施加的?
2)表達(dá)式和算法:如何表達(dá)輸入、輸出和中間信息?計(jì)算預(yù)期結(jié)果的算法是什么?
3)硬件實(shí)現(xiàn):如何將表達(dá)式和算法映射到實(shí)際的硬件上,即生物視覺系統(tǒng)或特殊的硅膠片上?相反,如何使用硬件的限制來指導(dǎo)表達(dá)式和算法的選擇?這個(gè)問題再次變得非常重要,因?yàn)橛?jì)算能力的需求日益增長。
2.80年代,20世紀(jì)。
20世紀(jì)80年代,圖像金字塔和尺度空間在20世紀(jì)80年代末開始被廣泛用于從粗到精的相應(yīng)點(diǎn)搜索,圖像金字塔開始被一些中小波變換所取代。
從X到形狀的方法出現(xiàn)在三維視覺重建中,包括從陰影到形狀,從光度三維視覺到形狀,從紋理到形狀,從焦點(diǎn)到形狀。在此期間,探索更準(zhǔn)確的邊緣和輪廓檢測(cè)方法是一個(gè)活躍的研究領(lǐng)域,包括Snake模型等動(dòng)態(tài)演變輪廓跟蹤器的引入。如果將X到形狀和邊緣檢測(cè)算法作為一個(gè)可變分?jǐn)?shù)優(yōu)化問題來處理立體視覺和光流,則可以用相同的數(shù)學(xué)框架來統(tǒng)一描述,并且可以使用正則化的方法來增加魯棒性。此外,卡爾曼濾波器和三維數(shù)據(jù)處理20世紀(jì)90年代仍然是一個(gè)非常活躍的研究領(lǐng)域。
三、九十年代,二十世紀(jì)。
視覺的發(fā)展?fàn)顩r在20世紀(jì)90年代如下:
1)關(guān)于使用投影不變量進(jìn)行識(shí)別的研究顯示出爆炸性增長。這種方法可以有效地用于從移動(dòng)到結(jié)構(gòu)的問題。初,許多研究研究表明,投影重建問題不需要相機(jī)校準(zhǔn)結(jié)果。與此同時(shí),一些人提出了一種利用因素分解方法有效地解決近似正交投影問題的方法。后來,這種方法擴(kuò)展到視覺投影的情況。這一領(lǐng)域開始采用全球優(yōu)化法,后來被認(rèn)為與攝影測(cè)量中常用的光束平差法有關(guān)。
2)精細(xì)測(cè)量使用顏色和亮度,并將其與物理模型結(jié)合起來,這些模型具有準(zhǔn)確的輻射傳遞和形成彩色圖像。這項(xiàng)工作始于20世紀(jì)80年代,構(gòu)成了一個(gè)子領(lǐng)域,稱為基于物理的視覺。
3)不斷改進(jìn)光流方法。
四、與算法相對(duì)應(yīng)的稠立體視覺也取得了許多進(jìn)展。
聯(lián)系電話:150-2003-5767
企業(yè)郵箱:qdhaoke@163.com
公司地址:青島城陽區(qū)春陽路119號(hào)國家
質(zhì)量基礎(chǔ)設(shè)施基地1號(hào)樓1007