AR技術(shù)概述
顧名思義,增強(qiáng)現(xiàn)實(shí)是對(duì)現(xiàn)實(shí)的增強(qiáng)。從廣義上講,增強(qiáng)現(xiàn)實(shí)已經(jīng)涵蓋了生活的各個(gè)方面,比如樹(shù)干LED燈,創(chuàng)造藝術(shù)效果;例如,在鬼屋里放一些聲源,營(yíng)造一種可怕的氛圍;甚至噴香水,都是為了增強(qiáng)現(xiàn)實(shí),增強(qiáng)視覺(jué)、聽(tīng)覺(jué)、嗅覺(jué)等感官感覺(jué),當(dāng)然,這些都是為了增強(qiáng)現(xiàn)實(shí),似乎沒(méi)有那么科技的感覺(jué)。
一般來(lái)說(shuō),增強(qiáng)現(xiàn)實(shí)是指通過(guò)屏幕或投影設(shè)備顯示虛擬內(nèi)容的視覺(jué)增強(qiáng)。例如,手機(jī)相機(jī)預(yù)覽中常見(jiàn)的顯示3D動(dòng)畫(huà)(如QQ傳火炬),微軟HoloLens,Google的Tango,還有Magic Leap等等。
總體上看,AR技術(shù)的關(guān)鍵在于設(shè)備對(duì)周圍環(huán)境的感知和理解:最基本的是確定設(shè)備本身的空間位置;更先進(jìn)的是實(shí)時(shí)重建環(huán)境(SLAM);更先進(jìn)的是識(shí)別、認(rèn)知和交互。在這方面,定位是最基本的。只有準(zhǔn)確確定設(shè)備本身的位置(和方向),虛擬內(nèi)容才能與現(xiàn)實(shí)很好地結(jié)合起來(lái),以達(dá)到足夠的現(xiàn)實(shí)感,過(guò)程需要實(shí)時(shí)進(jìn)行。這也是VR關(guān)鍵技術(shù)之一。
目前用于移動(dòng)設(shè)備的AR主要有兩類:基于圖片標(biāo)記的AR和基于IMU的AR,
QQ基于圖片標(biāo)記的傳火炬是典型的AR,用手機(jī)拍攝特定圖像(另一個(gè)用戶手機(jī)上顯示的火炬圖片),在預(yù)覽圖片中疊加3D動(dòng)畫(huà)效果,移動(dòng)或旋轉(zhuǎn)手機(jī),3D動(dòng)畫(huà)始終與火炬圖片保持固定的位置關(guān)系,從而增強(qiáng)現(xiàn)實(shí)體驗(yàn)。Pokemon Go則是基于IMU AR典型的是通過(guò)設(shè)備本身的陀螺儀、加速度計(jì)等傳感器數(shù)據(jù)進(jìn)行定位,通過(guò)陀螺儀可以測(cè)量設(shè)備旋轉(zhuǎn),通過(guò)加速度計(jì)可以測(cè)量位移?;贗MU的AR實(shí)現(xiàn)相對(duì)簡(jiǎn)單,但精度低,drift嚴(yán)重(累積誤差越來(lái)越大),適用場(chǎng)景有限。
本系列文章主要討論基于平面圖記的文章AR技術(shù)實(shí)現(xiàn)可分為兩類:Marker和Markerless,兩者的區(qū)別主要在于圖片標(biāo)記是否規(guī)則:
Marker:通常是黑白方格按一定編碼的圖片;Markerless:普通圖片。與普通圖片相比,具體編碼Marker識(shí)別和跟蹤更簡(jiǎn)單,但應(yīng)用有限,所以現(xiàn)在主流AR應(yīng)用都是Markerless是的,識(shí)別一張普通的平面圖,然后在上面疊加3D內(nèi)容,如QQ傳火炬。
二、原理正如前面所說(shuō),AR關(guān)鍵在于設(shè)備本身的定位,基于圖片標(biāo)記AR,即通過(guò)相機(jī)拍攝已知圖片,根據(jù)圖片在相機(jī)圖片中的位置確定相機(jī)的空間位置,即設(shè)備的空間位置。下圖的主要過(guò)程包括拍攝圖像、圖像處理和更新虛擬內(nèi)容三個(gè)階段,其中圖像處理是核心。圖像處理完成后,獲得相機(jī)外參(Extrinsic,相機(jī)坐標(biāo)系與世界坐標(biāo)系的變換關(guān)系),然后應(yīng)用于預(yù)覽圖片的疊加層(如OpenGL或3D發(fā)動(dòng)機(jī)環(huán)境),更新虛擬內(nèi)容的位置,完成整個(gè)幀的處理過(guò)程,然后不斷重復(fù)這個(gè)過(guò)程,使虛擬內(nèi)容在設(shè)備移動(dòng)后始終顯示在正確的位置。
以圖像處理過(guò)程為核心,還包括一些子過(guò)程,如相機(jī)內(nèi)參標(biāo)定、預(yù)覽幀特征提取、匹配、相機(jī)外參標(biāo)定等。
1.相機(jī)內(nèi)參標(biāo)定
相機(jī)的成像過(guò)程可以看作是將空間點(diǎn)轉(zhuǎn)換到圖像點(diǎn)的過(guò)程。如果忽略了相機(jī)畸變的影響,整個(gè)轉(zhuǎn)換過(guò)程是線性的。相機(jī)中設(shè)定的參數(shù)的目標(biāo)是找到轉(zhuǎn)換參數(shù)(包括畸變),以便通過(guò)數(shù)學(xué)計(jì)算準(zhǔn)確地描述相機(jī)的成像過(guò)程。
不考慮鏡頭畸變,相機(jī)成像的變換模型可以表示如下:
A是相機(jī)的內(nèi)參矩陣,包括x、y方向焦距fx、fy和圖像中心cx、cy。空間點(diǎn)M首先通過(guò)相機(jī)外參[R|t]將坐標(biāo)系轉(zhuǎn)換為設(shè)備(相機(jī))(DCS),然后通過(guò)相機(jī)內(nèi)參A轉(zhuǎn)換到圖像坐標(biāo)系(ICS),成像在(u, v)處。確定相機(jī)內(nèi)參的過(guò)程為內(nèi)參標(biāo)定,內(nèi)參與相機(jī)的焦距、硬件工藝通常可以離線完成。內(nèi)部參考標(biāo)定常采用張正友棋盤(pán)格標(biāo)定法,操作簡(jiǎn)單,精度高:只需從不同角度拍攝同一棋盤(pán)格的圖片即可完成標(biāo)定。詳見(jiàn)此。
2.圖像特征提取與匹配
圖像特征點(diǎn)(Key Point)又稱興趣點(diǎn),可以認(rèn)為是圖像上具有特定特征的局部位置標(biāo)記和特征描述(Descriptor)表示該特征的特征量,可用于區(qū)分和匹配不同的特征點(diǎn)。良好的特征點(diǎn)應(yīng)具有以下特征:
重復(fù)性:在不同的條件下(如旋轉(zhuǎn)、尺度、光線),兩幅圖像中對(duì)應(yīng)的特征越多越好。獨(dú)特性:特征的振幅模式需要多樣性,才能區(qū)分和匹配。數(shù)量:一般來(lái)說(shuō),必須檢測(cè)到更多的特征,但在圖像檢索中,過(guò)多的特征會(huì)對(duì)檢索的實(shí)時(shí)性產(chǎn)生一定的影響。理想情況下,檢測(cè)到的特征數(shù)量在較大范圍內(nèi),然后可以通過(guò)簡(jiǎn)單的閾值進(jìn)行調(diào)整。準(zhǔn)確性:應(yīng)能夠準(zhǔn)確定位特征,包括圖像空間和尺度空間的準(zhǔn)確定位。效率:檢測(cè)和描述時(shí)間越短越好,以便后續(xù)實(shí)時(shí)應(yīng)用。旋轉(zhuǎn)不變性和尺度不變性是可重復(fù)性的關(guān)鍵,SIFT改進(jìn)算法SURF特征提取算法常用,F(xiàn)AST它以快速而聞名,適用于實(shí)時(shí)場(chǎng)景。詳情請(qǐng)參考本博客。
特征匹配是指在提取兩張圖的特征點(diǎn)后,根據(jù)特征點(diǎn)的描述子進(jìn)行匹配,并獲得匹配點(diǎn)對(duì)集,用于后續(xù)的單應(yīng)矩陣計(jì)算。特征匹配可以看作是一個(gè)分類過(guò)程,如簡(jiǎn)單的漢明距離匹配,或基于k近鄰算法通過(guò)比率測(cè)試減少錯(cuò)誤匹配。FLANN匹配開(kāi)源庫(kù)的常用特征。
3.相機(jī)外參標(biāo)定
相機(jī)外參標(biāo)定在上述相機(jī)成像公式中求取[R|t],在已知相機(jī)內(nèi)參的情況下,根據(jù)兩個(gè)圖像之間的特征點(diǎn),可以找到兩個(gè)圖像之間的空間位置關(guān)系(旋轉(zhuǎn)R和平移t),如果其中一個(gè)圖像是輸入的標(biāo)記圖像,則設(shè)置在世界坐標(biāo)原點(diǎn),則該過(guò)程在計(jì)算機(jī)視覺(jué)中PnP(Perspectire-n-Point)問(wèn)題,也可以看作是相機(jī)的外參標(biāo)定過(guò)程。這個(gè)問(wèn)題可以基于直接線性轉(zhuǎn)換DLT(Direct Linear Transfor ** tion)結(jié)合最小二乘法求解,也可以通過(guò)迭代方法根據(jù)初始值求解。這個(gè)問(wèn)題可以基于直接線性轉(zhuǎn)換DLT(Direct Linear Transfor ** tion)結(jié)合最小二乘法求解,也可以根據(jù)初始值通過(guò)迭代求解。外參標(biāo)定過(guò)程的重點(diǎn)是去除誤匹配,常用RANSAC本文可參考算法。
三、結(jié)語(yǔ)VR讓人體驗(yàn)不同的世界,AR它是為了讓現(xiàn)實(shí)世界更美好,有人把它帶走AR作為一個(gè)新的計(jì)算平臺(tái),這并不過(guò)分。想象一下,最早的尋呼機(jī)和功能機(jī)只提供一維通知、電話或短信服務(wù)。在智能機(jī)器時(shí)代,隨著大屏幕的出現(xiàn),二維圖像和音頻和視頻已經(jīng)成為主流。下一個(gè)時(shí)代可能是3D技術(shù)、AR它將是計(jì)算設(shè)備的核心能力之一。
上海西陸信息科技有限公司 承接各類微信小程序開(kāi)發(fā)制作、小程序定制、APP 網(wǎng)站 開(kāi)發(fā)制作,聯(lián)系電話 18221533805、15900430334
區(qū)塊鏈技術(shù)本身不是全新的技術(shù),那是什么技術(shù)呢?
海洋技術(shù)|聲納技術(shù)的發(fā)展道路
機(jī)械加工技術(shù),微型機(jī)械加工技術(shù)快速成形技術(shù)精密超精密加工技術(shù)
CHP 熱電聯(lián)產(chǎn)技術(shù)(CHP) 技術(shù)
技術(shù)方案溝通之技術(shù)要素的提取
什么是技術(shù)創(chuàng)新?什么又是技術(shù)?
揭秘3D打印技術(shù)之按需滴落技術(shù)(DOD技術(shù))
繼劉強(qiáng)東“技術(shù)技術(shù)技術(shù)”后首次打造跨部門(mén)項(xiàng)目 京東技術(shù)布局邁入變現(xiàn)階段
什么是技術(shù)貿(mào)易中的技術(shù)商品?
什么是信息技術(shù)?信息技術(shù)主要包括哪幾種技術(shù)?
非技術(shù)人看技術(shù)崗位選擇
補(bǔ)牙新技術(shù)--樹(shù)脂滲透技術(shù)
DSP系統(tǒng)技術(shù)架構(gòu)參考【技術(shù)類】
技術(shù)分析4:K線技術(shù)
海鮮粥培訓(xùn) 早點(diǎn)技術(shù) 包子技術(shù) 早餐早點(diǎn)技術(shù)培訓(xùn)
射頻技術(shù)秘籍 - 射頻技術(shù)升級(jí)
技術(shù)干貨|容器與虛擬化技術(shù)
揭秘3D打印技術(shù)之融化擠壓成型技術(shù)(MEM技術(shù))
華轉(zhuǎn)網(wǎng):技術(shù)入股、技術(shù)許可和技術(shù)轉(zhuǎn)讓有什么區(qū)別?
本田EDT技術(shù) 地球夢(mèng)想技術(shù)淺釋
聯(lián)系我們