1)、尺度空間的生成;
2)、檢測尺度空間極值點;
3)、精確定位極值點;

4)、為每個關(guān)鍵點指定方向參數(shù);
5)、關(guān)鍵點描述子的生成。 L(x,y,σ), σ= 1.6 a good tradeoff D(x,y,σ), σ=1.6 a good tradeoff 關(guān)于尺度空間的理解說明:圖中的2是必須的,尺度空間是連續(xù)的。在Lowe的論文中,將第0層的初始尺度定為1.6,圖片的初始尺度定為0.5.在檢測極值點前對原始圖像的高斯 平滑以致圖像丟失高頻信息,所以 Lowe建議在建立尺度空間前首先對原始圖像長寬擴展一倍,以保留原始圖像信息,增加特征點數(shù)量。尺度越大圖像越模糊。 nextoctave 是由 first octav————e 降采樣得到(如2) , 尺度空間的所有取值,s為每組層數(shù),一般為3~5 同一組中的相鄰尺度(由于k的取值關(guān)系,肯定是上下層)之間進行尋找在極值比較的過程中,每一組圖像的首末兩層是無法進行極值比較的,為了滿足尺度變化的連續(xù)性,我們在每一組圖像的頂層繼續(xù)用高斯模糊生成了3幅圖像,高斯金字塔有每組S+3層圖像。DOG金字塔每組有S+2層圖像. If ratio > (r+1)2/(r), throw it out(SIFT uses r=10)表示DOG金字塔中某一尺度的圖像x方向求導兩次通過擬和三維二次函數(shù)以精確確定關(guān)鍵點的位置和尺度(達到亞像素精度)? 直方圖中的峰值就是主方向,其他的達到最大值80%的方向可作為輔助方向 Identify peak and assign orientationand sum of magnitude to key point The user may choose a threshold toexclude key points based on theirassigned sum of magnitudes.利用關(guān)鍵點鄰域像素的梯度方向分布特性為每個關(guān)鍵點指定方向參數(shù),使算子具備旋轉(zhuǎn)不變性。以關(guān)鍵點為中心的鄰域窗口內(nèi)采樣,并用直方圖統(tǒng)計鄰域像素的梯度方向。梯度直方圖的范圍是0~360度,其中每10度一個柱,總共36個柱。隨著距中心點越遠的領(lǐng)域其對直方圖的貢獻也響應(yīng)減小.Lowe論文中還提到要使用高斯函數(shù)對直方圖進行平滑,減少突變的影響。關(guān)鍵點描述子的生成步驟 通過對關(guān)鍵點周圍圖像區(qū)域分塊,計算塊內(nèi)梯度直方圖,生成具有獨特性的向量,這個向量是該區(qū)域圖像信息的一種抽象,具有唯一性。每一個小格都代表了特征點鄰域所在的尺度空間的一個像素,箭頭方向代表了像素梯度方向,箭頭長度代表該像素的幅值。然后在4×4的窗口內(nèi)計算8個方向的梯度方向直方圖。繪制每個梯度方向的累加可形成一個種子點。每個直方圖有8方向的梯度方向,每一個描述符包含一個位于關(guān)鍵點附近的四個直方圖數(shù)組.這就導致了SIFT的特征向量有128維.(先是一個4×4的來計算出一個直方圖,每個直方圖有8個方向。所以是4×4×8=128維)將這個向量歸一化之后,就進一步去除了光照的影響。 旋轉(zhuǎn)為主方向 基本概念及一些補充什么是局部特征? •局部特征從總體上說是圖像或在視覺領(lǐng)域中一些有別于其周圍的地方 •局部特征通常是描述一塊區(qū)域,使其能具有高可區(qū)分度 •局部特征的好壞直接會決定著后面分類、識別是否會得到一個好的結(jié)果局部特征需具備的特性 •重復性 •可區(qū)分性 •準確性 •數(shù)量以及效率 •不變性局部特征提取算法-sift •SIFT算法由D.G.Lowe1999年提出,2004年完善總結(jié)。后來Y.Ke將其描述子部分用PCA代替直方圖的方式,對其進行改進。 •SIFT算法是一種提取局部特征的算法,在尺度空間尋找極值點,提取位置,尺度,旋轉(zhuǎn)不變量 •SIFT特征是圖像的局部特征,其對旋轉(zhuǎn)、尺度縮放、亮度變化保持不變性,對視角變化、仿射變換、噪聲也保持一定程度的穩(wěn)定性?! ?#8226;獨特性好,信息量豐富,適用于在海量特征數(shù)據(jù)庫中進行快速、準確的匹配?! ?#8226;多量性,即使少數(shù)的幾個物體也可以產(chǎn)生大量SIFT特征向量?! ?#8226;可擴展性,可以很方便的與其他形式的特征向量進行聯(lián)合。尺度空間理論 •尺度空間理論目的是模擬圖像數(shù)據(jù)的多尺度特征 •其基本思想是在視覺信息圖像信息處理模型中引入一個被視為尺度的參數(shù), 通過連續(xù)變化尺度參數(shù)獲得不同尺度下的視覺處理信息,然后綜合這些信息以深入地挖掘圖像的本質(zhì)特征。描述子生成的細節(jié) •以極值點為中心點,并且以此點所處于的高斯尺度sigma值作為半徑因子。對于遠離中心點的梯度值降低對其所處區(qū)域的直方圖的貢獻,防止一些突變的影響?! ?#8226;每個極值點對其進行三線性插值,這樣可以把此極值點的貢獻均衡的分到直方圖中相鄰的柱子上歸一化處理 •在求出4*4*8的128維特征向量后,此時SIFT特征向量已經(jīng)去除了尺度變化、旋轉(zhuǎn)等幾何變形因素的影響。而圖像的對比度變化相當于每個像素點乘上一個因子,光照變化是每個像素點加上一個值,但這些對圖像歸一化的梯度沒有影響。因此將特征向量的長度歸一化,則可以進一步去除光照變化的影響?! ?#8226;對于一些非線性的光照變化,SIFT并不具備不變性,但由于這類變化影響的主要是梯度的幅值變化,對梯度的方向影響較小,因此作者通過限制梯度幅值的值來減少這類變化造成的影響。PCA-SIFT算法 •PCA-SIFT與標準SIFT有相同的亞像素位置,尺度和主方向。但在第4步計算描述子的設(shè)計,采用的主成分分析的技術(shù)。 •下面介紹一下其特征描述子計算的部分: •用特征點周圍的41×41的像斑計算它的主元,并用PCA-SIFT將原來的2×39×39維的向量降成20維,以達到更精確的表示方式?! ?#8226;它的主要步驟為,對每一個關(guān)鍵點:在關(guān)鍵點周圍提取一個41×41的像斑于給定的尺度,旋轉(zhuǎn)到它的主方向;計算39×39水平和垂直的梯度,形成一個大小為3042的矢量;用預先計算好的投影矩陣n×3042與此矢量相乘;這樣生成一個大小為n的PCA-SIFT描述子。
愛華網(wǎng)


