畫像合成方法:mrf(markov random fields)
缺點:不能合成新的sketch patches,因為它是從training sketch patches 選出最好的乙個sketch patch,因此並不能很好地表達出目標的特徵,尤其是對於眼睛、嘴巴和其他細節。
優化問題為np-hard,bp(belief propagation)演算法也不能保證得到最優解。
提出方法:
mwf(markov weight fields),在mrf的基礎上,不是選出乙個代表性sketch patch,而是利用training sketch patches 合成乙個新的sketch patch。而且,可以將問題轉化為convex quadratic programming(凸二次優化問題,qp問題),使其可解。
cdm(cascade decomposition method),當qp問題規模很大時,不能用現有的演算法進行優化,因此提出了cdm方法,將大規模的qp問題分解為小規模的條件獨立的qp問題,每乙個小規模的qp問題都可以用現有的演算法優化,且可以平行計算。
sketch 一般有兩種:profile(輪廓) 和 shading,後者效果更佳。
發展:直接從training photos(沒有分塊)提取特徵,線性合成sketch
缺點:photo 和 sketch 為兩種類別的圖,難以建立合適的線性關係。
考慮非線性的關係,進行分塊。文獻閱讀003【精讀】
缺點:由於每個sketch patch都是獨立合成的(雖然有部分重疊),使其對於大規模的複雜的patches的合成效果明顯降低。
考慮大規模的結構,mrf:對target photo 分塊,對於每乙個patch,從training sketch patches選出最佳的sketch patch,使其後驗概率最大化。
缺點:如introduction所說,不是合成新的sketch patches,np-hard問題。
基於上面的mrf,先對臉部組成部分引入特定的形狀,然後用sift特徵來表示photo和sketch的每個patch。
該方法對光線的改變和姿勢的變換有很強的魯棒性,但是3的缺點還沒有解決。
本**的方法:mwf,針對3的缺點。
large scale qp problems在計算機視覺有著很重要的應用和研究地位,最常用的方法為:分解成小規模的子問題。本**提出基於馬爾可夫特點的cdm方法。
聯合概率:
ti表示test photo patch的向量l-vector(l=l²,l為 patch長和寬)
wi表示從training data提取出來的向量k-vector
pi表示從training photo patches提取出來的向量k-vector,
pi的元素,即pi,k表示第k個候選的patch:l-vector
(i, j) ∈ ξ 表示相鄰結點
o_i,k^j 表示i,j之間的第k個候選patch的重疊面積
i=1,...,n
k=1,...,k
對於φ,ti與σwi,kpi,k越接近,說明擬合越好,此時φ越接近1,符合邏輯。
對於ψ,是基於馬爾科夫性,僅考慮相鄰兩個結點(i,j)的相關性。
後驗概率:
最大化後驗概率,等價於最小化如下的損失函式:
即,式(2),(3)的指數部分的相反數。
將其轉化為qp問題(二次規劃):
v其實是個常量,可以忽略。我們可以加上約束條件:σ_k(wi,k)=1,wi,k>=0,即對wi歸一化。
這裡的a和b是對w歸一化約束的矩陣和向量。
對於(10)的目標函式,由於w的維度太大(變數達到19000),沒有合適的現成的優化演算法。因此我們提出cdm,對w降維(使問題規模縮小為單個wi)。
我們對引數進行劃分,
目標函式變成:
如何劃分呢?
i(p,q)表示p行q列,這裡就是要把相鄰結點分開,這樣,根據馬爾科夫性,wb內的結點相互獨立,就可以因子分解為wi(k-vector)。因此,目標函式可以分解為子問題:
wia是wi的相鄰結點(4個),qii,qia,hi,ai是q,h,a的分解因子。
演算法:
step1 , step2可以並行執行,實驗結果發現一般10次以內就會收斂。
初步:patch size = 20x20
用mwf方法合成sketch 即按algorithm1擬合出w。
優化:patch size = 10x10
k=10
文獻精讀模式
都說引言很重要,精讀文獻並不是全部照著翻譯,重要的是要將邏輯關係理順。包括 背景,問題,解決思路,也可以分開單獨做小標題。2 背景 co氧化和水汽變換的反應活性位點的確立非常困難 其實是包含在引言當中的,分析時可以單獨拿出來 3 的思路 a 確定活性位點的前提是要得到純淨的包含反應活性位點的樣品。本...
研究生如何精讀文獻
這是我參考自己老師給的一些建議和網上的一些帖子整理的乙個記精讀的文獻筆記的大概框架,包括先看哪部分後看哪部分,看到時候要注意什麼,總結的時候要總結哪幾個點,給出了乙個精讀文獻的思路。markdown版放在這裡,可以直接拿來往裡填自己的內容 結果 資料 是整個 的核心 結果部分說明的原理 關係和普適意...
如何閱讀文獻
文獻分類 文章全名 作者 刊物縮寫 出版年給文章命名,用多級目錄分類對文章進行分類,文獻累計到一定程式就分類採用硬拷貝的方式進行集中整理。當一篇文章涉及多個主題的時候,多級目錄分類就不太靈光了,我目前的做法是部分兩邊都放 部分只放最重要的主題。將我的博士 分成6個小方向。然後將資料分成6個部分。每個...