目前由FindAllFace找出一集中所有shot的featrure(跑一次好像要13小時~"~)
以及找出每個shot中代表臉/最對稱臉的cloth feature
由於直接對所有shot做K means效果好像沒那麼好
所以採取"先分類再K means"的方式
並打算以cloth feature作為輔助
目前都先以12/01的<康熙來了>前500個shot做測試
第一種分類方式是由face的scale來分成三群(<25,>25,no face/too many faces)
但是結果並沒有很好,而且有可能造成相同鏡頭但是臉scale有差的被分到不同群
總之結果沒有想像中的好
第二種分類方式是由face的數量來分成三群(1,2,0/>3)
第一群的結果一直都沒有很好,僅僅在k=17~20之間會得到"還可以接受"的結果(至少都有兩cluster會發生錯誤),猜測是因為有很多只抓到一張臉的情況實際上都不只一張
第二群的結果還不錯,k=5,6,9,10都可以得到不錯的結果(一個左右的cluster錯誤),但k>=9會發生單個cluster內容是差不多shot沒錯,但可能出現有兩個cluster的shot其實是應該擺在一起的狀況
本來要用衣服做輔助,將衣服feature接在shot feature後面再跑K_means
但是在第一種分類方式,臉數不同會造成freature長度不相同,所以沒辦法
第二種分類方式仍不確定
昨天有想到個想法是說,把現在"以shot為單位"的做法
改成"以face為單位",就是feature = shot feature + face feature + cloth feature
然後有detect到的face全部去做K_means
相同shot的話shot feature會相同,所以理論上會被分在一起
但是相同shot中不同人,也會因face feature + cloth feature而有影響力
不知道可行度如何,待實驗
應該要再想想跟實驗看看吧...
還有要想跨年要去哪邊 :)
沒有留言:
張貼留言