2009年1月19日 星期一

2009年1月17日 星期六

[報告]大綱

Cast Indexing for Talk Show Videos by Face, Cloth, and Background
0.Abstract
1.Introduction
2.Video & Frame Processing (done)
    2-1.Shot Detection
    2-2.Face Detection
    2-3.Key Frame/Face Selection
3.Features (done)
    3-1.Face Feature
    3-2.Cloth Feature
    3-3.Background Feature
4.Clustering (done)
5.Experimental Results
6.Conclusion
7.Reference

2008年12月31日 星期三

[進度]測資處理進度

11/20: face_info, face_desc, face_desc_reduce, cloth_desc, background_desc (done)
11/21: face_info, face_desc, face_desc_reduce, cloth_desc, background_desc (done)
11/27: 正在跑face_info(需要13 hrs)
12/01: face_info, face_desc, face_desc_reduce, cloth_desc, background_desc (done)
12/02: face_info, face_desc, face_desc_reduce, cloth_desc, background_desc (done)
12/03: face_info, face_desc, face_desc_reduce, cloth_desc, background_desc (done)

2008年12月29日 星期一

[進度] Clustering (Cont.)

以臉為單位

只分成"有1~2face"跟"沒有或太多face"兩群

對"有1~2face"這群做K_means

feature = shot + cloth

嘗試了k = 15~27

其中只有k = 20,25兩組結果不錯

其它都至少會有兩個以上cluster會有混雜的情形


然後大概看一下,很少有"兩個人的相同shot"被分在不同cluster的情形(還是有)

接著可能要把cloth feature換用face feature試試看?


2008的倒數第二天了...

2008年12月28日 星期日

[進度] Clustering

目前由FindAllFace找出一集中所有shot的featrure(跑一次好像要13小時~"~)

以及找出每個shot中代表臉/最對稱臉的cloth feature


由於直接對所有shot做K means效果好像沒那麼好

所以採取"先分類再K means"的方式

並打算以cloth feature作為輔助

目前都先以12/01的<康熙來了>前500個shot做測試


第一種分類方式是由face的scale來分成三群(<25,>25,no face/too many faces)

但是結果並沒有很好,而且有可能造成相同鏡頭但是臉scale有差的被分到不同群

總之結果沒有想像中的好


第二種分類方式是由face的數量來分成三群(1,2,0/>3)

第一群的結果一直都沒有很好,僅僅在k=17~20之間會得到"還可以接受"的結果(至少都有兩cluster會發生錯誤),猜測是因為有很多只抓到一張臉的情況實際上都不只一張

第二群的結果還不錯,k=5,6,9,10都可以得到不錯的結果(一個左右的cluster錯誤),但k>=9會發生單個cluster內容是差不多shot沒錯,但可能出現有兩個cluster的shot其實是應該擺在一起的狀況


本來要用衣服做輔助,將衣服feature接在shot feature後面再跑K_means

但是在第一種分類方式,臉數不同會造成freature長度不相同,所以沒辦法

第二種分類方式仍不確定


昨天有想到個想法是說,把現在"以shot為單位"的做法

改成"以face為單位",就是feature = shot feature + face feature + cloth feature

然後有detect到的face全部去做K_means

相同shot的話shot feature會相同,所以理論上會被分在一起

但是相同shot中不同人,也會因face feature + cloth feature而有影響力

不知道可行度如何,待實驗


應該要再想想跟實驗看看吧...

還有要想跨年要去哪邊 :)

2008年12月24日 星期三

[進度] K-means

Gina想到說用K-means來對shot做clustering

把相同攝影機/鏡頭角度的shot都找出來(相同角度找到的應該都會是同一個人)


http://www.mathworks.com/matlabcentral/fileexchange/19344

從這個網站找到別人寫好的matlab code,直接拿來用

嘗試把一整集每個shot取一張key frame的feature points(16 bin*3 colorspace*4 block)

丟進去做clustering

出來的結果(base on 我手邊幾個frame用觀察得到的ground truth,沒有全部)

在K = 30的時候其實已經算準了(btw,我容忍度頗高,看文字檔覺得差不多了,可是還是等看實際shot再說)


應該再配合上利用shot中face的scale先簡單做個分類

再拿來做clustering,會得到更加準確的結果


Merry Christmas :)

2008年12月17日 星期三

一個shot中代表的臉

找可以用來代表這個shot的臉

之前已經利用face detection找出各frame的臉,並利用臉中心的距離分辨出哪些是屬於同一個人的臉

把出現次數過少的當作是error排除,只留下出現次數多(超過一半frame數)的臉

接著要從這些臉中找出"一張"代表用的臉

既然是要代表用的,那應該找"盡量正面"的臉

正面=>臉的對稱性高

所以把detect到的face分為左右兩半做比較


嘗試了兩個做法:

一是比對左右臉的histogram,另一是把臉灰階化之後對稱的pixel相減

用在只有一個人臉部特寫,有臉部轉動的shot中

效果都不是很好~"~


想別的方法中