2008/04/19

Reduce alphabets for peptide as a new feature set

最近看到的有趣研究,看來是看到了有研究者使用BLOSUM50的矩陣將胺基酸字母漸次濃縮成15、10、8、4、2個字母的編碼方式提供了靈感,作者們提出了以基因演算法來作為將多個胺基酸字母合而為一的方法,可以把它想成一種抽取特徵的方法,從原本的胺基酸字母集合中產生出一組使用較少字母的胺基酸組合,然後使用這新的胺基酸字母組成來預測蛋白質或小段胜肽上的特定功能;簡單的說,本來有二十個字母的胺基酸組成被這個演算法濃縮成了只用八個字母或四個字母來描述蛋白質上的胺基酸組成。

而這個方法在他們熟知的免疫領域中應用在數個分類題目上的表現都夠比用BLOSUM50濃縮出來的字母集合效能優秀,並且訓練使用來分類蛋白酶切斷位(HIV protease cleavage/uncleavage site)跟T細胞抗原決定位(T-cell epitope)的胺基酸字母集合竟然對人類白血球抗原(HLA)的分類問題也有增進效果,說明這個抽取特徵的方法就算字母集合就算不是從他本身的資料集中建立的仍然會有改善的效果,所以是個stat-of art reduced alphbets-based feature extraction method!!(笑)

我是覺得這個建立新的字母集合的想法挺有趣的,但要是一個為了特定目的應用(如免疫)發展出來的演算法要是在他的特長領域內輸給泛用型的演算法(從BLOSUM 50抽取)其實應該算很可悲吧XD。另外光用GAOT MATLAB TOOLBOX提供的基因演算法跑超過5代(population 10)後辨識率就會開始下降,看來這題目應該挺容易overfitting的~呵呵XD。

2008/04/18

HEART STATION

前一陣子宇多田新專輯HEART STATION要發台壓版時,在緯來日本台節目間強力打歌宣傳時聽著覺得不錯,過了一陣子就去弄來專輯來聽了XD。我覺得HEART STATION裡旋律符合我波段的曲目還挺多的,比上一張Ultra Blue多的樣子,像Flavor of Life、Beautiful World跟Stay Gold我都挺喜歡的,曲風跟我喜歡的調調頗合的,聽不到一段就知道會是我喜歡的型,而且Stay Gold的伴奏結界太吸引人了。Fight The Blues跟Heart Station我也覺得不錯啦,只是我覺得我對旋律性強的曲風比較會有印象。"我是熊"的歌詞挺歡樂有趣的,前一陣子看了宇多田的網誌幾眼也有這種感覺XD。另外,Take 5在我覺得還沒結束的地方就嘎然而止,不然曲風我也算挺喜歡的~

前一張Ultra Blue我最記得的是深刻衝擊我印象的Be My Last,聽曲風看MV那種黑到快炸了的沉重氣氛我挺喜歡的,其他久沒聽也都不太記得,還有幫他前夫拍的電影"CASSHERN"作ED的"誰かの願いが叶うころ"吧,不過這首其實我覺得很悶,趣味不多~因為電影才有印象的,當初竟然這部電影看完了,現在想想真不可思議......= =||。

2008/04/07

Too peace during San Juan and Citadels make us exhausted

上次玩了幾款紙盤遊戲後,同學最近又帶來了新買的遊戲:聖胡安(San Juan),有點城市興建與經營的概念,但遊戲內容的發展我覺得有點兄弟爬山,各自努力,過程中玩家與玩家間的互動沒有很多,結果就是一整個和平。

另外最近又玩了幾次富饒之城。其中一場我們改組了人物組合,引入大量加強版的人物:把盜賊換成稅務員,多放了一張巫師,國王換成皇帝,主教換成修道院長之後又重新開始了一輪。這次的經驗是變成了極度貧窮遊戲:蓋房子會被徵一枚金幣的稅,所以大家都很精明的把錢花完;修道院長會要最有錢的玩家要一枚金幣,所以身上留錢會被揩油;再加上皇帝對手牌與金幣也具有相當的控制能力,結果就是讓銀行裡存著滿滿的金幣,沒人願意留錢在身上的慘狀...... =..=||。

其中更誇張的是過程中有學長被其他玩家玩到沒手牌沒金幣全身上下一無所有,之後好不容易才東山再起;還有發生有玩家好不容易存了全場唯一的一枚金幣,結果輪到修道院長後立刻被迫捐獻給院長~,這兩件事的後座力超強的,發生之後在場的玩家都笑到不行;然後我初期拿到的手牌被全場轉來轉去,只有唯一一位玩家沒看過我的手牌,過了好久好不容易又轉回到我手上來XD。

最後有學長累到邊看論文邊玩,竟然還開始覺得讀論文比玩遊戲還輕鬆,進行到終盤時我也開始覺得我腦袋整個僵掉沒辦法思考,完全失去計算的能力,只好邊做模型邊玩來提升集中力orz,更讓我們覺得當天跟富饒之城一起玩的雞同鴨搶(Hick Hack in Gackelwack)實在是個平易親善的小遊戲^^。但還是不能否認很多人玩富饒之城時很好玩阿~

Getting into trouble in indian style......

這篇文應該比較像是抱怨文吧。最近在看某個印度團隊發表的資料集,本來想說他們很有誠意的把全部用到的資料集都公布在他們網站上,但當要轉換成我們實驗室預定要使用的格式時,突然發現他們拿來作獨立測試(indepedent test)的資料竟然沒有附上陰性的資料集,幸好寫信去跟他們討教很快就拿到了。

當然故事不會這麼快樂的就結束了,不然這又沒啥好抱怨的。這次試圖從蛋白質的功能區域切入:使用BLAST2GO批次跑出InterProScan找出的蛋白質功能區域當作特徵。但這幾個資料集被BLAST2GO讀取蛋白質序列時總是會發生些讀取錯誤,仔細的每條每條序列的檢查讓我看到了愕然的結果:序列的欄位中竟然有蛋白質描述1!這太驚人了!而且竟然在序列中找到底線符號2,還有序列中被插入空格的情況3,下面有圖解......。另外我也頗好奇怎麼會有這樣的錯誤呢,難道他們建資料集是用手工剪貼?=口=||?

a1
b 2
c3

真是多虧了BLAST2GO對fasta格式有連序列結尾都不能容許有空白字元的嚴厲程度(為了這個例外狀況我又找了一陣= =),讓我耗了三小時能找出這些錯誤,平常我刻出來的小程式這些例外都會直接無視說XD。

2008/04/04

Plastic models fever in lab while spring vacation

DSC01260 *據傳為這次熱病的元凶:三月底新推出的鋼彈模型,逆襲的夏亞中聯邦軍王牌阿姆羅的NT專用機:HGUC RX-93 Nu Gundam!

這幾天有點意外的撿到了春假:本星期實驗室meeting突然的取消,使得實驗日散發出較平常略為輕鬆的氣息,而我碰巧剛去取貨暫時放在實驗室的鋼彈模型意外的成為了熱病的發源地,喚醒了機戰參戰的鋼彈魂跟小時候搜集機器恐龍的夢想,造成了後來接連兩人荷包的小小失血XD。

除了以前玩超級機器人大戰中對運動性高火力強的帥氣機體Zeta Gundam培養出了滿滿的愛外,某學長因為好奇試用了我手上的斜口剪剪了幾下框架試刀後驚為天人,抱著有好工具可以借用的便利想法也跟著買了台電鍍版的HGUC Zeta Gundam來玩玩看,定價足足比當時沒有看到現貨的無電鍍普通版本貴上了整整一倍(3200 vs 1600),不過本來逛網站作功課的當下是想衝細節更精緻的MG的版本的,有點惋惜^^;。

DSC01287 *銳利的TAMIYA斜口剪,強度如ABS的堅硬塑膠都應聲而斷。

另外就是想保持低調的某匿名人士也不敵勸敗電波跟著在逛玩具店之後買了台ZOIDS再販的機器恐龍,我不是很熟這系列@@",聽說提供電源後就會搖晃脖子跟尾巴慢慢的走動,盒上的英文看起來像是地震龍(SEISMOSAURUS),我覺得外型挺像雷龍的。之前有聽過謠傳,好像女性比起鋼彈模型會較喜歡ZOID的機器恐龍,但我目前看到的小樣本都是反對這個假說的@@",像我觀察到的看起來是跟男友一起去小糕的玩具店看模型的女性較多目光也是停在鋼彈模型上......XD

DSC01284 *低調人買下的ZOID模型XD,老闆的熟客說組起來長度跟高度的大小就跟盒子差不多。

我想過了春假後就會這股模型熱就會慢慢平息吧

2008/04/03

Visiting fisherman's restaurant

DSC01300

最近注意到水源街靠近馬偕醫院那端新開了一間店叫"漁夫的店",之前好像是飲料店,注意到時已經改成餐廳了,看到招牌上有寫到鮮魚湯就讓我相當得感興趣,這幾天終於如願以償啦^^。

一樓往內看只有廚房,要經過狹小的樓梯後才會到有大概四五桌的二樓,牆上還有海景的壁畫,有幾隻小海鷗的縮影。我點了60元的蝦仁炒飯,看了網路上的心得說炒飯裡會有十二隻蝦子,結果我算我的盤子裡有十五隻,覺得一整個賺到XD,而且比某間開在學校附近會灑上滿滿胡椒的炒飯好多了,然後看到隔壁桌點海鮮炒麵上面有好幾隻沒剝殼的大蝦子,也覺得有點羨慕。

另外在老闆的推薦下我們四人一起點了碗鮮魚湯,選了最便宜的鐵甲魚切塊然後加豆腐灑蔥灑薑絲,感覺挺鮮美的,同行的學長還表明說比新竹海邊油油的魚湯好喝多了XD。喝湯的途中老闆有上來好像想跟我們閒聊,身上穿著像是海釣協會的背心,但看起來被猛喝湯的我們冷落就又下去了,據他說他是早上五點就去南寮(?)海釣,釣到下午三點回來,所以食材是當天現抓的新鮮魚。下次有機會還會再去吧~