Home > DBCLS > マイクロアレイのプローブIDから塩基配列検索

マイクロアレイのプローブIDから塩基配列検索

  • 2011-06-02 (木) 18:23
  • DBCLS

地味ですが新しい機能を追加しました。マイクロアレイのプローブIDを入力すると、そのプローブの塩基配列をつかって遺伝子を検索してくれる機能です。

たとえば下の例は、Affymetrix社のヒトのアレイ(GeneChip Human Genome U133 Plus 2.0 Array)のプローブである、1552311_a_at で検索したものです(リンク)。Affymetrixのアレイは25-merのオリゴ11本で1つのtranscriptを認識するようになっています。この11本をまとてprobesetと呼び、probesetごとに上記のようなIDが振られています。そこで、

「1552311_a_at」

と入力すると、サーバ側でプローブID→塩基配列に展開し、

「GCATGGGATGGGACAGTCTGGGCCA」+
「AGAAGTGCGGCACCAGGGCAGGAGC」+
「GGCAGGAGCTGCAGTAGCTACCCTC」+
「AGATCACTCCCAGATCACCAGGTCA」+
「AGGTCACCCCATCTCTAGGCGGCAC」+
「AATGTCACCGCACACCAGGCAGTGG」+
「GGGACACGGCAGTAAGCACAAGAAA」+
「ACGGCAGTAAGCACAAGAAAGATTT」+
「TCTCCACAAACGTTTTTAAAATGTG」+
「AAAATGTGCCGGGTGTACTGGTGCA」+
「ATGTGCCGGGTGTACTGGTGCACAC」

で検索を実行するようにしてみました。結果はこちら。

Result欄を見ると、RAX2 (NM_032753) という遺伝子がヒットしていることがわかります。遺伝子のリンクをクリックすると、

のように、3’末端付近に11本のオリゴの標的サイトがあることがわかります。余談ですが、検索でヒットした文字列が重なった場合は緑色が濃くなるように改良しました。今までのように単色だと、どこがどのように重なっているのか全然わからなかったので。

ところで皆さんはマイクロアレイのデータを解析するときに、プローブIDと遺伝子をどのように対応させているでしょうか。おそらく多くの方は、メーカーが出している対応表や、アレイ解析ソフトの結果をそのまま利用されていると思います。しかしこれは意外と信用できないとmesoは考えています。

少し前の話なのですが、Affymetrixのアノテーションでは 226437_at → VIM とあるのに、データがおかしいのでよく調べてみたら、実際にはまったく別の遺伝子であるYIF1Bに当たっていた、みたいな事例が頻繁にありました。

Affymetrixの表がちょっと軽くやばい感じだったので、Biomartを利用して対応表をつくることを試みたのですが、それもいまいち。例えば対応表のうえではACADVLに当たっているはずの3つのプローブが、よく調べてみると下の図のように3つのうち2つが隣の遺伝子(DVL2)に当たっていたり・・・。

上記の2つの事例に関しては、2011年6月現在は訂正されているものの、まだまだあやしい箇所が残っているのではないかと思います。だからこそ、ユーザ自身がプローブIDから塩基配列をつかって遺伝子(より正確にはtranscript)との対応を調べることは大事だと思うのです。現状ではそれを簡単にできる方法がなかったので、つくってみたというわけでした。今回は、

  • GeneChip Human Genome U133 Plus 2.0 Array (Affymetrix)
  • GeneChip Mouse Genome 430 2.0 Array (Affymetrix)
  • Whole Human Genome Microarray 4x44K v2 (Agilent)
  • Whole Mouse Genome Microarray 4x44K v2 (Agilent)

のデータを取り込んでおり、随時拡充していく予定です。

下記はAgilentのヒトのアレイ(Whole Human Genome Microarray 4x44K v2)から A_23_P101434 を検索した例(リンク)。Agilentのアレイは基本的には60-merのオリゴ1本で1つのtranscriptを認識するようにできている点がAffymetrixとの大きな違いです。mesoの経験的にはこちらのほうがバックが小さくなり、発現量が比較的少ない遺伝子まで綺麗にデータが出るようです。

Trackbacks:0

Trackback URL for this entry
/archives/451/trackback
Listed below are links to weblogs that reference
マイクロアレイのプローブIDから塩基配列検索 from mesoの実験ノート

Home > DBCLS > マイクロアレイのプローブIDから塩基配列検索

Search
Feeds
Meta

Return to page top