Home > DBCLS > アレイのプローブ配列検索を強化

アレイのプローブ配列検索を強化

  • 2011-06-09 (木) 16:45
  • DBCLS

マイクロアレイのプローブIDから塩基配列検索の機能を強化しました。

「便利そう」なサービスを実際に「使える」サービスにするためには、地味な作り込みが不可欠なんですよね・・・。先週紹介したプローブ配列検索も、ヒトとマウスで合計4つのプラットフォームだけでは頼りない。そこで今回は、AffymetrixとAgilentのマイクロアレイのうち、GEOにサンプル登録が多いプラットフォームと、まだサンプル登録は少ないけれども最新のプラットフォームを、とにかく全部収録することに。

収録したプラットフォーム一覧

メーカー生物種マイクロアレイの種類GPL ID
AffymetrixヒトHuman Genome U219 ArrayGPL13667
AffymetrixヒトHuman Genome U133 Plus 2.0 ArrayGPL570
AffymetrixマウスMouse Genome 430 2.0 ArrayGPL1261
AffymetrixラットRat Genome 230 2.0 ArrayGPL1355
AffymetrixラットRat Genome U34 Set (U34A/B/C)GPL85,GPL86,GPL87
AffymetrixニワトリChicken Genome ArrayGPL3213
AffymetrixゼブラフィッシュZebrafish Genome ArrayGPL1319
AffymetrixショウジョウバエDrosophila Genome 2.0 ArrayGPL1322
AffymetrixショウジョウバエDrosophila Genome ArrayGPL72
Affymetrix線虫C. elegans Genome ArraGPL200
AffymetrixシロイヌナズナArabidopsis ATH1 Genome ArrayGPL198
Affymetrix出芽酵母+分裂酵母Yeast Genome 2.0 ArrayGPL2529
Affymetrix出芽酵母Yeast Genome S98 ArrayGPL90
AgilentヒトSurePrint G3 Human Exon 2x400K Microarray (028680)
AgilentヒトSurePrint G3 Human Exon 4x180K Microarray (028679)
AgilentヒトSurePrint G3 Human GE 8x60K Microarray (028004)GPL13607
AgilentヒトWhole Human Genome Microarray 4x44K v2 (026652)GPL10332,GPL13497
AgilentヒトWhole Human Genome Microarray 4x44K (014850)GPL4133,GPL6480,GPL9822
AgilentマウスSurePrint G3 Mouse Exon 2x400K Microarray (028727)
AgilentマウスSurePrint G3 Mouse Exon 4x180K Microarray (030493)
AgilentマウスSurePrint G3 Mouse GE 8x60K Microarray (028005)GPL10787
AgilentマウスWhole Mouse Genome Microarray 4x44K v2 (026655)GPL10333,GPL11202
AgilentマウスWhole Mouse Genome Microarray 4x44K (014868)GPL4134,GPL7202
AgilentラットSurePrint G3 Rat Exon 2x400K (028728)
AgilentラットSurePrint G3 Rat Exon 4x180K (028744)
AgilentラットSurePrint G3 Rat GE 8x60K Microarray (028279)
AgilentラットWhole Rat Genome Microarray 4x44K v3 (028282)
AgilentラットWhole Rat Genome Microarray 4x44K (014879)GPL4135,GPL7294
AgilentニワトリG. gallus (Chicken) Oligo Microarray v2 (026441)
AgilentニワトリChicken Gene Expression Microarray (015068)GPL8764
AgilentゼブラフィッシュD. rerio (Zebrafish) Oligo Microarray V3 (026437)
AgilentゼブラフィッシュD. rerio (Zebrafish) Oligo Microarray (013223)GPL2878,GPL7244
AgilentゼブラフィッシュZebrafish (v2) Gene Expression Microarray (019161)GPL6457,GPL7301
AgilentゼブラフィッシュZebrafish Gene Expression Microarray (015064)GPL6563,GPL7302
AgilentショウジョウバエD. melanogaster (FruitFly) Oligo Microarray - V2 (021791)
AgilentショウジョウバエDrosophila Gene Expression Microarray (018972)GPL6385,GPL7300
Agilent線虫C. elegans Oligo Microarray (012795)GPL2875,GPL7272
Agilent線虫C. elegans (V2) Gene Expression Microarray (020186)GPL10094,GPL11346
Agilent線虫C. elegans Gene Expression Microarray (015061)GPL7727,GPL8209
AgilentシロイヌナズナArabidopsis 3 Oligo Microarray (012600)GPL2871,GPL7270
AgilentシロイヌナズナArabidopsis 2 Oligo Microarray (V2) (013324)GPL2880,GPL7290
AgilentシロイヌナズナArabidopsis 2 Oligo Microarray (011839)GPL888,GPL7265
AgilentシロイヌナズナArabidopsis (V4) Gene Expression Microarray (021169)GPL9020,GPL12621
AgilentシロイヌナズナArabidopsis (V3) Gene Expression Microarray (015059)GPL6177,GPL7299
Agilent出芽酵母Yeast microarray (011447)GPL884,GPL7259
Agilent出芽酵母Yeast Oligo Microarray (V2) (013384)GPL2883,GPL7293
Agilent出芽酵母Yeast (V2) Gene Expression Microarray (016322)GPL9825,GPL10045,GPL11488,GPL13340
Agilent出芽酵母Yeast (V1) Gene Expression Microarray (015072)GPL7542,GPL9294

プローブ検索、既知の問題点

プローブを検索しても結果が何も出てこない場合があります。たとえばヒトの 220281_at というプローブ。

Summary欄の表をみると、11個あるプローブのうち10個は NM_000338, NM_001184832 にマッチしているものの、GTTTTTCTGATGAATGGCTTGATTT というプローブは何もヒットしていません。したがってANDを取ると何も出てこないことになります。ところがこのプローブ、1ミスマッチを許して seq1:GTTTTTCTGATGAATGGCTTGATTT で検索してやると(リンク)、ちゃんと NM_000338, NM_001184832 がヒットするのです。Affymetrix社がプローブ設計時に使った配列が、RefSeqの最新の配列と1塩基違っていたのですね。

こういう事例を想定して、本当は11個の塩基配列を検索するときに最初からミスマッチを許して seq1: とか seq2: のモードで検索すればよいのでしょうが、計算時間がかかるのでどうすべきか・・・。

Trackbacks:0

Trackback URL for this entry
/archives/604/trackback
Listed below are links to weblogs that reference
アレイのプローブ配列検索を強化 from mesoの実験ノート

Home > DBCLS > アレイのプローブ配列検索を強化

Search
Feeds
Meta

Return to page top