- 2011-06-09 (木) 16:45
- DBCLS
マイクロアレイのプローブIDから塩基配列検索の機能を強化しました。
「便利そう」なサービスを実際に「使える」サービスにするためには、地味な作り込みが不可欠なんですよね・・・。先週紹介したプローブ配列検索も、ヒトとマウスで合計4つのプラットフォームだけでは頼りない。そこで今回は、AffymetrixとAgilentのマイクロアレイのうち、GEOにサンプル登録が多いプラットフォームと、まだサンプル登録は少ないけれども最新のプラットフォームを、とにかく全部収録することに。
収録したプラットフォーム一覧
メーカー | 生物種 | マイクロアレイの種類 | GPL ID |
---|---|---|---|
Affymetrix | ヒト | Human Genome U219 Array | GPL13667 |
Affymetrix | ヒト | Human Genome U133 Plus 2.0 Array | GPL570 |
Affymetrix | マウス | Mouse Genome 430 2.0 Array | GPL1261 |
Affymetrix | ラット | Rat Genome 230 2.0 Array | GPL1355 |
Affymetrix | ラット | Rat Genome U34 Set (U34A/B/C) | GPL85,GPL86,GPL87 |
Affymetrix | ニワトリ | Chicken Genome Array | GPL3213 |
Affymetrix | ゼブラフィッシュ | Zebrafish Genome Array | GPL1319 |
Affymetrix | ショウジョウバエ | Drosophila Genome 2.0 Array | GPL1322 |
Affymetrix | ショウジョウバエ | Drosophila Genome Array | GPL72 |
Affymetrix | 線虫 | C. elegans Genome Arra | GPL200 |
Affymetrix | シロイヌナズナ | Arabidopsis ATH1 Genome Array | GPL198 |
Affymetrix | 出芽酵母+分裂酵母 | Yeast Genome 2.0 Array | GPL2529 |
Affymetrix | 出芽酵母 | Yeast Genome S98 Array | GPL90 |
Agilent | ヒト | SurePrint G3 Human Exon 2x400K Microarray (028680) | |
Agilent | ヒト | SurePrint G3 Human Exon 4x180K Microarray (028679) | |
Agilent | ヒト | SurePrint G3 Human GE 8x60K Microarray (028004) | GPL13607 |
Agilent | ヒト | Whole Human Genome Microarray 4x44K v2 (026652) | GPL10332,GPL13497 |
Agilent | ヒト | Whole Human Genome Microarray 4x44K (014850) | GPL4133,GPL6480,GPL9822 |
Agilent | マウス | SurePrint G3 Mouse Exon 2x400K Microarray (028727) | |
Agilent | マウス | SurePrint G3 Mouse Exon 4x180K Microarray (030493) | |
Agilent | マウス | SurePrint G3 Mouse GE 8x60K Microarray (028005) | GPL10787 |
Agilent | マウス | Whole Mouse Genome Microarray 4x44K v2 (026655) | GPL10333,GPL11202 |
Agilent | マウス | Whole Mouse Genome Microarray 4x44K (014868) | GPL4134,GPL7202 |
Agilent | ラット | SurePrint G3 Rat Exon 2x400K (028728) | |
Agilent | ラット | SurePrint G3 Rat Exon 4x180K (028744) | |
Agilent | ラット | SurePrint G3 Rat GE 8x60K Microarray (028279) | |
Agilent | ラット | Whole Rat Genome Microarray 4x44K v3 (028282) | |
Agilent | ラット | Whole Rat Genome Microarray 4x44K (014879) | GPL4135,GPL7294 |
Agilent | ニワトリ | G. gallus (Chicken) Oligo Microarray v2 (026441) | |
Agilent | ニワトリ | Chicken Gene Expression Microarray (015068) | GPL8764 |
Agilent | ゼブラフィッシュ | D. rerio (Zebrafish) Oligo Microarray V3 (026437) | |
Agilent | ゼブラフィッシュ | D. rerio (Zebrafish) Oligo Microarray (013223) | GPL2878,GPL7244 |
Agilent | ゼブラフィッシュ | Zebrafish (v2) Gene Expression Microarray (019161) | GPL6457,GPL7301 |
Agilent | ゼブラフィッシュ | Zebrafish Gene Expression Microarray (015064) | GPL6563,GPL7302 |
Agilent | ショウジョウバエ | D. melanogaster (FruitFly) Oligo Microarray - V2 (021791) | |
Agilent | ショウジョウバエ | Drosophila Gene Expression Microarray (018972) | GPL6385,GPL7300 |
Agilent | 線虫 | C. elegans Oligo Microarray (012795) | GPL2875,GPL7272 |
Agilent | 線虫 | C. elegans (V2) Gene Expression Microarray (020186) | GPL10094,GPL11346 |
Agilent | 線虫 | C. elegans Gene Expression Microarray (015061) | GPL7727,GPL8209 |
Agilent | シロイヌナズナ | Arabidopsis 3 Oligo Microarray (012600) | GPL2871,GPL7270 |
Agilent | シロイヌナズナ | Arabidopsis 2 Oligo Microarray (V2) (013324) | GPL2880,GPL7290 |
Agilent | シロイヌナズナ | Arabidopsis 2 Oligo Microarray (011839) | GPL888,GPL7265 |
Agilent | シロイヌナズナ | Arabidopsis (V4) Gene Expression Microarray (021169) | GPL9020,GPL12621 |
Agilent | シロイヌナズナ | Arabidopsis (V3) Gene Expression Microarray (015059) | GPL6177,GPL7299 |
Agilent | 出芽酵母 | Yeast microarray (011447) | GPL884,GPL7259 |
Agilent | 出芽酵母 | Yeast Oligo Microarray (V2) (013384) | GPL2883,GPL7293 |
Agilent | 出芽酵母 | Yeast (V2) Gene Expression Microarray (016322) | GPL9825,GPL10045,GPL11488,GPL13340 |
Agilent | 出芽酵母 | Yeast (V1) Gene Expression Microarray (015072) | GPL7542,GPL9294 |
プローブ検索、既知の問題点
プローブを検索しても結果が何も出てこない場合があります。たとえばヒトの 220281_at というプローブ。
Summary欄の表をみると、11個あるプローブのうち10個は NM_000338, NM_001184832 にマッチしているものの、GTTTTTCTGATGAATGGCTTGATTT というプローブは何もヒットしていません。したがってANDを取ると何も出てこないことになります。ところがこのプローブ、1ミスマッチを許して seq1:GTTTTTCTGATGAATGGCTTGATTT で検索してやると(リンク)、ちゃんと NM_000338, NM_001184832 がヒットするのです。Affymetrix社がプローブ設計時に使った配列が、RefSeqの最新の配列と1塩基違っていたのですね。
こういう事例を想定して、本当は11個の塩基配列を検索するときに最初からミスマッチを許して seq1: とか seq2: のモードで検索すればよいのでしょうが、計算時間がかかるのでどうすべきか・・・。
- Newer: RefExとの連携&データ出力機能を追加
- Older: マイクロアレイのプローブIDから塩基配列検索
Trackbacks:0
- Trackback URL for this entry
- /archives/604/trackback
- Listed below are links to weblogs that reference
- アレイのプローブ配列検索を強化 from mesoの実験ノート