- 2012-08-10 (金) 14:45
- DBCLS
DDBJのデータベースについて記事を書いた直後に89.0がリリースされたのでメモ。無脊椎 (INV) はエントリ数、塩基数とも減っていた。理由を調べてみると、生物種がはっきり書かれていないエントリなどが大量にremoveされていた(例:GU672000)。
一通りダウンロードして、現在は塩基配列部分をインデクシング中。
Division | 内容 | エントリ | 塩基 | ファイルサイズ | (GB) |
---|---|---|---|---|---|
合計 | 160,254,629 | 141,016,380,296 | 561,920,288,622 | 523.3 | |
HUM | ヒト | 563,386 | 4,996,058,095 | 8,374,749,482 | 7.8 |
PRI | 霊長類 (ヒトを除く) | 102,989 | 1,292,811,012 | 1,891,443,366 | 1.8 |
ROD | 齧歯類 | 440,159 | 4,430,778,988 | 7,005,892,095 | 6.5 |
MAM | 哺乳類 (ヒト,霊長類,齧歯類を除く) | 312,768 | 852,651,001 | 1,781,940,910 | 1.7 |
VRT | 脊椎動物 (ヒト,霊長類,齧歯類,哺乳類を除く) | 1,057,240 | 2,845,002,278 | 6,069,241,055 | 5.7 |
INV | 無脊椎動物 | 1,577,829 | 2,443,533,451 | 6,843,835,702 | 6.4 |
PLN | 植物・真菌類 など | 2,471,569 | 5,840,633,857 | 13,652,436,941 | 12.7 |
BCT | バクテリア | 841,541 | 8,158,523,792 | 19,074,978,516 | 17.8 |
VRL | ウイルス | 1,185,860 | 1,371,199,251 | 4,914,556,954 | 4.6 |
PHG | バクテリオファージ | 6,512 | 77,382,875 | 187,608,552 | 0.2 |
PAT | 特許出願に含まれる塩基配列データ | 23,998,516 | 11,945,459,364 | 42,322,850,200 | 39.4 |
ENV | PCR,DGGE,あるいは,その他の方法で直接, 分子を単離した環境上のサンプルに由来した配列 | 4,715,129 | 3,237,988,584 | 12,653,785,921 | 11.8 |
SYN | synthetic constructs 人為的に構成された配列 | 123,112 | 926,662,970 | 1,643,396,741 | 1.5 |
EST | expressed sequence tags short single pass の cDNA 配列 | 73,142,305 | 40,637,013,620 | 239,749,294,113 | 223.3 |
TSA | transcriptome shotgun assemblies 再構成された (assembled) mRNA 配列 | 6,714,908 | 4,679,084,409 | 18,903,720,242 | 17.6 |
GSS | genome survey sequences short single pass のゲノム配列 | 33,998,784 | 21,641,585,155 | 99,772,519,365 | 92.9 |
HTC | high throughput cDNA sequences EST 以外の大規模 cDNA 配列プロジェクトに由来。 最終的に,生物種による division に移される場合がある。 | 551,351 | 634,629,961 | 2,512,724,377 | 2.3 |
HTG | high throughput genomic sequences ゲノムプロジェクトに由来。 最終的に,生物種による division に移される。 | 146,427 | 24,368,642,654 | 32,103,302,381 | 29.9 |
STS | sequence tagged sites Genome sequencing の tag となる配列。 chromosome, map, PCR_condition 等の情報が必要。 | 1,322,639 | 636,259,470 | 4,497,106,490 | 4.2 |
UNA | 未注釈データ 最近は UNA division は使用していない。 | 290 | 479,509 | 1,379,737 | 0.001 |
CON | Contig / Constructed ゲノムプロジェクトのように個々に登録された一連の 配列データを結合し,1つのアクセッション番号を付与 した長大なデータ。塩基配列は記載されない。 | 6,981,315 | 0 | 37,963,525,482 | 35.4 |
※ 表はDDBJ 89.0の リリースノート を集計。Divisionの説明は「DDBJ のデータ公開形式 (flat file) の説明」を抜粋。
- Newer: difff《デュフフ》リニューアル
- Older: マイクロアレイ学生実習
Trackbacks:0
- Trackback URL for this entry
- /archives/1975/trackback
- Listed below are links to weblogs that reference
- DDBJ 89.0 (Jun, 2012) from mesoの実験ノート