Home > DBCLS > GGRNA英語版の公開&ヒット位置の表示

GGRNA英語版の公開&ヒット位置の表示

  • 2011-07-05 (火) 15:48
  • DBCLS

GGRNA英語版の公開

英語版のページもつくりました。英語がおかしなところを見つけたらご指摘いただければありがたいです。

そろそろヘルプのページも用意しないと。誰か統合TVで紹介してくれないかな(笑

配列がヒットした位置を表示

GGRNAの売りは配列をさくさく検索できること。今回のアップデートでは、塩基配列またはアミノ酸配列がヒットした場合に位置を表示する機能をつけました。塩基配列の場合は参考としてCDSの範囲を表示することによって、ヒットした配列がCDS内かUTRかを簡単に判断できるようにしました。

応用:miRNAとseedマッチする遺伝子の探索

ヒットした位置を表示する機能はけっこう使えると思います(自画自賛)。ここでは応用例として、ヒトのmiRNAであるlet-7bの ‘seed’ と相補的な配列を3′ UTRにもつtranscriptのリストを作成してみます。このリストの一部にlet-7bの標的が含まれていると考えられます。

ヒトのlet-7b:5′-UGAGGUAGUAGGUUGUGUGGUU-3’(miRBaseより)

赤字で示した、5’末端から数えて2-8の位置のGAGGUAGがこのmiRNAのseedと呼ばれる部位です。miRNAはまずこの部分で相手を認識すると考えられており、miRNAの標的となるmRNAの多くはその3′ UTRに「seedと相補的な配列」をもっています。ここで留意しておきたいのは、

  • seedの対合はperfect matchでなければならない。
    RNA同士の塩基対形成なのですが、G:Uはダメです。
  • 3′ UTRにseed matchするものすべてが標的となるわけではない。
    実際に検索してみるとわかりますが、7塩基のexact matchだと数千個のtranscriptがヒットします。ですが、このすべてがmiRNAによって抑制されるわけではありません。ものすごくおおざっぱに言うと、マイルドに抑制されるものがこのうち数十個、きっちり抑制されるものは数個以下、というイメージではないかと思います。

それでは実際に検索してみましょう。GAGGUAGと塩基対形成するmRNAの配列はCUACCUC、ただしRefSeqのデータはmRNAといいながらも[ATGC]で表記されているので、CTACCTCを検索します。結果は7734件。ヒット件数が多いので結果が表示されるまで数秒かかります。(検索自体は2秒以内に終わるのですが、HTML生成とブラウザでの表示に時間がかかっているようです。ここは工夫できそう。)

このなかには、今回探している3′ UTRにマッチしているもの以外に、5′ UTRやCDSにマッチしているものも含まれています。そこで今回の新機能、ヒット位置の情報をもとに3′ UTRにマッチしているものだけをエクセルで抜き出します。なお、grepとかawkとかperlとかRとかを使いこなせる人は、そっとエクセルを閉じてください。

検索結果のページの最下部にあるタブ区切りテキストをエクセルにコピペします。

E列のpositionの情報とCDSの位置を使います。3′ UTRにヒットしているもの、つまり(ヒット位置)>(CDSの終わりの位置)の行だけを取り出したいので、編集メニューの置換機能を利用してこの2つの数値を抜き出します。なお複数ヒットしているものは最後の(一番大きい)数値だけを判定すれば十分です。

ヒット位置の最後の数値を取り出すには、position….のセルに対して、

  1. ” (CDS*” を空白で置換(1文字目のスペースに注意)
  2. “* ” を空白で置換(*の後のスペースに注意)

CDSの終わりの位置を取り出すには、同様にposition….のセルに対して、

  1. “)*” を空白で置換
  2. “* “を空白で置換(*の後のスペースに注意)

でOKですね。

取り出した2つの数値の大小をH列にて比較。

並べ替えを利用してTRUEとなっている行を抽出すると2414行。目的のリストが得られました。

なお、この作業でつかれてしまった人は、awkやperlで同じことが3行くらいで書けるのでそちらをおすすめします。

cat  ggrna_result.txt  |  perl  -ne  '$_ =~ /(\d+) \(CDS: \d+ - (\d+)\)/ and $1 > $2 and print'

うそです1行で書けました。結果をwcするとエクセルで抽出した場合と同様に2414行になっています。

Trackbacks:0

Trackback URL for this entry
/archives/717/trackback
Listed below are links to weblogs that reference
GGRNA英語版の公開&ヒット位置の表示 from mesoの実験ノート

Home > DBCLS > GGRNA英語版の公開&ヒット位置の表示

Search
Feeds
Meta

Return to page top