UCSC Genome Browserはカリフォルニア大学サンタクルズ校(University of California, Santa Cruz)によって開発・運営されている、ゲノム情報を可視化できるwebツールです。様々な使用法がありますが、今回はDNA配列(具体的にはp53遺伝子のプロモーター領域)の取得について解説したいと思います。
まずはじめに、自分が調べたい生物種・ゲノム情報・遺伝子名を選択もしくは入力して”GO”をクリックしましょう。
すると、下図のように検索した遺伝子領域が可視化されます。様々なデータベース由来のエキソン・イントロン情報が可視化されていますが、その中で自分の調べたい対象となるものを選択します。(ここではNCBIデータベースを用いた時と同様に”NM_011640”を選択します)
"Genomic Sequence"をクリックした後、”mRNA Sequence”を選択すると、①で紹介したNCBIデータベースと同様にmRNAの配列を取得することができます。
取得したい項目を選択すると、
目的の遺伝子の転写開始点上流(プロモーターと思われる領域)の配列を取得することができます。
IGV(Integrative Genomics viewer)は、アメリカのブロード研究所のグループによって開発された、ゲノムデータを視覚化するためのツールです(James T Robinson, et al., Nature Biotechnology, 2011)。主に、ChIP-seqやATAC-seqといった、次世代シークエンサーを用いたデータの解析に使用されることが多いです。この章では、あらかじめ登録されているゲノムデータから、任意の領域の配列データを取得する方法について説明します。
ソフトを起動させたら、まずはじめに左上のタブをクリックし、生物種を選択します。ヒト・マウス以外の生物種のゲノムデータが欲しい場合は、”More...”から選択します。
次に、遺伝子名または染色体位置を入力します。
遺伝子名を入力後にエンターキー入力、または”GO”ボタンをクリックすることで、目的の遺伝子座が表示されるようになります。この時に、隣の遺伝子と近接していたり、バリアントが複数存在することによってmRNAの位置が分かりにくい場合があります。
このような場合は、画面左下にある”Refseq Gene”を右クリックし、”Expanded”を選択することで、遺伝子情報が展開され見やすくなります。
*ちなみにこの時点で、p53遺伝子の上流末尾の配列がUCSC Genome Browserで取得したものと同じであることを確認できます。