Exercise 1: タンパク質をコードした遺伝子のシーケンスを投稿する

1b. タンパク質コード遺伝子のアノテーションフォーマット

Genbankはコーディング領域のタンパク質コード遺伝子、イントロン/エキソンの境界、タンパク質の翻訳の情報を記録します。このセクションでは、このような情報を含むアノテーションを正しく付ける方法を学びます。

Sppu-UZシーケンスのSequence viewに戻ります。このシーケンスには既にCDSとexonのアノテーションがあるのがわかります。Genbankにタンパク質コーディング遺伝子を投稿するには、他に"gene"アノテーションが必要です。シーケンス全体を選択して、Add Annotationボタンをクリックし、そのアノテーションを加えます。Nameは"Sppu-UZ"と入力し、Annotation typeはgeneを選択して下さい。Genbank投稿のために、Geneアノテーションには遺伝子の識別子が必要です。:Properties欄の隣のAddボタンをクリックし、Nameに"gene"、Valueに"Sppu-UZ"と入力して下さい。

また、アレルの名前も加えます(これは任意ですが、今回はアレル名がわかっているので練習のため入力してみましょう)。Properties欄のAddをもう一度クリックし、Nameに"allele"、Typeに"Sppu-UZ*03"と入力します。これらのシーケンスはSppu-UZのフラグメントのみを表すので、このgeneアノテーションが部分的な特徴を表すことを示さなければいけません。これを実行するには、Interval (1->1690)を選択し、Editをクリックします。Truncated left endTruncated right endにチェックを入れ、OKをクリックします。もう一度OKをクリックし、Sequence Viewに戻ります。

CDSやexonアノテーションに適切な識別子を加える必要があります。control (windows) か command (mac)キーを押しながらCDSと2つのexonアノテーション(色の付いたバー)をクリックして選択します。Edit Annotationsをクリックし、上記で行ったのと同じ様にProperties欄でgene : Sppu-UZを追加します。OKをクリックします。これで選択したアノテーション全てに対してこの識別子が付きます。

CDSアノテーションには他に、翻訳の際の遺伝子コード(The NCBI Genetic Codes Definition由来)を表すtransl_tableの識別子、1から3の翻訳フレームを表すcodon_startの識別子、タンパク質名を表すproductの識別子が必要です。transl_table や codon_startの識別子がGenbankで機能してくれるので、実際の翻訳情報を加える必要はありません。これらの識別子を加えるには、CDSアノテーションをクリックし、Edit Annotationsを再度クリックして下さい。Propertiesも、上記で行ったように、geneの識別子を下記の通り入れて下さい。:
Name: transl_table; Value: 1
Name: codon_start; Value: 3
Name: product; Value: MHC class I antigen

Exonアノテーションを含んだCDSのアノテーションの間に隙間があるのが見えると思います。これを示す識別子をCDSに加える必要があります。Propertiesに下記を加えて下さい。:
Name: NCBI join type; Value: join

OKをクリックします。

各Exonアノテーションには番号の識別子が必要です。exon2のアノテーションを選択して、Edit Annotationをクリックします。Propertiesの隣のAddをクリックし、Name:number、Value:2を加えて下さい。OKをクリックします。exon3のアノテーションも同様の手順で、Name:number、Value:3を加えます。アノテーションに全ての識別子を加え終わったら、OKをクリックし、Saveアイコンをクリックします。

総括すると、タンパク質コード遺伝子には下記のアノテーションと識別子が必要です。:

Gene Annotation:

CDS Annotation:

Exonアノテーションは任意ですが、Exonアノテーションがある場合は必ず"number"識別子を入れて下さい。

もし他にも識別子を加えたい場合は、Edit AnnotationからPropertiesで追加を行って下さい。入力できるアノテーションタイプと識別子のリストは、 ここでご確認下さい。

Exercise 1 次ページへ.