Exercise 2: non-coding mtDNAシーケンスのアラインメントを投稿する

このセクションではmtDNAシーケンスのアラインメントをGenbankに投稿する準備を行います。 このドキュメント内にはalignment fileと、アラインメントの元になった6つのシーケンス( A2639F, A2643M, TR2522M, Aa2619F, SB2535F, TR2529F) があります。アラインメントを投稿するときは、アラインメントにオリジナルのシーケンスをリンクさせないといけません。そうしなければ、投稿時に"Sequence x is lacking a reference"のようなエラーメッセージが出てきます。アラインメントをクリックします。下記のスクリーンショットのように、各シーケンスの左側に小さい青い矢印があります。これはアラインメント内のシーケンスが、ソースとなったファイルにリンクしていることを示しています。


.

2a. アノテーションのフォームを記入する

このアラインメントはミトコンドリアのtRNAシーケンスやnon-coding D-loop領域を含んでいます。これらのアノテーションのフォーマットは、タンパク質コード遺伝子アノテーションよりも簡単です。:tRNAやrRNAに対しては"product"識別子だけ必要です。これで遺伝子名を付与します。バッチでアノテーションの編集を行ってアラインメント全体にproduct識別子を追加することもできます。アノテーションの大部分を選択するもっとも簡単な方法は、Annotationsの表を使用することです。Annotationsタブを選択すると表が現れますので、カラムヘッダーをクリックして"Name"カラムでソートします。tRNA-Pheアノテーション全てをShiftキーを押しながら選択し、Edit Annotationをクリックします。PropertiesAddをクリックし、Nameに"product"、ValueにtRNA-Pheを入力します。OKボタンを2回クリックし、Annotationの表に戻ります。他の2つのtRNAアノテーション(tRNA-Pro と tRNA-Ser)も同様の操作を行い、Nameに適切な文字列を入れて下さい。D-loopシーケンスはノンコーディングなので識別子を加える必要はありません。Saveボタンをクリックし、オリジナルのシーケンスに変更を反映したいかをGeneiousに聞かれたらYesをクリックします。


2b. ドキュメントにGenbank fieldを追加する

sequence IDやvoucher IDのようなGenbank fieldは各シーケンスでユニークでないといけないので、アラインメントではなく個々のシーケンスドキュメントに入れる必要があります。今回の例では、必要なfieldは既に各シーケンスに入っています。A2639FシーケンスをクリックしてInfoを選択して下さい。これらのシーケンスに、サンプリングした場所はDescription fieldに、どのシーケンスから単離された血液サンプルかのIDはSpecimen Voucher IDに情報が入っています。Collection DateやOrganism (Sphenodon punctatus) も既に加えられています。これらのfieldがアラインメント内に存在する全てのシーケンスに加えられています。

次のセクションでは、上記で入れたfieldをGenbank Submissionツール内でGenbank fieldに位置付けします。