DNA科学捜査 - Answers
Question 1: およそ340ベースで突然シーケンスが止まっています。それはなぜでしょう?
> PCRでDNAを増幅する際、フラグメント(もしくはアンプリコン)は特定の長さで生成されます。このケースではH15149とL14841がおよそ340bpのアンプリコンを生成しています。このアンプリコンがダイターミネーターシーケンスを経ると(シーケンシングプライマーとしてH15149を使用)、塩基はプライマーの3'末端に伸長として追加されます。しかしながら、ポリメラーゼが一旦アンプリコンの"末端"に到達しないと、塩基が付加できません。テンプレートとしてふるまえるDNAが残っていないためです。そのためクロマトグラムが突然ストップしています。教科書のページをコピーしていて、教科書の最後のページにいったらそれ以上コピーできなくなるのと同じです。
Question 2: どれだけの塩基がアラインメント内で編集されましたか?- どうしてその編集が必要だったかも簡潔に答えてみましょう。
> プライマーシーケンスやシーケンスのスタート位置にある曖昧な塩基のリードを除き、その後シーケンスをアラインすると、アラインメント内で2つの塩基が際立ちます。2つのDNA鎖が独立してシーケンスされた際に合わなかった塩基です。 これらの塩基の実際の位置はクロマトグラムをどのくらいトリムするかに依存します。しかし、一つはアラインメントの末端にあります。もしクロマトグラムのトレースを深く考察したいのであれば、コンピュータープログラムが(ピーク間のスペースのせいで)エラーを起こすような塩基をコールしてしまったのか、本物でない2つの塩基を挿入してしまったのか、両方のケースを考えてみなければなりません。どちらのケースでも、塩基は削除するべきです。そうすることでフォワードとリバースのシーケンスが"マッチ"します。このような"生"のシーケンスデータの手動での編集は、生成したシーケンスをエラーフリーにする重要なステップであり、更に両方向でPCR産物をシーケンスしたことの重要性を強調しています。
Question 3: GenBankファイル内の情報から、熊胆の結晶から得られたシーケンスに一番マッチするGenBankの一般名は何でしょう?
> このシーケンスはクロクマの100%亜種としてBLASTされています。- もしGenBankファイルEF076773をダウンロードしていて、かつファイルのテキストビュータブをクリックすれば、このシーケンスがUrsus thibetanus formosanusと100%マッチしているのがわかります。これの一般名はformosan Black Bear(タイワンツキノワグマ)です。クロクマの他の種もまた100%マッチしていて、熊胆フレークから得られたシーケンスはそれらの亜種の一つ由来でありそうなことがわかります。
Question 4: Ursus thibetanus formosanusについてはこちらをご参照下さい。このページの情報から、この種の保護状況(conservation status)は何でしょうか?
> タイワンツキノワグマはツキノワグマの亜種です。 保護状況は"endangered"です。
Question 5: 系統樹によると、熊胆サンプルから単離したDNAシーケンスと一番近い種は何でしょう? (注意: Selenarctos thibetanus と Ursus thibetanus は同じ種です。)
> Selenarctos thibetanusはUPGMA系統樹上で一番近縁な種です(Asiatic Black Bear) - マッチ度合いが完全でないことに気づくと思います。(そうでなければ系統樹の末端が近い) - これはクロクマの2つの異なる種を比較してる可能性があるためです。 - BLASTNの結果によって証明されています。
Question 6: ノードのBootstrap values (もしくは consensus support)はどのくらい系統樹が安定的かの指標となります。系統樹上でconsensus support valuesを表示させましょう。("Show node labels"メニューのディスプレイオプションの下でできます。)系統樹で熊胆シーケンスと一番近いグループの%supportはいくつでしょうか?
> クマのアラインメント内ではブーツストラップのランダムリサンプルが行われるので、この質問の答えはリサンプリングデータの確率的性質によって少し変化します。 - しかしながら、数字はおよそ99%になるはずです。