Section 3: バッチ検索

今のところ、一つのシーケンスのBLAST検索のみを行ってきました。しかしGeneiousのBLAST検索機能では、複数のシーケンスを一度に検索(バッチ検索)できるようになっています。

バッチ検索を試すには、liver ESTsを選択し、BLASTをクリックして下さい。検索オプションでバッチ検索用に選択したシーケンスがどのくらいあるかが表示されます。プログラムがblastnになっていることを確認します(Megablastだと相同性の高いシーケンスだけを探そうとするので、結果が出にくい場合があります)。他の設定はデフォルトのままにしておきます。検索ウィンドウは下図のように見えているはずです。:

Searchボタンをクリックすると、バッチ検索用のフォルダが作成されます。結果が返ってくるまで時間がかかるので、少々お待ち下さい。検索が動いている間にも、Geneiousで他の機能を使用することができます。

検索が完了すると、下図のように見えるはずです。


シーケンス1つだけのBLAST検索と同じように、各フォルダにはクエリー配列に対する結果が入ります。フォルダ名にもクエリー配列名がつきます。


Query-centric 検索

膨大なシーケンスをバッチでBLASTする際、各クエリー配列毎に結果のフォルダが分かれるのはあまり実用的ではありません。代わりに、各クエリーに一つのアラインメントを結果として返すことができます。それを行うには、liver ESTsファイルを選択し、BLASTボタンをクリックして、Resultsの部分をQuery-centric alignments onlyに変更して下さい。 Maximum Hitsは5に設定して、Searchをクリックしましょう。

すると今回は、一つのフォルダだけが結果として出てきます。フォルダ内には各クエリー配列に対するアラインメントが一つずつ入っています。

これで、アノテーションの表を編集してバッチBLASTのヒットテーブルを作成することが可能になります。これを行うには、全てのアラインメントを選択してAnnotationsタブに切り替えます。アノテーションの表のデフォルトで出ているカラムはさほど有用でないため、Columnsボタンをクリックして変更します。リストから、#Intervals, Direction, Maximum, Minimum, Name, Sequence, Typeは外しましょう。代わりに%Pairwise Identity, E value, Hit start, hit end, Organism, Query, Query start, Query end, Sequence Nameにチェックを入れます。カラムの順番はドラッグ&ドロップで好きに変えることができます。最終的には下図のような表に見えているはずです。:


この表はExport Tableボタンから.csvフォーマットでエクスポートできます。


BLASTを使用したシーケンスのフィルター

バッチBLASTする際に、Resultsには他にbin into "has hit" vs "no hit" in databaseというオプションがあります。これはヒトやE. coliのような特定のターゲットでない種からコンタミのシーケンスリードをフィルターするのに有効です。シーケンスヒットが返ってくる代わりに、クエリー配列が"has hit" や "no hit" のシーケンスリストの中にソートされます。

これで基本的なBLAST検索は学習できました。Section 4を参照して更に詳細な検索方法を学びましょう。

Section 4: 検索オプション