NGS解析

ThruPLEX^® Tag-seq Kit Q＆A

全表示／全非表示

Q1　ThruPLEX Tag-seq Kitはどんなサンプルが使用できるか？

A1　ThruPLEX Tag-seq Kitは、cell-free DNAおよび断片化した二本鎖DNAからイルミナNGS用のDNAライブラリーを作製するよう設計されています。ThruPLEX Tag-seqは、幅広いGCカバレッジの多様なライブラリーを生成し、1～50 ng DNAで再現性のあるシーケンス結果を得ることができます。

Q2　ThruPLEX Tag-seq Kitと他のThruPLEX Kitとの主な違いは何か？

A2　ThruPLEX Tag-seq Kitには、識別用分子タグを含むように再設計された独自のThruPLEX Stem-Loopアダプターが含まれています。キットには、増幅前の個々のDNA断片にタグを付加するための1,600万種以上の分子タグが含まれており、ライブラリー作製、ターゲット濃縮、およびデータ解析によって、低頻度アレルを高感度且つ高い特異性で検出することができます。

Q3　識別用分子タグ（UMT）はどの様に機能するのか？

A3　ThruPLEX Tag-seqライブラリーの調製では、スタートのDNA断片を個々に標識するために、ライゲーションステップでUMTが組み込まれます。これにより、データ処理の過程でシーケンスリードをUMTに応じて増幅ファミリーごとにグループ分けすることが可能になります。データ処理中に、各増幅ファミリー内のリードを比較して増幅エラーおよびシーケンスエラーを取り除き、コンセンサス配列を作成して変異検出の確度を上げることができます。

Q4　ThruPLEX Tag-seqには識別用分子タグ（UMT）はいくつあるか？

A4　ThruPLEX Stem-Loopアダプターのライゲーションにより、ThruPLEX Tag-seqライブラリーのDNA断片の両側に6塩基のランダム配列が1つずつ組み込まれます。各6塩基配列には、4⁶（4,096）通りの組み合わせがあります。DNA断片の両側の6塩基配列の組み合わせによって、1,600万（4,096×4,096）通りの分子タグが得られ、インプットDNA分子個別標識が可能となります。

Q5　1％のアレル頻度の変異体を検出するには、どれくらいのインプットDNAが必要か？

A5　必要とされる検出感度を得るために、十分な変異体コピー数が確実に含まれるライブラリーを調製するには、適切なインプット量のDNAを使用する必要があります。一般に、対立遺伝子の存在頻度が低いほど、検出に必要なDNAインプット量は高くなります。例えば、10 ngのDNAサンプルには、1％のアレル頻度の検出に十分なコピー数が含まれていると予想されます。詳細は、ThruPLEX Tag-seq Kit取扱説明書のC.III項または下記をご参照ください。ライブラリー調製またはターゲット濃縮時にDNAのロスがあるため、検出できるコピー数は下記表の値より低くなることがあります。

Estimated Genome Copies Available for Library Preparation

Input Amount	Total Haploid Genome Copies^＊	Total Variant Copies at Indicated Allele Frequency
Input Amount	Total Haploid Genome Copies^＊	5％	1％	0.5％
50 ng	16,666	833	166	83
30 ng	10,000	500	100	50
10 ng	3,333	166	33	16
5 ng	1,666	83	16	8
1 ng	333	16	3	1

* Calculated using 3 pg as the mass of a haploid genome. The genomic complexity of plasma samples is highly variable. All numbers rounded down to nearest whole number.

Q6　ThruPLEX Tag-seqライブラリーのシーケンスにはどのくらいのdepthが必要か？

A6　ThruPLEX Tag-seqライブラリーの識別用分子タグを利用してコンセンサス配列を構築するには、十分なカバレッジが必要です。一般に、存在頻度が低いアレルほど、検出にはより高いdepthが必要になります。例えば、標的ピーク増幅ファミリーサイズが1分子あたり10リードで、変異コールの確定に3分子が必要な場合、アレル頻度5％の変異体のコールには少なくとも600×のシーケンス深度が必要となります。同様に、アレル頻度が1％では3,000×、アレル頻度が0.5％では6,000×のカバレッジが必要となります。詳細は、ThruPLEX Tag-seq Kit取扱説明書のC.III項または下記をご参照ください。必要なリード数に関して、
Sequencing depth for ThruPLEX Tag-seq をご覧ください。

Estimated Mean Raw Sequencing Depth Required^＊

Minimum number of Unique Molecules to Make a Variant Call	Allele Frequency
Minimum number of Unique Molecules to Make a Variant Call	5％	1％	0.5％
3	600X	3,000X	6,000X
5	1,000X	5,000X	10,000X
10	2,000X	10,000X	20,000X

* Raw sequencing depth includes all reads prior to removal of duplicates. This is calculated using a target peak amplification family size of 10 reads per unique molecule.

例）1％アレル頻度で、1 unique moleculeあたり10リード必要で、variant callに3 unique moleculesを必要とした場合

（3/0.01）＊10＝3,000×のCoverage必要

Sequencing Depth= (number of unique variants required to make a variant call/allele frequency)*approximate number of reads in each amplification family

Q7　ThruPLEX Tag-seq Kitと組み合わせ可能なターゲット濃縮システムはあるか？

A7　はい、ThruPLEX Tag-seq kitは、Agilent SureSelect、Roche NimbleGen SeqCap EZ、IDT xGenなどの主要なターゲット濃縮製品と組み合わせて使用できます。ThruPLEXのターゲット濃縮プロトコールのアプリケーションノートは、
User-generated DNA target enrichment protocols for ThruPLEX kits をご覧ください。

Q8　ThruPLEX Tag-seq Kitと他のイルミナNGSライブラリーを同じランで解析できるか？

A8　はい、ThruPLEX Tag-seqライブラリーは、1回のランで他のイルミナNGS用ライブラリーと一緒にシーケンスできます。ただし、それぞれのサンプル毎に異なるサンプルインデックスが付加されており、シーケンスのカバレッジが十分となるように注意しなければなりません。識別用分子タグ（UMT）の利点を生かして、ThruPLEX Tag-seqライブラリーを、ターゲット濃縮し、比較的高いdepthでシーケンスするのが一般的です。

Q9　ThruPLEX Tag-seqライブラリーから得られたシーケンスデータはどのように処理するのか？

A9　ThruPLEX Tag-seqライブラリーの識別用分子タグ（UMT）によって提供されるシーケンスデータを、増幅ファミリー毎にグループ化し、コンセンサスリードを構築しなければなりません。ThruPLEX Tag-seqライブラリーのデータの処理に特化して設計された2つのバイオインフォマティクスソリューションがあります：

Curio

Curioは、Curio Genomicsより提供されているクラウドベースのバイオインフォマティクスプラットフォームです。ThruPLEX Tag-seqライブラリーのシーケンスデータを、簡単にアップロード、処理、可視化できます。このプラットフォームは、超高速でユーザーフレンドリーなインターフェースと、強力なアライメントビューアーを備えています。プラットフォームには、変異体の検出、解析、および可視化を実行するためのモジュールも装備されています。詳細については、
www.curiogenomics.comをご覧ください。

Connor

Connorは、GitHub（https://github.com/umich-brcf-bioinf/Connor）上にある、ThruPLEX Tag-seqライブラリーデータ処理用の、オープンソースのバイオインフォマティクスツールです。Connorは、アライメント済みBAMファイルをインプットすると、UMT情報を処理し、コンセンサス配列を含む処理済みBAMファイルを生成します。出力されたBAMファイルは、FreeBayes、VarScan2、またはGATK HaplotypeCaller等の変異コール用ツールで使用できます。

Q10　手持ちのバイオインフォマティクス解析パイプラインを利用したい場合、どうすればThruPLEX Tag-seqライブラリーから得られたシーケンスデータを処理できるか？

A10　パイプラインはそれぞれ異なるので、ThruPLEX Tag-seq kit用に作成されたオープンソースのバイオインフォマティクスツールであるConnorの利用をお勧めします。ご自身の既存パイプラインを改変したい場合は、次の情報が役に立つかもしれません。ThruPLEX Tag-seqライブラリーは、両側に6塩基の識別用分子タグ（UMT）を1つずつ持っています。UMTはRead 1またはRead 2のいずれかによって読み取られた最初の配列であり、8～11塩基のStem配列、次いでテンプレートDNA配列が続きます。ライブラリー構造の詳細については、ThruPLEX Tag-seq Kit取扱説明書をご参照ください。

Q&A TOPへ

NGS解析

ThruPLEX® Tag-seq Kit Q＆A

Curio

Connor

ThruPLEX^® Tag-seq Kit Q＆A