楽天・ジェネシスヘルスケアが出した新型コロナPCR検査キットに関する問題点まとめ

珍しくタイムリーな記事を書きます。 シーケンスコストが低下したことにより、DeNAやYahoo!、DHC、そのほか多数の企業が消費者直販型遺伝子検査ビジネス、DTCGT(Direct-to-Consumer Genetic Testing)分野に参画しています。 これらは現在、病院など医療機…

VCFファイルの表記揺れについて

VCF(Variant Caller Format)は、一塩基変異(SNP)、挿入・欠損(INDEL)、および構造変異(SV)を表すために使用される標準化されたテキストファイルフォーマットです。詳細に知りたい方はGATKの説明ページを参照してください。 このフォーマットを用いる…

ANNOVARとMyVariant.infoを用いた変異マイニング - VAPr

MongoDBを使って変異情報の管理がしたいという一心で仕事に手がつかないkimotonですこんにちは。 コロナもいいけどそんなことより花粉がヤバいですね。皆さんお気をつけて。 変異マイニング系の論文を読み漁っておりますので1つ投下します。 Purpose MongoDB…

gVCFとはなんなのか

2020/02/14 一部修正 2020/04/27 NON_REFについて加筆 変異情報を格納するフォーマットといえばVCFファイルが一般的なわけですが、 似たようなフォーマットにgVCFというものがあります。 VCF自体自由度の高いフォーマットなこともあり、gVCFも使用するツール…

RDBとNoSQLのアノテーションDBとしての評価

かの有名なDB、gnomADでは、MongoDBが使われているそうです。 UIのレスポンスも早く、かっちょいいですね。 変異アノテーションデータを格納するDBとしてRDBとNoSQLを比較検討してみた論文があったので要約してみました。 Purpose 変異アノテーション情報を…

Snakemakeを試す - ④ まとめ

はじめに ※本記事はバイオインフォマティクス Advent Calendar 2019の20日目の記事です。 Snakemakeのインストールと概要 → Snakemakeを試す - ① インストールと概要 - ばいばいバイオ チュートリアルの実行 → Snakemakeを試す - ② チュートリアルを実行 - …

Snakemakeを試す - ③ 並列化

前回の続き! 今回は並列化について見ていきます。 前回の例を使って、並列化した場合としてない場合とでどの程度変わるのか実験してみましょう。 ※コマンド実行ログが少々長めです。すっ飛ばしてサクッと読んでください。 Snakemakeにおけるthreadsの意味 …