gVCFとはなんなのか

2020/02/14 一部修正 変異情報を格納するフォーマットといえばVCFファイルが一般的なわけですが、 似たようなフォーマットにgVCFというものがあります。 VCF自体自由度の高いフォーマットなこともあり、gVCFも使用するツールによって色々なフォーマットがあ…

RDBとNoSQLのアノテーションDBとしての評価

かの有名なDB、gnomADでは、MongoDBが使われているそうです。 UIのレスポンスも早く、かっちょいいですね。 変異アノテーションデータを格納するDBとしてRDBとNoSQLを比較検討してみた論文があったので要約してみました。 Purpose 変異アノテーション情報を…

Snakemakeを試す - ④ まとめ

はじめに ※本記事はバイオインフォマティクス Advent Calendar 2019の20日目の記事です。 Snakemakeのインストールと概要 → Snakemakeを使って再現性のある!スケーラブルな!可搬性のある解析! - ① - ばいばいバイオ チュートリアルの実行 → Snakemakeを使…

Snakemakeを試す - ③ 並列化

前回の続き! 今回は並列化について見ていきます。 前回の例を使って、並列化した場合としてない場合とでどの程度変わるのか実験してみましょう。 ※コマンド実行ログが少々長めです。すっ飛ばしてサクッと読んでください。 Snakemakeにおけるthreadsの意味 …

Snakemakeを試す - ② チュートリアルを実行

明日やろうは馬鹿野郎。 前回の続き。 では準備もできたということで、やっていきしょうshort tutrial このチュートリアルは、ざっくりと決められたワークフローを組んでいくことでSnakemakeと仲良くなろうという趣旨のものです。 内容はバイオインフォマテ…

Snakemakeを試す - ① インストールと概要

お疲れ様です。 ここのところバイオインフォに触れられず何か物足りないkimotonです。 最近はMLOps周りの基盤作りに関わっています。 ナンデダロ。 Snakemakeってなにー?? githubリポジトリは下記。 The Snakemake workflow management system is a tool t…

23万のPCを購入しましたよ

お久しぶりです。 なんとこの度転職しました。 つきましては今まで使ってたPC(名前はHPちゃん)が没収されました。 さらばHPちゃんいままでありがとう。 つきましては新たなPCを購入しようと思います。 じゃん!こちらです。 www.lenovo.com ThinkPad X1 Ca…