Entrez Direct(EDirect)を使った情報抽出

NCBI Entrezは、30以上もの生物学的な目的で作成されたデータベースに対する統合的なテキストベースの検索、情報抽出システムです。 このシステムは、国立バイオテクノロジー情報センター(NCBI)によって作成されています。 APIはE-utilitiesと呼ばれ、これ…

最適化手法について学ぶ - Nelder-Mead法

最近は専ら最尤推定と格闘しています。最尤推定において、必要なのが尤度関数の最大化。 なんとなく収束する手法を選択して目をを向けてきたものの、そろそろちゃんと理解する必要性を感じたため第一弾として、Nelder-Mead法を理解していこうと思います。 因…

VCF-Explorer: WGSのVCFファイルの変異をフィルタリング、分析するためのソフトウェア

最近はブロックチェーンと秘密計算技術が気になります。あれはゲノム医療の実現に向けてとても有用なのではないですか。まだ勉強途中なので何とも言えないですが、とても魅力的な技術であることは間違いなさそうです。 今回は来たるWGS時代に向けた変異解析…

Sparse Project VCF : 遺伝子型行列の効率的なエンコーディング

VCFという形式は色々と問題を抱えており、その代替案はこれまでも幾度となく考案されてきました。 その1つであり注目を浴びているspVCF(Sparse Project VCF)というフォーマットに関する論文に関しての論文を読んだ際のメモを投下します。 www.biorxiv.org …

SAM/BAMフォーマットは10年モノだっていう話

SAM/BAMといえばアライメントデータを格納するためのフォーマットとして一般的に使用されていますが、そもそもこのフォーマットはどういう経緯で生まれたのでしょう。 開発者であるHeng Li氏のブログにてその話があったため、読んでみました。サクッと読めま…

楽天・ジェネシスヘルスケアが出した新型コロナPCR検査キットに関する問題点まとめ

珍しくタイムリーな記事を書きます。 シーケンスコストが低下したことにより、DeNAやYahoo!、DHC、そのほか多数の企業が消費者直販型遺伝子検査ビジネス、DTCGT(Direct-to-Consumer Genetic Testing)分野に参画しています。 これらは現在、病院など医療機…

VCFファイルの表記揺れについて

VCF(Variant Caller Format)は、一塩基変異(SNP)、挿入・欠損(INDEL)、および構造変異(SV)を表すために使用される標準化されたテキストファイルフォーマットです。詳細に知りたい方はGATKの説明ページを参照してください。 このフォーマットを用いる…