先日Courseraを紹介しましたが、courseraのコースはフリーではないのでは?とコメントを頂きました。 修了証付きの専門講座に関してはご指摘の通り、有料となっています。一方で、単一のコースを閲覧する分には無料で受けることができるので、その手順をご紹…
最近バイオインフォマティクスを学びたいという方によく巡り合う気がします。 私kimoton、バイオインフォマティクスと名の付く書籍は多数読み漁ってまいりました。そんな経験を活かし、今回は無料かつオンライン上で利用できるコンテンツに絞ってご紹介させ…
つい数年前までは、「DNA検査」と言うと父子鑑定を思い浮かべる方がほとんどでしたが、最近では日本でもDeNAのMyCodeやGenesis HealthcareのGeneLife、高橋祥子社長で有名なGene Questなど、様々な個人向け遺伝子検査サービスが出てきており、その認識が変わ…
ここまでで紹介してきた生存関数の推定やハザード関数の推定、ログランク検定といったノンパラメトリックな手法は、一標本の生存時間データ解析、二群間の比較に有用な方法になります。 一方で、実際の医学研究では、個々の被験者について、生存・死亡といっ…
GATKやSAMtoolsなどの変異解析ツールを実行した際に、含まれていた一塩基変異(SNP)、挿入(Insert)、欠失(Deletion)等の情報はVCFファイルというフォーマットで出力されます。 VCFファイルのフォーマットに関しては、GATKの説明ページを参照してくださ…
インストール手順は大抵conda かpipで可能なので、これらをいちいち紹介しても仕方ない気がしてきました。今回からインストール部分は省いてご紹介します。 前回の記事ではアライメント情報を格納するためのフォーマット、BAM/SAMファイルをご紹介しました。…
通常シーケンサからの配列データ(FASTQファイルなど)を取得した後、アライメントツールを使用してリファレンスゲノムに対して各リード配列をマッピングすることになります。そんなアライメントしたリードの情報を格納するためのデータフォーマットが、本日…