FASTQファイル - 塩基配列を格納するためのフォーマット

お疲れ様です。9月です。寒いです。 本日はバイオインフォマティクスの基礎の基礎。 FASTQファイルについて見ていきましょう。 ショートリードを生成するシーケンサーだと、だいだい <~200 bpの塩基配列を取得できます。 大抵の場合、シーケンサから出力され…

EMBOSSでアライメント

アライメント。 要するに配列を比較し、並べる操作を指します。 遺伝子の発現量を測定したいときなど、遺伝子解析においてはアライメントを必要とする場面が多々登場します。 配列の類似度を表す基準は複数あり、その計算方法も複数あるため、いろんなアライ…

NCBI EntrezからFastaファイルをダウンロード

NCBI Entrez は、30以上もの生物学的な目的で作成されたデータベースに対する統合的なテキストベースの検索、情報抽出システムです。 BiopythonパッケージのBio.Entrezモジュールを使えば、このシステムをpythonから手軽に使えちゃいます。 ちなみに、Bio.En…

Windowsでメモリ計測

WindowでもLinuxのpsコマンドみたいにメモリを監視したい。 以下を参考にした。 takigawa401.hatenablog.com chkmmr.batというバッチファイルを作成する。 @echo off :label01 echo %date% %time% tasklist /fi "imagename eq python.exe" ping localhost -n…

chip-seqを理解する

ChIP-seqとは Chromatin Immuno Precipitaton の略。 抗原抗体反応を利用して、抗原タンパク質が結合しているクロマチン構造を免疫沈降させ、クロマチン内に含まれるDNAを濃縮する手法。 ヒストンや転写因子に対して、それらを認識する抗体を取ってくる。 ゲ…

R notebookチュートリアル

以前、jupyter notebookでRのカーネルを使用する方法をご紹介した。 www.kimoton.com そこでは、R markdowhnのがイイヨ!みたいに終わらせた気がする。 しかし、Rmarkdownは確かにとっても便利な代物なのだが、毎回毎回全部のコードを実行しなければレポート…

JackStraw Plot (QQ-plot) を理解する

以前紹介した(Seuratを駆使する会 ① - Oboretai) Seuratというsingle cell RNA-seq解析のパッケージの中に、JackStraw Plotというものがある。 single cell RNA-seq解析は、 細胞ごとに遺伝子発現パターンを見る。 その発現パターンでクラスタリングを行う…