fastqファイルのクオリティをチェック - FastQC

QCとは バイオインフォマティクスの解析では、通常シーケンサから出力されたリードの配列データを入力データとします。 このデータから、様々な解析を行い、生物学的な意味合いを見出すのですが、 その前に、そのデータが本当に解析する価値のあるものなのか…

配列のクオリティーコントロール - FASTX-toolkit

はじめに FASTX toolkitは、ショートリードのfastqファイルの前処理に使用されるコマンドラインツールの集合です。 低クオリティーのリードを除去したい場合や、クオリティーを基準に塩基をトリミングしたい際等に使用されます。 似たようなツールとしては、…

Sphinxでドキュメント作成 - github.ioでの公開まで

Sphinx とは Python製のドキュメント生成ツール。 特徴としては以下の通り。 reStructuredTextで記述する(プラグインの導入によりMarkdownも可) ドキュメントを複数ファイルに分けて管理することができる 実体はプレーンテキストなのでGit等でバージョン管…

Juliaでパッケージの利用 & OhMyREPLでREPLの強化

パッケージ概要 再利用可能な関数などを集めたスクリプトファイルのことをモジュールと呼びます。 さらに、同系列のモジュールを集めたものをパッケージと呼びます。外部のツールの多くは、このパッケージという単位で公開されています。 そういえばこんなツ…

Rのtmpディレクトリ

R

とあるRのツールを実行した際、こんなエラーが出た。 Fatal error: cannot create 'R_TempDir' Rの一時ディレクトリが作れないと。 なるほど。なんでだ。 R_TempDirという環境変数でディレクトリが設定されているのかと思って下記を打つも登録されていない。…

scRNA解析に有用 - SingleCellExperiment クラス

SingleCellExperimentクラス single cell RNA (scRNA-seq) 解析のためのS4 Classesです。 様々なscRNA-seq解析のパッケージで採用されており、scRNA-seq解析に有用なデータを保持しながら解析を進めることができます。 Bioconductor Bioconductor - SingleCe…

Julianへの道② - 多層ディスパッチ

多層ディスパッチ 多層ディスパッチとは、複数バージョンを持ち、そのバージョンが引数によって区別されるような関数のことを指すらしい。 Python2.4で実装されたmmモジュール内のmultithred関数を参考に、多層ディスパッチの実装について理解を試みた。 単…