R
最近は専ら最尤推定と格闘しています。最尤推定において、必要なのが尤度関数の最大化。 なんとなく収束する手法を選択して目をを向けてきたものの、そろそろちゃんと理解する必要性を感じたため第一弾として、Nelder-Mead法を理解していこうと思います。 因…
kmeansとは 教師なし学習を用いたクラスタリング手法の1つです。事前情報としてクラスター数(K)を定義してあげることで、指定した数のクラスターにデータを分類することが可能です。 kmeansの具体的なアルゴリズムは下記の通りになります。 各データ に対…
とあるRのツールを実行した際、こんなエラーが出た。 Fatal error: cannot create 'R_TempDir' Rの一時ディレクトリが作れないと。 なるほど。なんでだ。 R_TempDirという環境変数でディレクトリが設定されているのかと思って下記を打つも登録されていない。…
SingleCellExperimentクラス single cell RNA (scRNA-seq) 解析のためのS4 Classesです。 様々なscRNA-seq解析のパッケージで採用されており、scRNA-seq解析に有用なデータを保持しながら解析を進めることができます。 Bioconductor Bioconductor - SingleCe…
以前、jupyter notebookでRのカーネルを使用する方法をご紹介した。 www.kimoton.com そこでは、R markdownのがイイヨ!みたいに終わらせた気がする。 しかし、Rmarkdownは確かにとっても便利な代物なのだが、毎回毎回全部のコードを実行しなければレポート…
以前紹介した(Seuratを駆使する会 ① - ばいばいバイオ) Seuratというsingle cell RNA-seq解析のパッケージの中に、JackStraw Plotというものがある。 single cell RNA-seq解析は、 細胞ごとに遺伝子発現パターンを見る。 その発現パターンでクラスタリング…
SeuratはシングルセルRNA解析で頻繁に使用されるRのパッケージです。 Seuratを用いたscRNA解析について、CCAによるbatch effect除去などを含めた手法を丁寧に解説します。
から、Google's R Style Guideに従おうと思う。 前回の続きである。 bioinfo.hatenablog.com General Layout and Ordering If everyone uses the same general ordering, we'll be able to read and understand each other's scripts faster and more easily…
から、Google's R Style Guideに従おうと思う。 File Names File names should end in .R and, of course, be meaningful. ファイル名は.R にしましょう。 自分のRの師匠は.r使ってました。 彼はgoogle入れませんね。 Identifiers Don't use underscores ( _…
Rmarkdownとは Markdown記法をベースに、チャンクという形でRのコードを記述して評価・出力することができるモノ。 出力形式としてはPDF、 HTML、 Microsoft Word等、あらゆる出力に対応しています。 Airbnbでも使われているらしい。。 https://qiita.com/Ka…
Rのいくつかのパッケージは、標準でUNIXに組み込まれているライブラリのほかに、いくつかのライブラリに依存しているものがある。 こういったものをインストールしようとすると、以下のようなエラーが出る。 Error: package or namespace load failed for ‘p…
An Interface to Google Drive • googledriveを使ってみた 特徴 ほとんどの関数はdrive_で始まっているおかげでgoogledriveパッケージの関数を自動補完で呼び出しやすい。 find, ls, mv, cp, mkdir, rmといったUINIXコマンドを打つようにgoogleドライブを操…
クラスタリングを行ったあと、各クラスタがどんな特徴を持っているのか知りたいときはレーダーチャートを書いたりする。 radarchart関数を使う radarchart(df)でとりあえずのレーダーチャートはかける。ここで与えるデータフレームは df The data frame to b…
k-meansの必要なところだけ。 k-meansとは 非階層的クラスタリング手法の1つ。 要するに何をしているのか k個のクラスターの初期位置を決める。 各データをk個のクラスターとの距離を求め、最も近い位置のクラスターに分類。 形成されたクラスターの中心を…
RのパッケージをCRANから落とす際、 > install.packages(pkg) --- このセッションで使うために、CRAN のミラーサイトを選んでください --- structure(.External(.C_dotTclObjv, objv), class = "tclObj") でエラー: [tcl] grab failed: window not viewable.…
reshape2 ggplot2はRでプロットする際に頻繁に用いられる。 しかし、Excelのデータをcsvにしてそのまま読み込んでggplot2に渡したところで、データの形を勝手に判断してくれるわけがない。ggplotはわがままなので、データの整形という処理が必要だ。 いって…
Rでベン図を描く。 VennDiagramというライブラリが使いやすくて視覚的にもわかりやすかった。 今回6つのデータセットをベン図にplotする必要があったので、6つのベン図ってなんだよと思いつつ、実行してみたら、普通にエラーが出た。VennDiagramの上限は5つ…
GrinnというRのパッケージを使って統合解析を行ったのでまとめておく。あくまでもメモスタイル。 Grinnとは バイオインフォマティクスのプラットフォーム。Neo4jというアプリケーションで使える内部グラフデータベース、オミクス研究向けのRパッケージを含む…