R

最適化手法について学ぶ - Nelder-Mead法

最近は専ら最尤推定と格闘しています。最尤推定において、必要なのが尤度関数の最大化。 なんとなく収束する手法を選択して目をを向けてきたものの、そろそろちゃんと理解する必要性を感じたため第一弾として、Nelder-Mead法を理解していこうと思います。 因…

kmeansをフルスクラッチ実装

kmeansとは 教師なし学習を用いたクラスタリング手法の1つです。事前情報としてクラスター数(K)を定義してあげることで、指定した数のクラスターにデータを分類することが可能です。 kmeansの具体的なアルゴリズムは下記の通りになります。 各データ に対…

Rのtmpディレクトリ

R

とあるRのツールを実行した際、こんなエラーが出た。 Fatal error: cannot create 'R_TempDir' Rの一時ディレクトリが作れないと。 なるほど。なんでだ。 R_TempDirという環境変数でディレクトリが設定されているのかと思って下記を打つも登録されていない。…

scRNA解析に有用 - SingleCellExperiment クラス

SingleCellExperimentクラス single cell RNA (scRNA-seq) 解析のためのS4 Classesです。 様々なscRNA-seq解析のパッケージで採用されており、scRNA-seq解析に有用なデータを保持しながら解析を進めることができます。 Bioconductor Bioconductor - SingleCe…

R Notebookチュートリアル

以前、jupyter notebookでRのカーネルを使用する方法をご紹介した。 www.kimoton.com そこでは、R markdownのがイイヨ!みたいに終わらせた気がする。 しかし、Rmarkdownは確かにとっても便利な代物なのだが、毎回毎回全部のコードを実行しなければレポート…

JackStraw Plot (QQ-plot) を理解する

以前紹介した(Seuratを駆使する会 ① - ばいばいバイオ) Seuratというsingle cell RNA-seq解析のパッケージの中に、JackStraw Plotというものがある。 single cell RNA-seq解析は、 細胞ごとに遺伝子発現パターンを見る。 その発現パターンでクラスタリング…

Seuratを駆使する会 ①

SeuratはシングルセルRNA解析で頻繁に使用されるRのパッケージです。 Seuratを用いたscRNA解析について、CCAによるbatch effect除去などを含めた手法を丁寧に解説します。

Google で働きたい ②

R

から、Google's R Style Guideに従おうと思う。 前回の続きである。 bioinfo.hatenablog.com General Layout and Ordering If everyone uses the same general ordering, we'll be able to read and understand each other's scripts faster and more easily…

Google で働きたい ①

R

から、Google's R Style Guideに従おうと思う。 File Names File names should end in .R and, of course, be meaningful. ファイル名は.R にしましょう。 自分のRの師匠は.r使ってました。 彼はgoogle入れませんね。 Identifiers Don't use underscores ( _…

R markdown のご紹介

Rmarkdownとは Markdown記法をベースに、チャンクという形でRのコードを記述して評価・出力することができるモノ。 出力形式としてはPDF、 HTML、 Microsoft Word等、あらゆる出力に対応しています。 Airbnbでも使われているらしい。。 https://qiita.com/Ka…

【R】共有ライブラリ依存関連のエラー解決法

Rのいくつかのパッケージは、標準でUNIXに組み込まれているライブラリのほかに、いくつかのライブラリに依存しているものがある。 こういったものをインストールしようとすると、以下のようなエラーが出る。 Error: package or namespace load failed for ‘p…

googledrive内のファイルをRから操作 - googledrive

R

An Interface to Google Drive • googledriveを使ってみた 特徴 ほとんどの関数はdrive_で始まっているおかげでgoogledriveパッケージの関数を自動補完で呼び出しやすい。 find, ls, mv, cp, mkdir, rmといったUINIXコマンドを打つようにgoogleドライブを操…

クラスタの特徴を知る - radarchart

R

クラスタリングを行ったあと、各クラスタがどんな特徴を持っているのか知りたいときはレーダーチャートを書いたりする。 radarchart関数を使う radarchart(df)でとりあえずのレーダーチャートはかける。ここで与えるデータフレームは df The data frame to b…

非階層的クラスタリング k-means

k-meansの必要なところだけ。 k-meansとは 非階層的クラスタリング手法の1つ。 要するに何をしているのか k個のクラスターの初期位置を決める。 各データをk個のクラスターとの距離を求め、最も近い位置のクラスターに分類。 形成されたクラスターの中心を…

[tcl] grab failed: window not viewable.

R

RのパッケージをCRANから落とす際、 > install.packages(pkg) --- このセッションで使うために、CRAN のミラーサイトを選んでください --- structure(.External(.C_dotTclObjv, objv), class = "tclObj") でエラー: [tcl] grab failed: window not viewable.…

reshape::melt を用いたデータ整形

R

reshape2 ggplot2はRでプロットする際に頻繁に用いられる。 しかし、Excelのデータをcsvにしてそのまま読み込んでggplot2に渡したところで、データの形を勝手に判断してくれるわけがない。ggplotはわがままなので、データの整形という処理が必要だ。 いって…

ベン図の上限

R

Rでベン図を描く。 VennDiagramというライブラリが使いやすくて視覚的にもわかりやすかった。 今回6つのデータセットをベン図にplotする必要があったので、6つのベン図ってなんだよと思いつつ、実行してみたら、普通にエラーが出た。VennDiagramの上限は5つ…

Grinnを使った統計解析

GrinnというRのパッケージを使って統合解析を行ったのでまとめておく。あくまでもメモスタイル。 Grinnとは バイオインフォマティクスのプラットフォーム。Neo4jというアプリケーションで使える内部グラフデータベース、オミクス研究向けのRパッケージを含む…