2018-01-01から1年間の記事一覧

JackStraw Plot (QQ-plot) を理解する

以前紹介した(Seuratを駆使する会 ① - ばいばいバイオ) Seuratというsingle cell RNA-seq解析のパッケージの中に、JackStraw Plotというものがある。 single cell RNA-seq解析は、 細胞ごとに遺伝子発現パターンを見る。 その発現パターンでクラスタリング…

jupyter notebook で R

jupyter notebook で Rを使う。 IPython notebook から Jupyter notebookになった所以として、Python以外のカーネルに対応したからだという。 ただデフォルトではpythonしか使えないではないか。 ということで使えるようにしてみた。 Requirements Jupyter n…

ipython布教活動

細かいことは気にせず、 ipythonを使うべし。 IPython IPythonは、対話的コンピューティングと、並列コンピューティングを行うためのオープンソースプラットフォームです。 機能をご紹介しましょう。 補完機能 pythonインタプリタでTab補完機能を使うことが…

java をwget → alternativesで管理 (JDK 10のインストール)

JDK10が出たらしいですね。 最近知りました。 alternativesを使えば、javaのバージョン管理が簡単にできちゃいます。 ダウンロードも簡単にできちゃいます。 いちいち面倒ですよね。wgetで落としたいですよね。 ここを参考にしました。ダウンロード先のリン…

Docker hubにDockerfileがない!

メタゲノム解析で使うqiime2のDockerイメージをプルしたときのこと。 中身が気になってDockerfileを見に行った。 ところが、、 Dockerイメージがなかった。Docker hub上に、なかったのだ。 何言ってんの? つまりこういうこと。 通常、Docker hubにあがって…

綺麗なコードを書いて下さい。

と言われた。 そうか。これは綺麗なコードじゃないのか。 いいだろう従おう。 ほしい関数 リストを受け取り、偶数個ずつリストで返すジェネレータ関数。 以下みたいな挙動を示すreturn_even_listを実装したい。 list1 = [1, 2, 3, 4, 5, 6] for i in return_…

メモリの監視とインスタンスの決定

AWSやAzureに移行したい。 そんな時、インスタンスのスペックを決定する必要がある。 インスタンスのスペックを決定するには、 メモリサイズ CPU数 ストレージサイズ の3つがわかればよい。 以下のようなスクリプトを使えば、実行しているプロセスに関するps…

ansiblerへの道 - sshログインできるDocker コンテナを立てる -

ansiblerになりたい、、!! ansibleというよりdockerの記事です。ご容赦ください。 きっかけ 巷にあふれているansibleに関する文献は、大抵Vagrantを使って仮想マシンを立てている。 しかし、Vagrantはとっても重い。 マシンの作成にも、起動にもとっても時…

$500を手にしたいKagglerへ

KaggleのKernelには先日からお世話になっている訳ですけども。 いっつもね。気になってたんですよ。 !! ついにクリックしてしまいましたよ。 これはいったいなんなのか。 どうやらKaggleでは、毎週、過去14日間に公開されたKaggle Datasetsを使用しているK…

Kaggle入門1-②

Kaggleを制するにはKernelを制すべし。って誰かが言っていたので、適当なKernelを動かしてみることにしました。 www.kimoton.com の続きです。 前回までのあらすじ。 データの前処理(Imputation)を行った後、 様々な側面からデータを可視化した結果、性別…

Kaggle入門1-①

さぁやって参りました。 Kaggle入門編第一回目。 Kaggleを制するにはKernelを制すべし。って誰かが言っていたので、適当なKernelを動かしてみることにしました。 今回は、Samson Qian氏(きっとスゴイ人)のKernelである Titanic: Beginner's Guide with skl…

Seuratを駆使する会 ①

SeuratはシングルセルRNA解析で頻繁に使用されるRのパッケージです。 Seuratを用いたscRNA解析について、CCAによるbatch effect除去などを含めた手法を丁寧に解説します。

Github Flow × WIP PR開発フローを考えた。

きっかけ 開発フローが中途半端に定まってない。 社内で何か知識共有をしたかった WIPでプルリク出すとか、なんかかっこいい。 slideshipでスライド作ってみたかった。 スライド作った。 良かったら見てってくださいな。 slideship使って作ったけどもう使い…

Google で働きたい ②

R

から、Google's R Style Guideに従おうと思う。 前回の続きである。 bioinfo.hatenablog.com General Layout and Ordering If everyone uses the same general ordering, we'll be able to read and understand each other's scripts faster and more easily…

Google で働きたい ①

R

から、Google's R Style Guideに従おうと思う。 File Names File names should end in .R and, of course, be meaningful. ファイル名は.R にしましょう。 自分のRの師匠は.r使ってました。 彼はgoogle入れませんね。 Identifiers Don't use underscores ( _…

R markdown のご紹介

Rmarkdownとは Markdown記法をベースに、チャンクという形でRのコードを記述して評価・出力することができるモノ。 出力形式としてはPDF、 HTML、 Microsoft Word等、あらゆる出力に対応しています。 Airbnbでも使われているらしい。。 https://qiita.com/Ka…

`maximal number of DLLs reached...

simpleSingleCellライブラリを入れようとしたら。。 Error in dyn.load(file, DLLpath = DLLpath, ...) : unable to load shared object '~~~': `maximal number of DLLs reached... エラーがでた。 ダイナミックリンクライブラリ (Dynamic Link Library: DL…

【Python】アンダースコア( _ )の使い方(特殊属性、dunders)

アンダースコアなのかアンダーバーなのか そんなことはどっちでも良い。 問題はpythonでアンダースコア(アンダーバー)がよく登場することだ。 お品書き。 1つのアンダースコアから始まる属性名(_var) 2つのアンダースコアから始まる属性名(__var) 1つ…

WSLでVagrant仮想環境構築

Dockerの繁栄により、昨今全く脚光を浴びることがなくなったVagrant Support Hyper-V provider within WSL by chrisroberts · Pull Request #9943 · hashicorp/vagrant · GitHub 18日前にVagrant v 2.1.2がreleaseされ、上記のissueが対応された。 Vagrantに…

とりあえず.gitconfigをいじっとけという話。

Pythonプロフェッショナルプログラミング 第3版作者:株式会社ビープラウド秀和システムAmazon これすんごい良いです。 まだChapter 06までしか読んでないんですけども。 すんごいよさそうです。 プロフェッショナルプログラミングだからプロプロって呼ぶんか…

【R】共有ライブラリ依存関連のエラー解決法

Rのいくつかのパッケージは、標準でUNIXに組み込まれているライブラリのほかに、いくつかのライブラリに依存しているものがある。 こういったものをインストールしようとすると、以下のようなエラーが出る。 Error: package or namespace load failed for ‘p…

markdown 表 幅 変えたい

2020/02/21 カラム名の中央揃え追記 -- こんな検索ワードで検索したあなたが引っかかってくれると信じて。 option description -i indexファイル名 -o outputファイル名 -b ブートストラップの回数 --single single-end の場合、付ける。 -l 平均のフラグメ…

GNU datamash を使って転置

バイオインフォで扱うデータってcolumnが多い場合が多々あります。 例えば、10X Genomicsの公開データ(bam)をsamtoolsで見てみると。 kimoton@DESKTOP-BL78EM7:~$ samtools view http://s3-us-west-2.amazonaws.com/10x.files/samples/cell-exp/2.1.0/pbmc…

R 3.5.0 へのアップデート(PPA利用)

きっかけ 最近のRパッケージ(今回はsinglecell解析に使うパッケージ)がR 3.5.0でないと動かない。。 Bioconductor - SingleCellExperiment (development version) R 3.5.0入れたdocker imageを動かそうとも考えたけど、データのマウントとか面倒そう。。 W…

googledrive内のファイルをRから操作 - googledrive

R

An Interface to Google Drive • googledriveを使ってみた 特徴 ほとんどの関数はdrive_で始まっているおかげでgoogledriveパッケージの関数を自動補完で呼び出しやすい。 find, ls, mv, cp, mkdir, rmといったUINIXコマンドを打つようにgoogleドライブを操…

WSL (Windows Subsystem for Linux) で文字化け

An Interface to Google Drive • googledriveこれ使ってgoogledriveをコマンドからいじれるようにしたかったのにそもそもWSL内にgoogle-chromeが入ってなかった。 google-chromeをインストール google-chromeをインストールします。 署名鍵のダウンロード、…

クラスタの特徴を知る - radarchart

R

クラスタリングを行ったあと、各クラスタがどんな特徴を持っているのか知りたいときはレーダーチャートを書いたりする。 radarchart関数を使う radarchart(df)でとりあえずのレーダーチャートはかける。ここで与えるデータフレームは df The data frame to b…

非階層的クラスタリング k-means

k-meansの必要なところだけ。 k-meansとは 非階層的クラスタリング手法の1つ。 要するに何をしているのか k個のクラスターの初期位置を決める。 各データをk個のクラスターとの距離を求め、最も近い位置のクラスターに分類。 形成されたクラスターの中心を…

[tcl] grab failed: window not viewable.

R

RのパッケージをCRANから落とす際、 > install.packages(pkg) --- このセッションで使うために、CRAN のミラーサイトを選んでください --- structure(.External(.C_dotTclObjv, objv), class = "tclObj") でエラー: [tcl] grab failed: window not viewable.…

共有ライブラリ

Rの標準ライブラリ(pngなど)がないと怒られた。 入れようとしたら、 install.packages("png") ・ ・ ・ ** testing if installed package can be loaded Error: package or namespace load failed for ‘png’ in dyn.load(file, DLLpath = DLLpath, ...): 共…