交差テーブルの命名法

きっかけ RDBにおいて、変異と患者、変異とメタデータ等、多対多の関係で複数のテーブルを紐づける際に必要なのが(厳密に言うと定義すべきなのが)、交差テーブルです。 (参照:SQLアンチパターン - ジェイウォーク) この命名法として、variants_patients…

tqdmでプログレスバーを表示!

ちょこっと便利シリーズ第二弾!! github.com pythonのプログラムを書いていて、プログレスバーを表示したいときってありません?? tqdm はそんなあなたのためのツールです。 tqdm means "progress" in Arabic (taqadum, تقدّم) and is an abbreviation fo…

.editorconfigでチーム開発しようよ

本日ご紹介するのはこちらの商品! ででん! editorconfig.org え、君インデントがタブ使ってるの?? 改行コードがなんか違くないこれ? 意味のない空白だらけのコード PEP8則ってないじゃんか。。 こんなお悩みに答えてくれます。 エディタをまたいで、プ…

pythonで実証する、正規分布 ~ 中心極限定理

連休初日から2日連続有給ぶちかましたkimotonですこんにちは。 中心極限定理とは 大数の法則によると、ある母集団から無作為抽出した標本の平均は標本の大きさを大きくすると母平均に近づく。これに対し中心極限定理は標本平均と母平均との誤差を論ずるもの…

データの変換をコマンドラインで!csvkit

概要 コマンドライン使ってますか! シェル芸人の皆さんは日常茶飯事でしょうけど、そこまで極めることなしに手軽に身近なデータ分析に組み込むことのできるツールをご紹介します。 その名も! csvkit! github.com すぐに特定の変換方法が知りたいせっかち…

kmeansをフルスクラッチ実装

kmeansとは 教師なし学習を用いたクラスタリング手法の1つです。事前情報としてクラスター数(K)を定義してあげることで、指定した数のクラスターにデータを分類することが可能です。 kmeansの具体的なアルゴリズムは下記の通りになります。 各データ に対…

SRA-toolkitを使ってサンプルデータをダウンロード

次世代シーケンサー(NGS)データを学術論文で公表する場合、シーケンサーから出力された配列データやアノテーションに関するデータを公共データベースに登録することが必要です。 このデータ群が登録される先が、International Nucleotide Sequence Database …

骨髄におけるlineage-negativeな細胞とは

Lineage makerとは 一般にLinと略語で書かれることが多く,既知の成熟免疫系細胞で発現している抗原の総称.CD3(T細胞),CD19(B細胞),NK1.1(NK細胞),CD11c(樹状細胞),CD11b(単球),FcεRI(マスト細胞),Gr-1(顆粒球)などが使われることが多…

Identifying cell populations with scRNASeq

Purpose scRNA-seq解析について知見を深める Title Identifying cell populations with scRNASeq Author Tallulah S.Andrews, Martin Hemberg Motivation これまでは、分子特性ではなく形態学に基づいた200種類程度までのセルタイプの判定を行っていた。 前…

DANN: a deep learning approach for annotating the pathogenicity of genetic variants

Purpose 個別化医療に向け、変異のpathogenicity (悪性) に関する関心は高まっている。 Deep Learningを使用したアプローチにより変異のpathogenicityをどこまで判断することができるのか把握する。 Title DANN: a deep learning approach for annotating th…

Creating a universal SNP and small indel variant caller with deep neural networks

Purpose 配列データにDeep learningを適用する例を把握する。 巷に聞くDeepVariantがどの程度の検出精度を持つのか調査する。 Title Creating a universal SNP and small indel variant caller with deep neural networks Author Ryan Poplin, Pi-Chuan Chan…

もっと論文を読みたい

Intro 時は令和。 kimotonはもっと論文を読みたいと思った。 読みたいなら読めばいいじゃないかといわれそうだが、違う。習慣化してかつ効率良くちゃんと理解して読みたいのだ。 そして構成をブログの構成をIntro、Main、Conclusionの3段構成にすることにし…

Scanpyを使ったscRNA解析

GW始まってしまいましたね。 ブログの更新をだいぶ怠っていたので、ちゃっかり更新させて頂きます。 今日はPythonでscRNA-seq解析。Python実装のscRNA解析ツールといえばScanpyがまず思いつきます。 Seuratに比べてそこまで使われていない印象ですが、機能的…

リファレンス配列をリフトオーバー

以前の記事でリファレンス配列についてだらだらと書かせて頂きました。 www.kimoton.com 手持ちのデータは最新のhg19でマッピングされているけれど論文の情報はhg38でのマッピングが行われている場合など、異なるアセンブリのデータを取得したい場合、本来は…

リファレンス配列のお話(GRCh38-hg38-b37-hg19)

今回はリファレンス配列についてご紹介。 リファレンス配列というのは、既知の配列のことを指します。 リシーケンシング解析では、このリファレンス配列と個々の生物のゲノム配列を比較することで、置換、逆位、欠失/挿入などのわずかな配列の違いを明らか…

Juliaでpermutation

本日のお題。 与えられた配列の全permutationを取得する方法について、pythonとjuliaで書いてみる。 1から書いてもいいのですが、実用性を考えてパッケージを使用した方法をご紹介。 Python編 itertoolsパッケージのproduct関数を使用します。 引数にはitera…

(勉強会用メモ) REST APIs with Django : Chapter 2-3

勉強会 ちょっと業務でRESTfulなAPIを作成する必要が出てきました。 3/27 (水) に再度勉強会開くのでぜひ。 connpass.com 3/14の内容復習編。 Djangoプロジェクトの作成 Python環境にはpipenvを使用します。 # 仮想環境の作成(python 3.6) $ pipenv instal…

(勉強会用メモ) REST APIs with Django : Chapter 1

勉強会 ちょっと業務でRESTfulなAPIを作成する必要が出てきました。 3/14 (水) にこの本使って勉強会開くのでぜひ。 そのための予習メモ。 connpass.com WWW (World Wide Web) 1960年代に登場したが、初期は孤立したネットワークとして存在した(軍事、科学…

Seurat v3.0って何がすごいのか

まだプレリリース版のSeruat v3.0ですが、 10Xのサイトで以下のように言及されたことにより、こちらを使用する人が増えている気がします。 Seurat 3.0 is specifically designed to handle the type of multi-data experiments enabled by Feature Barcoding…

Ansibleもくもく会 (サーバ編)に参加してきたお話

最近ブログが滞ってきていて。 Ansibleが触りたくなってきていて。 ブログ枠が空いていたAnsibleもくもく会 (サーバ編)に参加してきました! ansible-users.connpass.com Ansibleもくもく会とは Ansible 及び Ansible Towerに関してもくもく勉強をしていく…

WSLでnode.jsの環境構築

github.com apt-getで入手できるnode.jsはバージョンがかなり古い。 複数のバージョン管理が可能かつ最新版のnode.jsもインストール可能なnodebrewを使用すると、いろいろ楽ができるという話。 WSLと書いてはいるけれど、WSLに限った話ではないです。 前準備…

Single-cell RNA sequencing 技術に関するreview

論文要約シリーズ第1弾! 論文じゃなかったレビューだった。 Single-cell RNA sequencing technologies and bioinformatics pipelines Experimental & Molecular Medicinevolume 50, Article number: 96 概要 Single-cell RNA sequencing (scRNA-seq) は、が…

gitで忘れがちなコマンド一覧

git

概要 よく使うけど忘れがちなコマンドをメモメモ。 プロジェクトの開始 git管轄下に置きたいとき。 $ cd [対象ディレクトリ] $ git init $ git remote add origin git@github.com:[ユーザ名/リポジトリ名.git] 新規でディレクトリから作る場合、git init [デ…

Docker for Windows & WSLでファイルシステムのマウント

話題 Docker for Windows & WSLだと、dockerのマウント機能がうまく作用しないとか何とか。 Docker for WindowsをWSLから使う時のVolumeの扱い方 - Qiita Docker-compose and incorrect absolute paths for volumes · Issue #1854 · Microsoft/WSL · GitHub …

次世代のdocker、Docker BuildKit

噂によると、次世代感満載のdockerが使えるようになっているらしい。 その名も、BuildKit。 Docker 18.06より実験的に使用可能だったものが,Docker 18.09にて正式に採用されたとか。 Docker Build Meetupで盛んに話されていたようです。以下のまとめが美し…

Dockerfileでプライベートリポジトリからレポジトリをclone

Dockerfileでプライベートリポジトリからレポジトリをclone。 わかります?? 以下の記事を参考にしました。 vsupalov.com 通常このように書けばいいと思われがち。 というか自分はこれでいいと思っていた。 ARG SSH_PRIVATE_KEY RUN mkdir /root/.ssh/ RUN …

バイオインフォマティクスのコンペ - Bioinformatics Contest 2019

今日はとあるコンペのご紹介を使用と思う。 その名も、Bioinformatics Contest 2019! Online programming competition among individuals organized annually by Bioinformatics Institute in cooperation with ITMO University 毎年、Bioinformatics Insti…

ansiblerへの道 - ansibleのテストをDockerで

概要 昔こんな記事を書いたことがあった。 www.kimoton.com ssh接続できるDockerイメージを作成してansibleのtargetノードとして使用する、的なモノだ。 まぁこの記事ではssh接続できるようにしただけで終わってたのだけど。。 Docker イメージをansibleのテ…

これで決まり!最強自動コード整形ツール3選!

いやいや何が決まり!だよ、全然決まらねーよっていうタイトルすみません。 きっかけ 自動コード整形ツール。弊社では全く導入されていない。 何故か。 知らないからだ。 vimプラグインと手作業での修正という現状だ。 これはどげんかせんといかん。 代表的…

実践投入!pipenv!

概要 新しいも面白いも楽しいも正義なんだよ— いちたる (@_kimoton) December 18, 2018 ということで、やっていきましょうpipenv 前回の以下の記事ではPipenvのインストールとPython3.7.1環境の作成を行いました。 今回はもうちょっと真面目にPipenvを使って…