pythonで実証する、正規分布 ~ 中心極限定理

連休初日から2日連続有給ぶちかましたkimotonですこんにちは。 中心極限定理とは 大数の法則によると、ある母集団から無作為抽出した標本の平均は標本の大きさを大きくすると母平均に近づく。これに対し中心極限定理は標本平均と母平均との誤差を論ずるもの…

データの変換をコマンドラインで!csvkit

概要 コマンドライン使ってますか! シェル芸人の皆さんは日常茶飯事でしょうけど、そこまで極めることなしに手軽に身近なデータ分析に組み込むことのできるツールをご紹介します。 その名も! csvkit! github.com すぐに特定の変換方法が知りたいせっかち…

kmeansをフルスクラッチ実装

kmeansとは 教師なし学習を用いたクラスタリング手法の1つです。事前情報としてクラスター数(K)を定義してあげることで、指定した数のクラスターにデータを分類することが可能です。 kmeansの具体的なアルゴリズムは下記の通りになります。 各データ に対…

SRA-toolkitを使ってサンプルデータをダウンロード

次世代シーケンサー(NGS)データを学術論文で公表する場合、シーケンサーから出力された配列データやアノテーションに関するデータを公共データベースに登録することが必要です。 このデータ群が登録される先が、International Nucleotide Sequence Database …

骨髄におけるlineage-negativeな細胞とは

Lineage makerとは 一般にLinと略語で書かれることが多く,既知の成熟免疫系細胞で発現している抗原の総称.CD3(T細胞),CD19(B細胞),NK1.1(NK細胞),CD11c(樹状細胞),CD11b(単球),FcεRI(マスト細胞),Gr-1(顆粒球)などが使われることが多…

Identifying cell populations with scRNASeq

Purpose scRNA-seq解析について知見を深める Title Identifying cell populations with scRNASeq Author Tallulah S.Andrews, Martin Hemberg Motivation これまでは、分子特性ではなく形態学に基づいた200種類程度までのセルタイプの判定を行っていた。 前…

DANN: a deep learning approach for annotating the pathogenicity of genetic variants

Purpose 個別化医療に向け、変異のpathogenicity (悪性) に関する関心は高まっている。 Deep Learningを使用したアプローチにより変異のpathogenicityをどこまで判断することができるのか把握する。 Title DANN: a deep learning approach for annotating th…