Selenium備忘録

今友達からbed365 というサイのスクレイピングを任されている。ブックメーカーで有名なサイトだ。ここのデータを集めて解析したいらしい。 スクレイピングでは基本ChromeDriverを使って行っているのだが、久しぶりに動かしたら、以下のようなエラーが度々表…

IPython データサイエンスクックブック memo (2)

2.4 Workflow using git branch git stash commitしていない変更の一時退避 git stash pop 変更を戻す 2.5 High reproductivce, interactive computing ファイルの命名規則、ディレクトリ構造を一貫性のあるものにする。 全てのソフトウェアスタックの正確な…

IPython データサイエンスクックブック memo (1)

1.1 Introduction %%writefile IPython magicコマンド。テキストファイルの作製。 インラインの数式は$...$ を使って記述。 独立した数式は $$...$$ を使って記述。 HTML() 、SVG() 、YouTubeVideo() nbviewerを使ってIPythonで生成したJSONテキストを公開可…

日常 Part2

修士をとるか、就職か 修士に行くか、就職してしまうか。 修士に行く場合、今の研究をあと二年続ける。 就職する場合、今のインターン先に就職する。二年もあれば、多分転職する。 理系なら誰しも少しは考えるだろう。本来院試前に考えることだ。 院試を受け…

日常 Part1

30分前に気づいた。今日はもう30分しかないということを。 毎日更新するんだ。今度こそ。 最近はOreillyの本をひたすら読み進めている。 いまは下記の2冊をソースコードとともに楽しんでいる。 Pythonによるデータ分析入門 ―NumPy、pandasを使ったデータ処理…

Twitterを始めた。

恥ずかしい。 なにが恥ずかしいかって、Twitterをいまさら始めたことじゃない。 これはアカウントを分けただけで、今Twitterを始めたわけじゃない。 過去の記事が恥ずかしい。 だいぶ消した。大幅に消した。 心機一転、 new kimoton で頑張ろう。年も明けた…

repr()、str()、eval() のお話

Biopython Tutorial and Cookbookの和訳を行ってる最中。 >>> from Bio import SeqIO >>> for seq_record in SeqIO.parse("ls_orchid.gbk", "genbank"): ... print(repr(seq_record.seq)) Seq('CGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTGATGAGACCGTGG...CG…