Pandasで「ビジネス活用事例で学ぶデータサイエンス入門」を勉強する（第６章）

Python Pandas データ分析

はじめにマーケティング寄りのデータ分析の知識を補うため、以下の本で勉強を始めた。事例ベースな内容で、とても読みやすい。 Pandasも習得したいので、Pandasに翻訳しながら読み進めている。今回は第６章を勉強した。ビジネス活用事例で学ぶデータサイ…

2017-07-05

Pandasで「ビジネス活用事例で学ぶデータサイエンス入門」を勉強する（第５章）

Python Pandas データ分析

はじめにマーケティング寄りのデータ分析の知識を補うため、以下の本で勉強を始めた。事例ベースな内容で、とても読みやすい。 Pandasも習得したいので、Pandasに翻訳しながら読み進めている。今回は第５章を勉強した。ビジネス活用事例で学ぶデータサイ…

2017-07-04

Pandasで「ビジネス活用事例で学ぶデータサイエンス入門」を勉強する（第４章）

Python Pandas データ分析

はじめにマーケティング寄りのデータ分析の知識を補うため、以下の本で勉強を始めた。事例ベースな内容で、とても読みやすい。 Pandasも習得したいので、Pandasに翻訳しながら読み進めている。今回は第４章を勉強した。ビジネス活用事例で学ぶデータサイ…

2017-07-03

Pandasで「ビジネス活用事例で学ぶデータサイエンス入門」を勉強する（第３章）

Python Pandas データ分析

はじめにマーケティング寄りのデータ分析の知識を補うため、勉強を開始した。「チュートリアル的な事例ベースの教材がないかな〜」と色々と探していたところ、ぴったりの良い本が見つかった。第１章と第２章には、データ分析がどういう仕事か書かれている。…

2017-03-18

scikit-learnで近似最近傍探索したいときはLSHForestがある

Python 近傍探索 scikit-learn

2017/8/13追記: LSHForestはパフォーマンスがよろしくないため、0.19からDEPRECATEDとなった。0.21から削除されるようなので、使用しないほうが良い。 scikit-learnでは、ver. 0.16から近似最近傍探索手法のLSHForestが実装されている。LSHForestは、ハッシ…

2017-03-17

Pythonで近似最近傍探索を試したいときはpyflannがちょうど良い

Python 近傍探索

近似最近傍探索とは近似的に近いものを検索してくる技術で、普通に距離を計算して並べて近くにあるものを探すより速い。代表的なライブラリにFLANN（Fast Library for Approximate Nearest Neighbors）があり、これのPythonバインディングがpyflannになる。F…

2017-03-16

scikit-learnで学習した分類器をjoblib.dumpで保存するときはcompressをTrueにするとファイルが一つにまとまって便利

Python scikit-learn

scikit-learnで学習した分類器を保存する場合、joblib.dumpを使用するが、これだと、大量のnpyファイルが作られる。この場合、joblib.dumpのcompressを使うとよい。まず、例えば以下のような、train.pyがあるとする。 #!/usr/bin/env python # -*- coding: u…

2017-03-13

TheanoなKerasをデプロイするときはNginx+uWSGI+Flaskが良さそう

Python Keras Nginx

Kerasで作った画像認識プログラムを、Webサービスの形にしてみようと思い色々ためした。画像認識処理をAPIの形で立ち上げ、フロントから叩くことにした。複雑で大規模な構造のAPIにはならないので、フレームワークにはFlaskを選択した。はじめ、Apache2+m…

2017-03-11

pipでuwsgiのインストールに失敗したのはPythonの共有ライブラリがなかったため

Python

Debianのパッケージとは別で、独自にビルドしたPythonを、/usr/localに置いている。この状態で、uwsgiをpipでインストールしようとしたら、ビルドで失敗した。 $ sudo /usr/local/bin/pip install uwsgi ... *** uWSGI linking *** ... /tmp/ccDFvj9Y.ltran…

洋食の日記

記事をです・ます調で書き始めれば良かったと後悔している人のブログです

Python

Pandasで「ビジネス活用事例で学ぶデータサイエンス入門」を勉強する（第６章）

Pandasで「ビジネス活用事例で学ぶデータサイエンス入門」を勉強する（第５章）

Pandasで「ビジネス活用事例で学ぶデータサイエンス入門」を勉強する（第４章）

Pandasで「ビジネス活用事例で学ぶデータサイエンス入門」を勉強する（第３章）

scikit-learnで近似最近傍探索したいときはLSHForestがある

Pythonで近似最近傍探索を試したいときはpyflannがちょうど良い

scikit-learnで学習した分類器をjoblib.dumpで保存するときはcompressをTrueにするとファイルが一つにまとまって便利

TheanoなKerasをデプロイするときはNginx+uWSGI+Flaskが良さそう

pipでuwsgiのインストールに失敗したのはPythonの共有ライブラリがなかったため