HadoopStreaming で xml ファイルを処理する

Hadoop Python

HadoopStreaming で xml ファイルを扱う方法の解説です．この記事では，しろかい！のRSSフィードから <title>~</title> を抽出することを目標とします．また，言語は Python を使用します．

HadoopStreaming で MapReduce を Python で動かす

Hadoop Python

HadoopStreaming を使って Python で Hadoop を動かす方法です． Mapper と Reducer は通常 Java で記述しなければいけませんが，HadoopStreaming を使えば Python などの他の言語で書けるので実装がとても楽になります！

機械学習 Python

LIBLINEAR を Python から使う方法を解説します．基本的な学習と予測の方法はもちろんですが，LIBLINEAR がサポートするロジスティック回帰では予測値の確率を得ることもできます．これを Python のコードから取得する方法も紹介します．

Python 自然言語処理

自然言語処理ライブラリ「Stanford CoreNLP」を Python から使えるようにするためのインストール方法と，実際の使い方をまとめました．

Python Web開発

「Flask」と「Tweepy」を使ってTwitter連携アプリを作成する方法をまとめました．どちらもPythonで実装されたライブラリで，FlaskはWeb開発フレームワーク，TweepyはTwitter APIへのアクセスを簡単にしてくれるライブラリです．

Python 機械学習

LIBLINEARのパラメータ（cost, bias）をグリッドサーチしてくれるスクリプト「grid_with_bias_and_solver.py」を書きました．ついでにソルバーも最適なものを選択してくれます．

Python 機械学習

機械学習の1手法であるSVMのライブラリ「LIBSVM」の入力データを，コサイン正規化するPythonスクリプトを書いたので公開します．

Python 機械学習

機械学習の1手法であるSVMのライブラリ「LIBSVM」の入力データを，標準正規分布に従うようにスケーリング（標準化）するPythonスクリプトを書いたので公開します．