Python
HadoopStreaming で xml ファイルを扱う方法の解説です. この記事では,しろかい!のRSSフィードから <title>~</title> を抽出することを目標とします. また,言語は Python を使用します.
HadoopStreaming を 使って Python で Hadoop を動かす方法です. Mapper と Reducer は通常 Java で記述しなければいけませんが,HadoopStreaming を使えば Python などの他の言語で書けるので実装がとても楽になります!
LIBLINEAR を Python から使う方法を解説します. 基本的な学習と予測の方法はもちろんですが,LIBLINEAR がサポートするロジスティック回帰では予測値の確率を得ることもできます.これを Python のコードから取得する方法も紹介します.
自然言語処理ライブラリ「Stanford CoreNLP」を Python から使えるようにするためのインストール方法と,実際の使い方をまとめました.
「Flask」と「Tweepy」を使ってTwitter連携アプリを作成する方法をまとめました. どちらもPythonで実装されたライブラリで,FlaskはWeb開発フレームワーク,TweepyはTwitter APIへのアクセスを簡単にしてくれるライブラリです.
LIBLINEARのパラメータ(cost, bias)をグリッドサーチしてくれるスクリプト「grid_with_bias_and_solver.py」を書きました. ついでにソルバーも最適なものを選択してくれます.
機械学習の1手法であるSVMのライブラリ「LIBSVM」の入力データを,コサイン正規化するPythonスクリプトを書いたので公開します.
機械学習の1手法であるSVMのライブラリ「LIBSVM」の入力データを,標準正規分布に従うようにスケーリング(標準化)するPythonスクリプトを書いたので公開します.