しろかい!

アプリ開発や機械学習などの開発Tips.

Python

HadoopStreaming で xml ファイルを処理する

HadoopStreaming で xml ファイルを扱う方法の解説です. この記事では,しろかい!のRSSフィードから <title>~</title> を抽出することを目標とします. また,言語は Python を使用します.

HadoopStreaming で MapReduce を Python で動かす

HadoopStreaming を 使って Python で Hadoop を動かす方法です. Mapper と Reducer は通常 Java で記述しなければいけませんが,HadoopStreaming を使えば Python などの他の言語で書けるので実装がとても楽になります!

【LIBLINEAR】Pythonから使う方法と確率値の取得方法

LIBLINEAR を Python から使う方法を解説します. 基本的な学習と予測の方法はもちろんですが,LIBLINEAR がサポートするロジスティック回帰では予測値の確率を得ることもできます.これを Python のコードから取得する方法も紹介します.

Stanford CoreNLP を Python から使う方法まとめ

自然言語処理ライブラリ「Stanford CoreNLP」を Python から使えるようにするためのインストール方法と,実際の使い方をまとめました.

【Python】Flask+TweepyでTwitter連携アプリを作る

「Flask」と「Tweepy」を使ってTwitter連携アプリを作成する方法をまとめました. どちらもPythonで実装されたライブラリで,FlaskはWeb開発フレームワーク,TweepyはTwitter APIへのアクセスを簡単にしてくれるライブラリです.

LIBLINEARのパラメータをグリッドサーチするスクリプト書いた

LIBLINEARのパラメータ(cost, bias)をグリッドサーチしてくれるスクリプト「grid_with_bias_and_solver.py」を書きました. ついでにソルバーも最適なものを選択してくれます.

LIBSVMの学習データをコサイン正規化するスクリプト書いた

機械学習の1手法であるSVMのライブラリ「LIBSVM」の入力データを,コサイン正規化するPythonスクリプトを書いたので公開します.

LIBSVMの学習データを正規分布に従うようにスケーリングするスクリプト書いた

機械学習の1手法であるSVMのライブラリ「LIBSVM」の入力データを,標準正規分布に従うようにスケーリング(標準化)するPythonスクリプトを書いたので公開します.