しろかい!

アプリ開発や機械学習などの開発Tips.

HadoopStreaming で xml ファイルを処理する

HadoopStreaming で xml ファイルを扱う方法の解説です. この記事では,しろかい!のRSSフィードから <title>~</title> を抽出することを目標とします. また,言語は Python を使用します.

HadoopStreaming で MapReduce を Python で動かす

HadoopStreaming を 使って Python で Hadoop を動かす方法です. Mapper と Reducer は通常 Java で記述しなければいけませんが,HadoopStreaming を使えば Python などの他の言語で書けるので実装がとても楽になります!

【LIBLINEAR】cross validationに使う評価尺度を変更する方法

LIBLINEARで cross validation (クロスバリデーション, 交差検定) を行う時は,評価指標として Accuracy が用いられます.しかし,用途によってはF 値など,他の指標を使いたい時もあるかと思います. というわけで,本記事では LIBLINEAR の cross validati…

【LIBLINEAR】Pythonから使う方法と確率値の取得方法

LIBLINEAR を Python から使う方法を解説します. 基本的な学習と予測の方法はもちろんですが,LIBLINEAR がサポートするロジスティック回帰では予測値の確率を得ることもできます.これを Python のコードから取得する方法も紹介します.

LIBLINEARをインストールして簡単な予測を行う

ロジスティック回帰を使って簡単に多クラス分類ができるライブラリ「LIBLINEAR」のインストール方法と,基本的な2つのコマンドである train と predict (学習と予測) の使い方のまとめです. LIBLINEAR は線形分類に特化しており,計算が非常に高速です. (…

Stanford CoreNLP を Python から使う方法まとめ

自然言語処理ライブラリ「Stanford CoreNLP」を Python から使えるようにするためのインストール方法と,実際の使い方をまとめました.

Rails Tutorial 全部読んだので感想とかまとめとか

Ruby on Rails チュートリアル を1ヶ月ほどかけて全て読み終えたので,内容を簡単にまとめておきます. チュートリアルを読む際に参考にしたページもまとめておいたので,これから読まれる方の参考になれば幸いです.

【Mac】「Get Plain Text」でEvernoteへのコピペが捗る!

Mac

Evernote にWebページの文章をコピペすると,書式などの文字のスタイル情報までコピペされてしまいますよね.スタイル情報を消すために一旦テキストエディットを経由してEvernoteにコピペしたりするのってかなり面倒です. この問題を解決してくれるのが「Ge…

【Python】Flask+TweepyでTwitter連携アプリを作る

「Flask」と「Tweepy」を使ってTwitter連携アプリを作成する方法をまとめました. どちらもPythonで実装されたライブラリで,FlaskはWeb開発フレームワーク,TweepyはTwitter APIへのアクセスを簡単にしてくれるライブラリです.

コマンドコピペだけで Apache Thrift をインストールする方法

Apache Thrift を CentOS6 にインストールする方法です. コマンドをターミナルにコピペするだけでインストールできます.

【はてなブログ】ほぼコピペでOK!任意の場所にAdsenseを自動挿入する方法

はてなブログではテンプレのHTMLを弄ることができないので,好きな場所にAdsenseを挿入するには色々と面倒なことをしないといけません. そこで本記事では,jQueryのコードをコピペするだけで,テンプレの任意の場所にAdsenseのコードを自動挿入する方法を紹…

【ajax-counter】Ajaxによるアクセスカウンタを作ったので公開します

Ajax によるシンプルなアクセスカウンタ「ajax-counter」を作ったので公開しました. Javascript(jQuery) + PHP で実装されており,誰でも自由にお使いいただけます.

はてなブログのテーマを作成した時の手順や参考記事のまとめ

先日,はてなブログで運営させて頂いているこのブログ「しろかい!」のテーマをリニューアルした. その時に行ったテーマの作成手順や参考にした記事などをまとめておきます.非デザイナーの方でも割と簡単にテーマが作れちゃいます!

はてなブログで使えるアイコンWebフォントの一覧と使い方まとめ

はてなブログでは,デフォルトで読み込まれるCSS「globalheader.css」で,79種類のアイコンWebフォントを読み込んでいます.これらのアイコンで間に合うのならわざわざ「Font Awesome」を読み込む必要もなく,ページの軽量化が期待できます.そこで,本記事…

Chromeのブックマークバーを見やすくオシャレにする方法

Chromeにはブックマークバーと言う,よく行くサイトに簡単にアクセスできるようにするバーがあります. このブックマークバーを使いやすく,オシャレに改造する方法を紹介します.

情報系大学院生が選ぶオススメChrome拡張機能14選!

機械学習や自然言語処理の研究をしている情報系の大学院生が実際に使ってみて,これは便利と思ったChromeのオススメ拡張機能14選を紹介します.

ChromeでSilverlightが再生できない場合はNPAPIを有効化せよ

4/14にリリースされたGoogle Chrome 42(最新版)をインストールすると,Microsoft Silverlightによる動画の再生ができなくなる現象が発生します. 本記事ではその原因と対処方法についてまとめています.

PV増やしたかったら検索上位となれる記事を書け!

4月の中旬頃からしろかい!のPV数が激増しています. そのワケについて分析してわかったことは「PV増やしたかったら検索上位となれる記事を書け」ということでした. 本記事では,PV激増の原因の分析結果と,そこから分かったPV数を増やす方法について紹介し…

WebアプリからもPush通知が!ChromeのPush通知について

ネイティブアプリでは当たり前となった「プッシュ通知」を,Chromeからも送れるようになりました.Webアプリからもプッシュ通知が送れるとなり,話題になっています. 早速僕も試してみたので,使い方をまとめておきます.

【Mecab】ユーザ辞書の使い方

オープンソースの形態素解析器「Mecab」でユーザ辞書を使う方法のまとめです. 辞書を追加することで,形態素解析の精度を向上させることができます.

Microsoft SilverlightがMac版Chromeで利用できない原因

先日Mac版ChromeをアップデートしたらMicrosoft Silverlightが必要な動画再生サイトが使えなくなってしまいました. なかなか原因が分からず困っていましたが,ようやく分かったので書いておきます. Chrome 42にアップデートされた方へ 2015/4/17 12:30 追…

Webページ作成のキホンの「キ」

Webページを初めて作る方向けに,基本的なことをまとめた記事です. 簡単なページをWebに公開できるようになることを目標とします.

OpenNLPのPOSTaggerの使い方まとめ

Apache OpenNLPのPOSTagger(品詞タグ付け器)の使い方をまとめました.

【Mac】XAMPPのインストールと初期設定まとめ

MacにXAMPPをインストールして使えるようになるまでの設定方法のまとめです.

LIBLINEARのパラメータをグリッドサーチするスクリプト書いた

LIBLINEARのパラメータ(cost, bias)をグリッドサーチしてくれるスクリプト「grid_with_bias_and_solver.py」を書きました. ついでにソルバーも最適なものを選択してくれます.

LIBSVMの学習データをコサイン正規化するスクリプト書いた

機械学習の1手法であるSVMのライブラリ「LIBSVM」の入力データを,コサイン正規化するPythonスクリプトを書いたので公開します.

【Mac】シェルをbashからzshに変更する方法

Mac

Macのターミナルのシェルをbashからzshに変えたので,方法をメモしておきます.

LIBSVMの学習データを正規分布に従うようにスケーリングするスクリプト書いた

機械学習の1手法であるSVMのライブラリ「LIBSVM」の入力データを,標準正規分布に従うようにスケーリング(標準化)するPythonスクリプトを書いたので公開します.

Swift書いてて最近つまづいた4つのコト

最近Swiftを書く機会があったのですが,久々に書くとホント色々な場面でつまづきます. Swiftは新しい言語のため,ググっても解決方法がなかなか見つからないこともしばしば… そこで,最近つまづいた4つのことを解決方法と共に紹介します.

SwiftでBluetoothによるP2P通信を簡単に実現する方法

SwiftでBluetoothによるP2P通信を簡単に実現する方法を紹介します.