HadoopStreaming で xml ファイルを扱う方法の解説です. この記事では,しろかい!のRSSフィードから <title>~</title> を抽出することを目標とします. また,言語は Python を使用します.
HadoopStreaming を 使って Python で Hadoop を動かす方法です. Mapper と Reducer は通常 Java で記述しなければいけませんが,HadoopStreaming を使えば Python などの他の言語で書けるので実装がとても楽になります!
LIBLINEARで cross validation (クロスバリデーション, 交差検定) を行う時は,評価指標として Accuracy が用いられます.しかし,用途によってはF 値など,他の指標を使いたい時もあるかと思います. というわけで,本記事では LIBLINEAR の cross validati…
LIBLINEAR を Python から使う方法を解説します. 基本的な学習と予測の方法はもちろんですが,LIBLINEAR がサポートするロジスティック回帰では予測値の確率を得ることもできます.これを Python のコードから取得する方法も紹介します.
ロジスティック回帰を使って簡単に多クラス分類ができるライブラリ「LIBLINEAR」のインストール方法と,基本的な2つのコマンドである train と predict (学習と予測) の使い方のまとめです. LIBLINEAR は線形分類に特化しており,計算が非常に高速です. (…
自然言語処理ライブラリ「Stanford CoreNLP」を Python から使えるようにするためのインストール方法と,実際の使い方をまとめました.
Ruby on Rails チュートリアル を1ヶ月ほどかけて全て読み終えたので,内容を簡単にまとめておきます. チュートリアルを読む際に参考にしたページもまとめておいたので,これから読まれる方の参考になれば幸いです.
Evernote にWebページの文章をコピペすると,書式などの文字のスタイル情報までコピペされてしまいますよね.スタイル情報を消すために一旦テキストエディットを経由してEvernoteにコピペしたりするのってかなり面倒です. この問題を解決してくれるのが「Ge…
「Flask」と「Tweepy」を使ってTwitter連携アプリを作成する方法をまとめました. どちらもPythonで実装されたライブラリで,FlaskはWeb開発フレームワーク,TweepyはTwitter APIへのアクセスを簡単にしてくれるライブラリです.
Apache Thrift を CentOS6 にインストールする方法です. コマンドをターミナルにコピペするだけでインストールできます.
はてなブログではテンプレのHTMLを弄ることができないので,好きな場所にAdsenseを挿入するには色々と面倒なことをしないといけません. そこで本記事では,jQueryのコードをコピペするだけで,テンプレの任意の場所にAdsenseのコードを自動挿入する方法を紹…
Ajax によるシンプルなアクセスカウンタ「ajax-counter」を作ったので公開しました. Javascript(jQuery) + PHP で実装されており,誰でも自由にお使いいただけます.
先日,はてなブログで運営させて頂いているこのブログ「しろかい!」のテーマをリニューアルした. その時に行ったテーマの作成手順や参考にした記事などをまとめておきます.非デザイナーの方でも割と簡単にテーマが作れちゃいます!
はてなブログでは,デフォルトで読み込まれるCSS「globalheader.css」で,79種類のアイコンWebフォントを読み込んでいます.これらのアイコンで間に合うのならわざわざ「Font Awesome」を読み込む必要もなく,ページの軽量化が期待できます.そこで,本記事…
Chromeにはブックマークバーと言う,よく行くサイトに簡単にアクセスできるようにするバーがあります. このブックマークバーを使いやすく,オシャレに改造する方法を紹介します.
機械学習や自然言語処理の研究をしている情報系の大学院生が実際に使ってみて,これは便利と思ったChromeのオススメ拡張機能14選を紹介します.
4/14にリリースされたGoogle Chrome 42(最新版)をインストールすると,Microsoft Silverlightによる動画の再生ができなくなる現象が発生します. 本記事ではその原因と対処方法についてまとめています.
4月の中旬頃からしろかい!のPV数が激増しています. そのワケについて分析してわかったことは「PV増やしたかったら検索上位となれる記事を書け」ということでした. 本記事では,PV激増の原因の分析結果と,そこから分かったPV数を増やす方法について紹介し…
ネイティブアプリでは当たり前となった「プッシュ通知」を,Chromeからも送れるようになりました.Webアプリからもプッシュ通知が送れるとなり,話題になっています. 早速僕も試してみたので,使い方をまとめておきます.
オープンソースの形態素解析器「Mecab」でユーザ辞書を使う方法のまとめです. 辞書を追加することで,形態素解析の精度を向上させることができます.
先日Mac版ChromeをアップデートしたらMicrosoft Silverlightが必要な動画再生サイトが使えなくなってしまいました. なかなか原因が分からず困っていましたが,ようやく分かったので書いておきます. Chrome 42にアップデートされた方へ 2015/4/17 12:30 追…
Webページを初めて作る方向けに,基本的なことをまとめた記事です. 簡単なページをWebに公開できるようになることを目標とします.
Apache OpenNLPのPOSTagger(品詞タグ付け器)の使い方をまとめました.
MacにXAMPPをインストールして使えるようになるまでの設定方法のまとめです.
LIBLINEARのパラメータ(cost, bias)をグリッドサーチしてくれるスクリプト「grid_with_bias_and_solver.py」を書きました. ついでにソルバーも最適なものを選択してくれます.
機械学習の1手法であるSVMのライブラリ「LIBSVM」の入力データを,コサイン正規化するPythonスクリプトを書いたので公開します.
Macのターミナルのシェルをbashからzshに変えたので,方法をメモしておきます.
機械学習の1手法であるSVMのライブラリ「LIBSVM」の入力データを,標準正規分布に従うようにスケーリング(標準化)するPythonスクリプトを書いたので公開します.
最近Swiftを書く機会があったのですが,久々に書くとホント色々な場面でつまづきます. Swiftは新しい言語のため,ググっても解決方法がなかなか見つからないこともしばしば… そこで,最近つまづいた4つのことを解決方法と共に紹介します.
SwiftでBluetoothによるP2P通信を簡単に実現する方法を紹介します.