Slim3 x Sen で日本語形態素解析

ということで、GAE使ってみました。10Mbyte制限とかあって、一部ファイルを圧縮したり、読み込み部分を改造したりしましたが、半日ぐらいで完成。Slim3すげぇ!Senもすげぇ!http://onlinejpanalyser.appspot.com/sen/

GoogleDocsのフォルダはタグだったのか!

ベンリな機能発見。というか、できたらいいのになー、できないだろうなー。と思いながら見てみたら、できた!!!っていう話。GoogleDocs使った事ないと解りにくいかもしれないけれど、Folderを作って、ファイルを管理できるわけです。で、何が便利かという…

5台でHadoop

昨日はMac5台でHadoopによるデータ解析実験をやってみました。1GB程度のテキストファイルから非常に簡単なデータ抽出処理。シングルノードで7分程度の処理が5ノードで4分弱と。一応、効果を確認できたかなっていうところです。100台ぐらい並べてやり…

アマゾンEC2を触ってみる

EC2

さー、やっちゃえってことでAmazon EC2 にサインアップとりあえず、インスタンス立ち上げたり。明日からは、Amazon Elastic MapReduce で hadoop に挑戦しよう。