ミムの部屋

社内SEが,興味をもったことを書いていきます.

2015-05-01から1ヶ月間の記事一覧

Malletでトピック抽出

機械学習ツールキットであるmalletでトピック抽出をしたいと思います. 以下の条件でトッピク抽出を行いました. 対象データ:wikipediaから「四月は君の嘘」の有馬公生(ありま こうせい)の説明文 形態素解析:mecab 対象品詞:名詞 結果は,以下のように…

Macに ant をインストール

今回は,Apache ant をMacにインストールする. なんか,Macにはデフォルトで入っているらしい?ですが,コマンドが反応しなかったので入れることにします.手順は,以下に示します. Apache Antから「apache-ant-?.?.?-bin.zip 」というファイルをダウンロ…

pythonで,ファイル作成しよとしたら文字コードによってエラーが起きた!!!

今日は,二回目の投稿です.TweepyでREST APIを使って,検索した結果をファイルに保存しようとしたら以下のようなエラーが出ました!!!! UnicodeEncodeError: 'ascii' codec can't encode characters in position **: ordinal not in range(128) なんとな…

Tweepyで,あるユーザのツイートをリツイートしたユーザの情報取得

今回はTweepyを使って,あるユーザのツイートをリツイートしたユーザの情報取得してみたいと思います. 今までjavaのTwitter4jで色々行ってきました.しかし,リツイートしたユーザ情報を取得するためのメソッドである getretweeterIds というのがあるのです…

Twitterの返信相手のアカウント名だけを取得

今回は,Twitterのツイートに含まれている返信相手のアカウント名(例:@****)を取得したいと思います. そのため,javaで正規表現を使ってやりたいと思います!!! 早速ですが,以下のソースコードが作ったものです. import java.util.regex.Matcher; im…