Go言語で実装した、RAKE(Rapid Automatic Keyword Extraction)による、日本語テキストからのキーフレーズ抽出器です。
テストコード(extractor_test.go)を参照してください。
テキストの形態素解析にMecabを使っているので、Mecabをインストールしてください。
go get
で本パッケージを取得できます。
$ go get github.com/kanedazz/go-rake-ja
なお、MecabのGoバインディングにgo-mecabを使っているので、ビルド時には、go-mecabのREADMEに記載の通り、Mecabとリンクするために以下の環境変数を設定してください。
$ export CGO_LDFLAGS="`mecab-config --libs`"
$ export CGO_FLAGS="`mecab-config --inc-dir`"
- Rose, Stuart, et al. "Automatic keyword extraction from individual documents." Text mining: applications and theory (2010): 1-20.