無料で使えるテキストマイニングツール
テキストマイニングとは
テキストマイニングは、文字列や文章を対象としたデータマイニングで、文章に登場する単語や文節を出現の頻度などから大量の文章データを解析することで、有益な情報を取り出す仕組みをテキストマイニングと言います。
無料で利用できるテキストマイニングツールを紹介します。
こんな方におすすめ
- テキストマイニングを試したい方
- 大量のテキストデータを、素早く解析したい
- 分析結果のデータを社内打ち合わせに使用したい
- 分析結果を「可視化」「見える化」して共有したい
- テキストマイニングをPDCAサイクルに生かしたい
テキストマイニングツール by ユーザーローカル
ブラウザ上で動くテキストマイニングツール
株式会社ユーザーローカル運営
解析したいテキストを入力し、「テキストマイニングする」のボタンをクリックするだけで利用できます。100,000文字までの解析が可能です。2つの文書を比較するときは、結果画面に表示するための文書名も設定できます。
テキストマイニングツールby ユーザーローカルについて
使いやすいブラウザツール
- 通常版だけでなく、2つの文書を比較することができる
- 100,000文字までの解析が可能
- ファイルをアップロードしてテキストマイニングすることができる
サービスの特徴
- 時系列で感情がどう変化したのかをグラフ化できるのが特徴
- アンケート自由記入欄を分析することで顧客満足度の変化を調査可能
- 物語などの長文での感情変化を可視化することができる
- ニュースなどの文章を自動的にダイジェスト化することが可能
料金プラン
無料:ブラウザツールは無料利用可能
有料版あり:AIテキストマイニング
KH Coder3
日本語版と多言語版があるフリーソフト
樋口耕一氏開発
H Coderとは、テキスト型(文章型)データを統計的に分析するためのフリーソフトウェアです。
KH Coderは科学研究費補助金および立命館大学研究推進プログラムによる助成を受けた研究成果の一部として公開されているフリーソフトです。
KH Coder3
テキストデータを統計的に分析するためのフリーソフトウェア
- アンケートの自由記述・インタビュー記録・新聞記事などでの利用
- 社会調査データを分析するために制作されたフリーソフト
- 「計量テキスト分析」または「テキストマイニング」と呼ばれる方法に対応
- ソースコードが公開されていて必要に応じてKH Coderの処理内容を確認したり、機能を付け加えたりといったことを、自由に行なえます。
サービスの特徴(新機能)
- 各種の分析・可視化に共通する改良
- 多言語対応1(日本語・英語・オランダ語・カタロニア語・スロベニア語 )
- 多言語対応2(中国語(簡体字)・朝鮮語・ロシア語・イタリア語 )
- 多言語対応3(スペイン語 ・ドイツ語 ・フランス語・ ポルトガル語 )
- Mac・Linuxでの操作性向上:リッチテキスト(RTF)からテキスト(TXT)への自動変換
料金プラン
無料:フリーダウンロード Windows / Mac
GitHub Repositoryにて公開:ソースコード (Linux / Mac / Windows共通)
統計ソフトR
オープンソース型の統計ソフト
R Foundation提供
統計解析ソフト「R」は、R Foundationが提供する統計ソフトです。オープンソースフリーウェアで、誰でも自由にダ ウンロードして使用することができます。
「R言語」で作成された基本的な統計処理機能があるソフトで、テキストマイニングとしても利用可能です。
「R言語」は、統計解析向けのプログラミング言語です。
統計解析ソフト「R」
プログラミング言語の「R言語」の知識が必要
- データの入力方法は直接入力とファイルやクリップボードからの読み込み の 2 種類があります。
- 「R」では基本的な統計量を求める関数が用意されており、簡単に求める ことが可能です。
- 「R」では様々な確率分布や確率点を求める関数が用意されており、その 確率分布に従う乱数も簡単に作ることができます。
- 区間推定は、統計量の計算と確率点の関数を用いて簡単に求めるこ とができます。
料金プラン
無料:フリーダウンロード
Linux / Mac / Windows 対応
MeCab:和布蕪(めかぶ)
オープンソース型のテキストマイニングツール
MeCabは 京都大学情報学研究科−日本電信電話株式会社コミュニケーション科学基礎研究所 共同研究ユニットプロジェクトを通じて開発されたオープンソース 形態素解析エンジンです。
MeCab
MeCabはオープンソースの形態素解析エンジン
- 現GoogleソフトウェアエンジニアでGoogle 日本語入力開発者の一人である工藤拓氏によって開発
- プログラミング 言語 C++、C言語、C#, Java, Perl、Python、Ruby
- ライセンス: GPL、LGPL、BSD
料金プラン
無料:フリーダウンロード Windows / Linux
GitHub Repositoryにて公開