「データマイニングの宝箱」では、統計解析ツールとして「S-Plus」,データマイニング汎用ツールとして「Visual Mining Studio」を高く評価します。

ビジネス・調査研究に世界中で愛用されている統計解析ソフト

ホームページをリニューアルをしております。
手を加えた部分から順次更新していっているため、通常以上に色彩バランスの悪い感じになっています。



Written in Japanese. Japanese fonts required to view this site

.

背景と展望

データマイニングが登場した背景から現在に至るまで、また今後の展望についてまとめてみました。

 

必要なもの

データマイニングは解析手法ばかりがピックアップされていますが、まずは構成要素である「データ」「コンピュータ」「解析者」がしっかりしていないと何にもなりません。軽視されやすいこれらの項目にスポットライトを当てたいと思います。

 

知識発見のプロセス

データマイニングで用いられる知識発見技術は、バスケット分析・決定木・ニューラルネットワークなど多くの手法があります。だからといって全部を同時に利用することは考えられません。解析手法はそれぞれの役割があり、その目的に合わせて使い分けなければなりません。

 それぞれの役割があると書きましたが、大きくわけると2つのタイプがあると思います。「データから本質を探る」タイプと「データから未知の現象を予測する」タイプです。

この章では、「データの洗浄」から「知識発見の方法」を交えて知識発見を考えてみます。

データを整えよう 知識発見方法の選択 データの本質を探ろう
データ洗浄(クレンジング)が必要。
(2002/10/07データの種類、正規化について追加記述)

さまざまな角度で知識発見。


(2002/02/11重回帰分析の解説書をダウンロードできるようしました)

隠れたトレンドを探る方法。
(2001/03/03修正)
データの未来を予測
過去を知ると未来も分かる方法
(2002/4/4ニューラルネットワーク部分をちょい修正)

 

データマイニングツールを使う

 データマイニングツールは便利なもので、データの準備から情報を発掘する手間が省けるだけでなく、色々な情報発掘方法を試みることができます。 良く出来たデータマイニングツールは高価なものですから,興味本位で使ってみようと思っても,なかなか使えるような環境にないと思います。そこで、ここではツールについてご紹介します。

 

活用事例

 データマイニングで問題解決をはかる場合、ケースバイケースで対応しなければならないため、マニュアルを作るのが困難です。ここでは、ある問題を一例として、どんな手順ですすめていくのか、どこに時間をかけているのか、などなどを 綴ってみようかと思います。 

 

質問・リンク集

 著者が見て勉強させてもらったHP。著者自身の論文紹介。いただいた質問集です。

リンク集

書籍紹介

厳選リンク集(コメント付)
(2004/12/6 更新。)

書籍紹介(コメント付)
(2005/5/19 新たに書籍とコメント追加)

 

著者やサイトに関すること

 

 

 

ータマイニングの宝箱 管理者の日々雑言


より良いサイト作りのため、ご意見やご感想などございましたらご連絡ください。
ご返信のお約束はできません。
(←直接ご入力ください。SPAM等の対策で画像にしています)


メニューに戻る