データマイニングにおいて数値予測によく使われる手法が,ニューラルネットワークです。
ニューラルネットワークは、人間の脳の神経回路網をコンピュータ上にシミュレーションするソフトウェア技術ですが、ネットワークの結合構造によって様々な方式があります。
データマイニングでは、BPN(Back Propagation Neural-network)と呼ばれる方式がよく利用されます。この構造を図1に示します。
図1

上図において、データの各項目(各従属変数)が、ネットワークの入力層における各PE(Processing Element)に相当します。
また、出力層におけるPEが予測したいデータ項目(目的変数)に相当します。
入力層と出力層の間には中間層があり、複数のPEが存在します。
また、入力層と中間層、及び中間層と出力層の各PE同士は全結合の関係を有し、それぞれの関係の強さを重み(Weight)で表します。
1件のデータをこのネットワークに入力すると(入力層の各PEに、各項目の値を入力する)、出力層からは各PE間の重み及びその合計値によって算出された値が出力されます。
実績データを用いて予測モデルを作成する場合には、当初ランダムに与えられた各PE間の重みを、ネットワークの出力値とデータの実績値との間の誤差が少なくなるように,少しずつ修正していきます。これをデータ全件について繰り返し行い(学習と呼ぶ)、誤差が収束してきたら学習を打ち切ります。
完成したニューラルネットワークに、新たなデータを入力する事により、そのデータに対する予測値が得られることになります。
中間層が存在することにより、非線型な事象についても予測モデルを作成する事ができ、従来の回帰分析に比べて通常は予測精度が高いといわれます。