SPSSで機械学習のモデルを作成する方法を
回帰を例に説明します。
------
【その前に、決めるべきこと=設計】
(1)欲しい結果である目的変数を決める
今回は、売上本数buy
(2)目的変数を説明するであろう変数(=説明変数)をとりあえず決める。
今回は、前の売上までの間隔(日)intv(intv=2:2日前に買った)
(3)機械学習を行う手法と、その手法で決めるべき変数(ハイパーパラメタ)
を決める
今回は、線形回帰。ハイパーパラメタはデフォルトのまま
(4)データを入手
今回は、以下のデータをCSVで、mydata.txtという名前で保存
intv,buy
7,2
5,1
7,2
7,3
9,2
8,3
4,1
6,2
7,2
7,1
-------
【SPSSで設定】
前提:インストールは終わり、1回目の立ち上げはした。
していなければ、以下を参照
SPSS Modelerの試用版を動作させるまでの道
http://ameblo.jp/smeokano/entry-12277515968.html
(5)立ち上げましょう
白い画面(パレット)の下に、「お気に入り」「入力」「レコード設定」・・・
などの”タブ”があり、その中に、”アイコン”がある
(6)入力でCSVを設定
「入力」タブをクリック、
「可変長ファイル」をクリックして、白い画面上にクリックすると、アイコンが出来る
アイコンをダブルクリック、ウィンドウがひらく
そのウィンドウのファイルを選ぶところで、(4)のmydata.txtを選択
適用、OKすると、ファイル名に代わる
(7)フィールド設定で、目的変数と説明変数を設定
まず、「データ型」アイコンを作成
「フィールド設定」タブをクリック
「データ型」をクリックして、白い画面上にクリックすると、アイコンが出来る
CSVアイコンとデータ型アイコンを接続する
CSVアイコン(ファイル名になっているかも?)を右クリック
「接続」というのがメニューにでるので、それを選択
「データ型」をクリックすると、線で結ばれる
「データ型」の設定
アイコンをダブルクリック、ウィンドウがひらく
データが書かれている。
全部入力になっているので、説明変数(buy)を「対象」にかえる
なお、計算項目などを追加したい場合は、ここ(フィールド設定)で、「フィールド作成」などを使ってがんばる。
(8)手法の設定
「モデル作成」タブをクリック
「線形」をクリックして、白い画面上にクリックすると、アイコンが出来る
「データ型」アイコンと「線形」アイコンを接続する
→「データ型」右クリック、接続アイコンを「線形」に落とす
アイコンをダブルクリック、パネルが開く
ハイパーパラメータは、そこから設定できる
ひらいたパネルの下のほうの「実行」(三角形)ボタンをクリックして実行
計算中になって
最後、ダイヤモンドのアイコンができるはず
(8)出力の設定
「出力」タブをクリック
「テーブル」をクリックして、白い画面上にクリックすると、アイコンが出来る
ダイアモンドのアイコンと「テーブル」アイコンを接続する
→「ダイアモンド」右クリック、接続アイコンを「テーブル」に落とす
(9)実行してみる
全体がつながったので、このモデルを書いているパレットの上にある
緑の三角形をクリックして、ここまでを実行させる。
「実行中」の画面になり、実行が終わると、パネルが開く
予測データが設定されている。
(10)これをモデルで使う為に・・
(9)で見た、テーブルアイコンを右クリック
「スコアリング枝として使用」を選択する
データから、テーブルまでの→が太くなる
(11)保存する。
拡張子strファイルができる
このファイルを、クラウドにドロップして、APIから呼びさせるようになる。
----
*ダイアモンドをダブルクリックすると、モデルの情報がいろいろ見える
↧
SPSSで、機械学習させるまで
↧