気象台東交差点の所要時間予測

このページのオリジナルのipynbファイル 更新日 2021-01-09 10:44:26

機械学習による所要時間予測の試み

データの読み込みと集計

クラスファイルを作成

移動平均

window =3 の場合の8:00の行を例に

3つ、4つずらすものも同様に

全データの読み込み・基本処理

特定の時刻のデータを分析対象として抽出

まったく規則性を見いだせずという結論になる可能性もある。

機械学習による分析

定義

ニューラルネット

交差検証

cross_val_scoreでは、パラメータcvで分割個数(fold)を指定する。既定値は5

手動で何回か繰り返してみる

cross_val_scoreの値がなにを意味するかマニュアルではよくわからないので、

トレーニングデータとテストデータを毎回train_test_splitで分割して、結果からr2_scoreで決定係数を計算し、その平均をとってみる。

トレーニングデータとテストデータの割合を7:3にするとr2が0.83程度、8:2にすると0.81くらいになるようだ。

もちろん毎回変わる。

結果を交差検証の結果と比べると、scoreはr2とほぼ同じものを評価しているようだ。

SVR