顔向き検知
魚の向きを推定するためのプログラムを作る前に、datasetも豊富な顔で、顔向きを推定するプログラムを作りました。datasetは"BiwiKinectHeadPoseDatabase"を使いました。
ネットワーク構造は、入力層⇒conv1⇒pooling1⇒正規化層1⇒conv2⇒pooling2⇒正規化層2⇒conv3⇒pooling3⇒正規化層3⇒conv4⇒pooling4⇒正規化層4⇒fc1⇒fc2⇒fc3⇒出力層です。活性化関数は最後のfc3以外reluを用いています。fc1とfc2ではdopoutを50%としています。
簡易結果は下記の通りです。
正解値(pitch yaw roll) -7.578725 3.379035 -2.408475
推定値 -6.55027723 2.88495684 -1.88205528
正解値 -18.744198 32.593552 0.199069
推定値 -18.983348 31.514802 -1.465301
正解値 -26.730764 -19.268169 2.085157
推定値 -22.015968 -21.953107 5.144399
学習曲線は下図の通りです。
とりあえず上手くいったので、次は魚の向きを推定したいところだが、ラベル付けどうしよう。