ほくそ笑む

R言語と統計解析について

パターン認識における識別手法のてきとーなまとめ

  • Nearest Neighbor 法(Wikipedia)
    • 最も単純な方法。区分的線形分離。精度は悪い。
  • パーセプトロン(Wikipedia)
    • 学習データが線形分離可能な場合のみ有効。
  • Widrow-Hoff
    • 学習データが線形分離不可能な場合に、誤差が最小になるように線形分離。
    • 学習データが線形分離可能な場合でも、誤識別なく分類できる保証はないのが欠点。
  • SVM(Support Vector Machine)(Wikipedia)
    • マージン最大になるように線形分離する。
    • 線形分離不可能な場合はカーネルを使って高次元で線形分離。
    • 精度は良いが、速度が遅い。
  • ニューラルネットワーク(Wikipedia)
    • 非線形分離。
    • うまくカスタマイズすればいくらでも精度が良くなるが、そのカスタマイズが難しい。
  • ベイズ識別
    • 背景となるデータ分布を推定し、未知データに対する誤識別の確率が最小になるようにする。
    • 単純ベイズ法(Wikipedia)は、精度がそこそこ良く、速度も速い。

フリーソフトでつくる音声認識システム パターン認識・機械学習の初歩から対話システムまで

フリーソフトでつくる音声認識システム パターン認識・機械学習の初歩から対話システムまで