Sparse Gaussian Markov Random Field Mixtures for Anomaly Detection 読んだ

Sparse Gaussian Markov Random Field Mixtures for Anomaly Detection (ICDM 2016) http://ide-research.net/papers/2016_ICDM_Ide.pdf

複数の動作モードに対応可能かつ変数ごとの異常スコアを算出できる新しい異常検知手法を提案する。 通常、異常検知を行いたいシステムは複数の動作モードを持つことが多いが従来の手法ではこれに対応できない。 また、ホテリング T2 などの古典的な手法では多変量であっても異常スコアは観測ごとにしか算出されない。 変数ごとに異常スコアが算出できればシステムのどこに異常が生じたかを突き止めやすくなる。 これらの問題に対応するため、ガウスマルコフ確率場の混合モデルを考え、その変分ベイズ推定アルゴリズムを導出する。 ガウスマルコフ確率場により、ある変数の異常スコアを同じ観測の他の変数の値から求めることができる。 また、混合モデルにより複数の動作モードを表現できる。 動作モードの数(混合数)は不明なため、大きめの数を設定しておけば重みをスパースに推定し、混合数を自動決定する仕組みを取り入れる。 実験として、合成データに対して混合数、混合比率、動作モードについてうまく推定できることを示した。 また、オイル生産コンプレッサーの実データを用いて、他の手法と比較して異常検知性能が良いことを示した。

参考

www.yasuhisay.info

言葉

言葉

「いいかい、君たち。分からなければ聞けばいい。持っていないなら借りればいい。逆に聞かれたら教えるべきだし、持っているものは与えるべきだ。人間、一人でできることなど高が知れている。技術の世界はみんなで共に創る『共創』が肝心だ」

newswitch.jp

Twitterで検索にユーザ名が引っかからないようにする方法

すぐ忘れるのでメモっておく。ちなみに OR は大文字じゃないとダメ。

いま確率密度比推定がアツい

最近、密度比推定の話を立て続けに観測したのでメモ。

上の記事にも出てくるけど、私は密度比推定のツールを作っているのでなんかうれしい。

世界中見てもここら辺のツール開発してるの私しかいないのね。

Putting MRFs on a Tensor Train 読んだ

Putting MRFs on a Tensor Train (ICML 2014) http://proceedings.mlr.press/v32/novikov14.pdf

マルコフ確率場(MRF)のパラメータ推定に使われる最尤訓練法では、分配関数の良い近似が必要とされる。 離散変数の正規化されていない同時分布をテンソル(多次元配列)とみなすと、分配関数はその要素の総和として求めることができる。 ただし、テンソルはそのままではメモリに載らないため、テンソル分解の1つであるテンソルトレイン(TT)形式を用いることで容量を削減する。 TT形式の要素の総和を直接的に求めると、TTランクが指数的に増加し、計算時間も増加する。 そこで、TTランクの低い因子(factor)の状態のままで分配関数の近似を計算するアルゴリズムを提案する。 このアルゴリズムにより求められた分配関数について、誤差の上限を理論的に証明し、既存手法より誤差が小さいことを実験により示した。

言葉

ぼくは二十歳だった。それがひとの一生でいちばん美しい年齢だなどとだれにも言わせまい。

ポール・ニザン『アデン・アラビア』より

ポール・ニザン著作集〈1〉アデン アラビア

ポール・ニザン著作集〈1〉アデン アラビア