いま確率密度比推定がアツい

最近、密度比推定の話を立て続けに観測したのでメモ。 アプリログの自動異常検知を試してみた~密度比による異常検知入門~ - Gunosyデータ分析ブログ Machine Learning Trick of the Day (7): Density Ratio Trick ← The Spectator 密度比推定まわりの書籍・…

Putting MRFs on a Tensor Train 読んだ

Putting MRFs on a Tensor Train (ICML 2014) http://proceedings.mlr.press/v32/novikov14.pdf マルコフ確率場(MRF)のパラメータ推定に使われる最尤訓練法では、分配関数の良い近似が必要とされる。 離散変数の正規化されていない同時分布をテンソル(多次元…

言葉

ぼくは二十歳だった。それがひとの一生でいちばん美しい年齢だなどとだれにも言わせまい。 ポール・ニザン『アデン・アラビア』より ポール・ニザン著作集〈1〉アデン アラビア作者: ポール・ニザン,篠田浩一郎出版社/メーカー: 晶文社発売日: 1966/12メディ…

言葉

どうしてこんなことになってしまったのだろう。 いくら考えあぐねても、『そうなってしまった』と言うほか答えはない。 恋は雨上がりのように(9) (ビッグコミックス)作者: 眉月じゅん出版社/メーカー: 小学館発売日: 2017/11/10メディア: Kindle版この商…

本当にしんどい時に見るもの

https://anond.hatelabo.jp/20171226145739 私にもあるなーと思ったので書いてみる。 1. 火の鳥 鳳凰編 火の鳥 4 鳳凰編 (角川文庫)作者: 手塚治虫出版社/メーカー: KADOKAWA発売日: 1992/12/08メディア: 文庫購入: 2人 クリック: 9回この商品を含むブログ (…

最近のベイズ本まとめ

マンガでわかるベイズ統計学作者: 高橋信,上地優歩,ウェルテ出版社/メーカー: オーム社発売日: 2017/11/25メディア: 単行本(ソフトカバー)この商品を含むブログ (1件) を見る 恋する統計学[ベイズ統計入門]作者: 金城俊哉出版社/メーカー: 秀和システム発…

勾配ブースティング(Gradient Boosting) わかりやすい記事まとめ

1. 勾配ブースティングについてざっくりと説明する smrmkt.hatenablog.jp 2. Gradient Boosting と XGBoost Gradient Boosting と XGBoost | ZABURO app 3. 勾配ブースティング決定木を理解する hiyoko9t.hatenadiary.jp

言葉

「ずり落ちる」 ああ、いやだ。何ともいやな気分に人をさせる。腰まで泥に埋まったまま、丹念に家計簿を付けるような言葉だ。 牛への道 (新潮文庫)作者: 宮沢章夫出版社/メーカー: 新潮社発売日: 1997/04/25メディア: 文庫購入: 12人 クリック: 53回この商品…

Hadley を神と言い出したのは誰か?

Hadley が自著の翻訳版を Google Translate にかけて遊んでいた。 The magic of Google’s autotranslate pic.twitter.com/5RiUNbBV4c— Hadley Wickham (@hadleywickham) 2017年10月23日 これを見て、Hadley を最初に神と言い出したのは誰なのか気になったの…

p(x ; θ) と p(x | θ) の違い

ベイズと頻度主義の違いはパラメータを確率変数とみなすかどうかということ。 したがってパラメータ をもつ の確率分布は 頻度主義では または単に と書くことも ある。 一方ベイズではパラメータも確率変数なので と書く。 しかし、これらは単なる立場の違…

Likelihood Cross-Validation

Likelihood cross-validation. The cross-validation method used for optimum kernel bandwidth estimation is based on the maximum likelihood principle. In a classical sense, the maximum likelihood principle considers the best “explanation” of …

ポスト基広

私の目標は石田基広である。 このたびその石田先生と共同翻訳をさせていただくという幸運に恵まれた。 その書籍が『Rによる自動データ収集』である。 Rによる自動データ収集: Webスクレイピングとテキストマイニングの実践ガイド作者: Simon Munzert,Christi…

日本における視聴者層の区分

ビデオリサーチなどの視聴率調査会社や広告代理店などでは、視聴者を下記のように区分している。 C層 4-12歳の男女 (Cは英語で子供を表すChildの意味) T層 13-19歳の男女 (TはTeenager(ティーンエイジャー)の意味) F1層 20-34歳の女性 (Fは英語で女性…

言葉

子どもにとっては、まったく何もわかっちゃいない大人たちに、常々物事を教えるのは実にやっかいな仕事だ 『星の王子さま』

Graphical Excellence

Graphical excellence is that which gives to the viewer the greatest number of ideas in the shortest time with the least ink in the smallest space. Edward Tufte http://www.fusioncharts.com/whitepapers/downloads/Principles-of-Data-Visualizat…

統計的機械学習は単純な最適化問題ではない

It might seem that minimization of is equivalent to minimization of . If these two minimization problems were equivalent, then maximization of would be the best method in statistical estimation. However, minimization and expectation cannot…

Jeffreys' prior

In statistical estimation, the pair is statistical model which is optimized for given random samples. Hence, if is fixed and is made coordinate-free, such a pair is not appropriate for statistical estimation in general. p.222 Algebraic Geo…

MAP推定とベイズ推定

Although the MAP employs an a priori distribution, its generalization error is quite different from that of Bayes estimation. p.204 Algebraic Geometry and Statistical Learning Theory (Cambridge Monographs on Applied and Computational Mathe…

言葉

物のあはれがなかったら、この世はどうにも仕方のない焦慮と、他にあればホクソエムことだけくらゐだといふ、誰でも感じてゐながら、通年とはなってゐないこのことを、書いてみたいと思ってゐます - 中原中也— 作家の手紙 (@writers_letter) 2017年3月20日

言葉

孤独には二種類ある。対話のある孤独と、対話のない孤独だ 数学ガール/乱択アルゴリズム (数学ガールシリーズ 4)作者: 結城浩出版社/メーカー: SBクリエイティブ発売日: 2011/02/26メディア: 単行本購入: 19人 クリック: 779回この商品を含むブログ (103件) …

中心極限定理と特異学習理論

As the central limit theory is characterized by the mean and the variance of the random variables, the stastical learning theory is characterized by the largest pole of zeta function and the singular fluctuation. p.47 Algebraic Geometry an…

ティンバーゲンの4つのなぜ

息子と風呂に入っていて、「このお風呂、ボタンを押したらお湯が出るけど、溢れないで勝手に止まるよね。なんでだと思う?」と聞いたら、息子は「溢れたら困るから」と答えた。あー日本の国語教育間違ってるよな。物語の登場人物の心情を推し量るのもいいけ…

言葉

でもね、あなたが思ってるもうちょっと先まで行けるのよ 逃げるは恥だが役に立つ(2) (Kissコミックス)作者: 海野つなみ出版社/メーカー: 講談社発売日: 2013/12/27メディア: Kindle版この商品を含むブログを見る

言葉

"#rstats is not a DSL. It’s a language for writing DSLs, which is something altogether more powerful" — @jcheng— Hadley Wickham (@hadleywickham) 2017年1月5日

言葉

「実験が終わってしまった後で統計学者に相談するのは、検死解剖をどのように行えばよいかを尋ねるようなものであり、統計学者はその実験の「死因」を教えてくれるだけだろう」 R. A. Fisher エンジニアのための データ可視化[実践]入門 ~D3.jsによるWebの可…

言葉

殺人事件の被害者遺族になった時平地から崖下へ突き落された気がした。人は加害者も同じ崖下に放り込んでやるから満足しろと言うが、私は崖上に引き上げて欲しかった 弟を殺した彼と、僕。作者: 原田正治,前川ヨウ出版社/メーカー: ポプラ社発売日: 2004/08…

言葉

「自分の心から好きなことをやれ。 自分の骨の味を知れ。かみしめよ。 地面に埋めよ。掘り出してもう一度かみしめよ」 ヘンリー・デイヴィッド・ソロー

議論の価値

30分議論してそれで決まらないなら、それは議論が足りないのではなく、多くの場合は情報が足りないということだ。 そんな時は何が原因で決まらないのかを考えた方が良い。

人間が働かなくて済む世界

本人がなにもしなくてもお金が稼げる仕組みを考える。 治験を考えてみよう。 あれはリスクを受け入れる必要はあるが、基本的には本人はなにもしない。 データ取得の為に血液を抜かれたりするだけである。 これと同様と言えるかわからないが、ゲームのテスト…

気になった言葉

過去は、二度と戻れないというたったひとつの理由で、時にありえないほどの輝きを纏ってしまう。 それがどんなに冴えない日常風景だったとしても。 施川ユウキ『鬱ごはん (2)』あとがきより 鬱ごはん 2 (ヤングチャンピオン烈コミックス)作者: 施川ユウキ出…