Likelihood Cross-Validation

Likelihood cross-validation. The cross-validation method used for optimum kernel bandwidth estimation is based on the maximum likelihood principle. In a classical sense, the maximum likelihood principle considers the best “explanation” of …

ポスト基広

私の目標は石田基広である。 このたびその石田先生と共同翻訳をさせていただくという幸運に恵まれた。 その書籍が『Rによる自動データ収集』である。 Rによる自動データ収集: Webスクレイピングとテキストマイニングの実践ガイド作者: Simon Munzert,Christi…

日本における視聴者層の区分

ビデオリサーチなどの視聴率調査会社や広告代理店などでは、視聴者を下記のように区分している。 C層 4-12歳の男女 (Cは英語で子供を表すChildの意味) T層 13-19歳の男女 (TはTeenager(ティーンエイジャー)の意味) F1層 20-34歳の女性 (Fは英語で女性…

言葉

子どもにとっては、まったく何もわかっちゃいない大人たちに、常々物事を教えるのは実にやっかいな仕事だ 『星の王子さま』

Graphical Excellence

Graphical excellence is that which gives to the viewer the greatest number of ideas in the shortest time with the least ink in the smallest space. Edward Tufte http://www.fusioncharts.com/whitepapers/downloads/Principles-of-Data-Visualizat…

統計的機械学習は単純な最適化問題ではない

It might seem that minimization of is equivalent to minimization of . If these two minimization problems were equivalent, then maximization of would be the best method in statistical estimation. However, minimization and expectation cannot…

Jeffreys' prior

In statistical estimation, the pair is statistical model which is optimized for given random samples. Hence, if is fixed and is made coordinate-free, such a pair is not appropriate for statistical estimation in general. p.222 Algebraic Geo…

MAP推定とベイズ推定

Although the MAP employs an a priori distribution, its generalization error is quite different from that of Bayes estimation. p.204 Algebraic Geometry and Statistical Learning Theory (Cambridge Monographs on Applied and Computational Mathe…

言葉

物のあはれがなかったら、この世はどうにも仕方のない焦慮と、他にあればホクソエムことだけくらゐだといふ、誰でも感じてゐながら、通年とはなってゐないこのことを、書いてみたいと思ってゐます - 中原中也— 作家の手紙 (@writers_letter) 2017年3月20日

言葉

孤独には二種類ある。対話のある孤独と、対話のない孤独だ 数学ガール/乱択アルゴリズム (数学ガールシリーズ 4)作者: 結城浩出版社/メーカー: SBクリエイティブ発売日: 2011/02/26メディア: 単行本購入: 19人 クリック: 779回この商品を含むブログ (103件) …

中心極限定理と特異学習理論

As the central limit theory is characterized by the mean and the variance of the random variables, the stastical learning theory is characterized by the largest pole of zeta function and the singular fluctuation. p.47 Algebraic Geometry an…

ティンバーゲンの4つのなぜ

息子と風呂に入っていて、「このお風呂、ボタンを押したらお湯が出るけど、溢れないで勝手に止まるよね。なんでだと思う?」と聞いたら、息子は「溢れたら困るから」と答えた。あー日本の国語教育間違ってるよな。物語の登場人物の心情を推し量るのもいいけ…

言葉

でもね、あなたが思ってるもうちょっと先まで行けるのよ 逃げるは恥だが役に立つ(2) (Kissコミックス)作者: 海野つなみ出版社/メーカー: 講談社発売日: 2013/12/27メディア: Kindle版この商品を含むブログを見る

言葉

"#rstats is not a DSL. It’s a language for writing DSLs, which is something altogether more powerful" — @jcheng— Hadley Wickham (@hadleywickham) 2017年1月5日

言葉

「実験が終わってしまった後で統計学者に相談するのは、検死解剖をどのように行えばよいかを尋ねるようなものであり、統計学者はその実験の「死因」を教えてくれるだけだろう」 R. A. Fisher エンジニアのための データ可視化[実践]入門 ~D3.jsによるWebの可…

言葉

殺人事件の被害者遺族になった時平地から崖下へ突き落された気がした。人は加害者も同じ崖下に放り込んでやるから満足しろと言うが、私は崖上に引き上げて欲しかった 弟を殺した彼と、僕。作者: 原田正治,前川ヨウ出版社/メーカー: ポプラ社発売日: 2004/08…

言葉

「自分の心から好きなことをやれ。 自分の骨の味を知れ。かみしめよ。 地面に埋めよ。掘り出してもう一度かみしめよ」 ヘンリー・デイヴィッド・ソロー

議論の価値

30分議論してそれで決まらないなら、それは議論が足りないのではなく、多くの場合は情報が足りないということだ。 そんな時は何が原因で決まらないのかを考えた方が良い。

人間が働かなくて済む世界

本人がなにもしなくてもお金が稼げる仕組みを考える。 治験を考えてみよう。 あれはリスクを受け入れる必要はあるが、基本的には本人はなにもしない。 データ取得の為に血液を抜かれたりするだけである。 これと同様と言えるかわからないが、ゲームのテスト…

気になった言葉

過去は、二度と戻れないというたったひとつの理由で、時にありえないほどの輝きを纏ってしまう。 それがどんなに冴えない日常風景だったとしても。 施川ユウキ『鬱ごはん (2)』あとがきより 鬱ごはん 2 (ヤングチャンピオン烈コミックス)作者: 施川ユウキ出…

これな。

(´-`).。oO( 今更,米中に深層学習で逆転しようとか肉薄しようとか無理過ぎなので,日本の行政としては10年くらいかけた長期で次の知的コンピューティングに投資するべきですね.情報幾何学とか代数幾何学的学習理論とか量子アニーリングとか.若い人に投資…

判断の基準

論理的基準 倫理的基準 生理的基準 イデオロギー的基準

文法圧縮のお勉強

基礎 文法圧縮入門:超高速テキスト処理のためのデータ圧縮(NLP2014チュートリアル) 文法変換アルゴリズム 貪欲アルゴリズム Bisection / Multilevel Pattern Matching [Kieffer+ 2000] Sequitur [Nevill-Manning+ 1997] Re-Pair (Recursive Pairing) [Lar…

Gold Standard

論文を読んでいるとたまに Gold Standard という言葉が出てくる。 これは主に自分の提案した手法に対する比較対象を指す言葉として出てくる。 似たようなものに Baseline というものがある。 Baseline は分かりやすくて「既存手法をベースラインとする」のよ…

怒り

怒りという感情は考えてみるとなかなかに面白くて、どんなときに人は怒るかというと、それは主に自分の思い描いていた理想と実際の状況にギャップが生じたときである。 では、理想と現実にギャップが生じると人は常に怒るのかというとそうではない。 怒らず…

失敗するデータ分析チーム七つの条件

経営層が分析結果を見て解釈する素養を持ってない 分析によりいくら利益が出たか見積もってない 分析方法に透明性が無い(黒魔術化している)。再現性を確保できていない データの集計方法が確立されていない。データソースが分散している ドメイン知識を軽視…

ナイーブなアルゴリズム

アルゴリズムの分野はでよく "naive algorithm" という言葉を聞く。 これは、おおむね「最初に思いつくような単純なアルゴリズム」というような意味だと思っていたが、次の Q&A サイトの答えがしっくりきた。 cs.stackexchange.com "one of the things you w…

Excel の思い出

www.b-chan.jp これを読んで思い出したのだが、私が新卒入社した会社では、隣の席に Excel データの行列を列行に書き直す仕事を延々としている人がいた。 装置から出力されるデータをソフトウェアに入力する必要があったのだが、新しい装置の出力形式がこれ…

ムシヌユン

都留泰作「ムシヌユン」というマンガが非常におもしろいと思うのだけど他人にすすめるのを憚られる内容なので困りものである。

はじめに

自分の考えていることを吐き出す場所がやはり必要だなぁということで始めてみます。