読者です 読者をやめる 読者になる 読者になる

文法圧縮のお勉強

基礎

日本語

英語

実装

Gold Standard

論文を読んでいるとたまに Gold Standard という言葉が出てくる。 これは主に自分の提案した手法に対する比較対象を指す言葉として出てくる。

似たようなものに Baseline というものがある。 Baseline は分かりやすくて「既存手法をベースラインとする」のように、この手法の評価値は超えて当然とされるもの、むしろ超えないなら提案手法は無意味だぐらいのものを指す。

一方、Gold Standard は、この評価値を超えることはないが、近づけば近づくほど良いとされるもののことを指す。

例えば、人間に近い判断をさせるアルゴリズムを作ったとして、実際の人間の判断との近さを評価値とする。 この評価値は近ければ近いほどいいのだが、限界がある。 それは人間の判断にもばらつきがあることから生じる限界である。 人間の判断にもばらつきがあるため、人間 vs. 人間の近さ(評価値)は 0 にはならない。

アルゴリズムの良さを評価するには、別グループの人間の判断を取ってきて、人間 vs. 人間の判断の近さを測り、これをアルゴリズムの評価値と比較する。 アルゴリズムの評価値は、人間 vs. 人間の評価値を超えることはない(超えても無意味)なため、人間 vs. 人間の評価値に近いことを示せば良い。 これが Gold Standard である。

怒り

怒りという感情は考えてみるとなかなかに面白くて、どんなときに人は怒るかというと、それは主に自分の思い描いていた理想と実際の状況にギャップが生じたときである。 では、理想と現実にギャップが生じると人は常に怒るのかというとそうではない。 怒らずに現実を嘆いたり現実を変えようと努力したりする人もいる。 つまり、怒るかどうかは自分で選択可能である。 怒る人というのは、自らが「怒る」という行動を選択した人たちだ。

怒るという行動を選択しないシチュエーションを考えてみよう。 もし、理想と現実にギャップが生じたとして、そのとき相手に銃を突きつけられていたらその人は怒るという選択を取るだろうか? その人が死にたくないと考えるなら怒りはしないのではないだろうか。 つまり、人が「怒る」という行動選択を行うとき、その怒りをぶつける対象は自分に害をなさないと考えていることになる。

人は誰かに怒りをぶつけられると不快な気持ちになる。 それを承知の上で他人に怒りをぶつけるという状況は、怒った人はそれをぶつけられた人が自分に害をなさないと考えているということだ。 怒りをぶつけられた人は不快な気持ちになるが、それでも自分を許してくれると考えているのだ。 つまりこれは「甘え」である。 怒る人はそれをぶつける人に対して甘えているのだ。

職場で部下に怒っている上司は、見方を変えると部下に甘えているということになる。 怒りは自分で選択可能であり、怒らずにミスを指摘するのみで済ますという選択肢もある。 そのため上司がミスをした部下に怒ったとして、それを部下が許してやるいわれは特にない。

この考えに至ってからは、怒る上司に対しては「甘えてんじゃねぇよ、おれはお前のパパじゃねえ」という気持ちを持つようになった。

失敗するデータ分析チーム七つの条件

  1. 経営層が分析結果を見て解釈する素養を持ってない
  2. 分析によりいくら利益が出たか見積もってない
  3. 分析方法に透明性が無い(黒魔術化している)。再現性を確保できていない
  4. データの集計方法が確立されていない。データソースが分散している
  5. ドメイン知識を軽視している

あとは頼んだ!

ナイーブなアルゴリズム

アルゴリズムの分野はでよく "naive algorithm" という言葉を聞く。 これは、おおむね「最初に思いつくような単純なアルゴリズム」というような意味だと思っていたが、次の Q&A サイトの答えがしっくりきた。

cs.stackexchange.com

"one of the things you would think of first, but without realizing a less obvious but important fact" 「あなたが最初に思いつくような実装であり、自明でない重要な事実に気づいていない」

ということで、フィボナッチ数の実装が載っているが、これはわかりやすい。 naive という単語には「複雑さを考慮していない」というようなニュアンスが含まれるため、しっくりきた。

www.ldoceonline.com

Excel の思い出

www.b-chan.jp

これを読んで思い出したのだが、私が新卒入社した会社では、隣の席に Excel データの行列を列行に書き直す仕事を延々としている人がいた。 装置から出力されるデータをソフトウェアに入力する必要があったのだが、新しい装置の出力形式がこれまでのものと行列が反対だったのだ。 彼は一日中データを一セル一セルコピーしては貼り付けることで行列を入れ替えていた。 Excel ではもちろん行と列を入れ替えて貼り付けることができる(当時もあった)ので、彼の仕事はこれを使えば一瞬で終わるものであった。 Officeお役立ちテクニック/Excelで表の行と列の入れ替え

ムシヌユン

都留泰作「ムシヌユン」というマンガが非常におもしろいと思うのだけど他人にすすめるのを憚られる内容なので困りものである。