ビッグデータを学んでも、ギャンブルは上手くなりません(確信)

また、あの雑誌が
統計学」の特集を組んだんだって。

・・・(はぁー)まぁ、いいかっ。

本題に入ります。

先日、こんな記事を読みまして。

ゲームを体系的に捉えて見ようという事で、講演されており、その記事を参考に、今回、書いて見ました。是非、此方を読んで頂いてから、お読み下さいませ。

「統計及び分析」の定義

⚫️分析によって、有意差や効果が確認出来る観察、実験の全てとする

「正解」の存在とゲームの分類
この定義に則ると,その「分析」の中での
観察者、若しくは、意思決定者の振る舞いに,ベストなふるまいが存在する可能性が生まれる。
この「ベストなふるまい」を,仮に「正解」と定義した。そしてこの「正解」の
あり方によって,統計はいくつかのタイプに分類した。

(1)正解が存在し,その内容が明らかで,実行も容易である。
実行がきわめて容易なプロセスによって
面白さが作られている。
何をどうしたら勝てるのか,とても明白で,かつ簡単に実行できる。いないいないばぁなどの儀式的ゲーム(遊び)も含まれる。
例せば、管理図を用いた品質管理や、記述的アプローチによる描写など。システムの保守管理のための定期的な検証などもそうだろう。

(2)正解はないが,ベターと思われるやり方がある「これさえ達成すれば良い」という絶対の選択は存在しないが,プレイヤーは与えられた条件から「こうすればベターなのではないか」という選択肢を探すことになる。
過程における創意工夫や仮説の検証を楽しむ,いわゆる思考ゲームは,このジャンルに入る。

⚫️仮説の検証
専門の領域のルールや慣行、若しくは、業界の倫理観に照らし合わせながら、仮説の構築やデータの収集を行う。
方法論は、比較的周知されており、陳腐化したと批判の一方で、公示した際、一定の妥当性を持って受容される。
⚫️分析結果の「指標化」
各専門分野には、その領域で重用される指標が数多く存在する。
例えば、
教育分野の項目応答理論や、
経済分野の物価指数、
工学分野のQC7つ道具・バスタブ曲線
医学分野の生存時間解析などなど。
そこで提示された数値は、組織の中であらゆる伝達を行い、各ポジション毎に、何を行うべきか?を明示的、若しくは、暗黙的に提示される。
(3)正解はあるが,実行は困難。

何をすればいいかは明らかだが,それを実行するのが難しいアクションゲームや,スポーツがこれに相当する。プレイヤーは
実行の精度や練度を鍛え,その上達を楽しむ
例えば、あるシステムの壊滅的なトラブルに対する、熟練者の解決策を考える。
非定常な動きや出力に対して、熟練者の持ちうるリソースと、限られた時間に改善を
しなくてはならない。
いわゆる、平常運転ではない挙動に、時として、そのシステムに悪影響を及ぼすリスクを承知の上で対応する事もあり得るだろう。
若しくは、全体のシステムから切り離し、
別の領域にて検証を要するかもしれない。
定常とは異なりながらも、ある一定の解決をする際は、定常とは異なるモデルや仕様になっている事は、自明である。
データ分析の世界では、非定常な分析を
アドホック分析」と称している。こういった分析をするには、唯、分析に長けていればいいと言う短絡的な事ではなく、その業種の其れなりのルールや法則も理解した上で、分析者としてのセンス(例えば、どこのパラメータは採用しないで、新たなパラメータで分析するなど)やテクニックを駆使して、成果を示す事になるだろう。
(4)正解が存在するが,それが隠されている

隠された正解を探すタイプのゲーム。パズル・クイズ・なぞなぞ・リアル脱出ゲーム

昨今、統計界隈を賑わせている、ディープラーニングや、テキスト・データマイニング、人間が処理しきれないデータログの解析をするビッグデータの類もこの領域とする。
また、数量化Ⅱ類の様な、解析結果の解釈を、分析した人に委ねるのも、この領域に加えてみる。
(因みに、実験計画法も数量化Ⅱ類のパラメータを簡略化させた一種である、と聞いた事がある)
この領域では、仮説構築から演算までの
煩雑さだけでは無く、演算結果の解釈と言う、思考する箇所、若しくは、センスが問われる箇所が多く存在する。

さて、元記事のゲームの分類を参考にして、統計及び分析の分類を行ってみた。
幾つか、思う所が有った。整理して見よう。

まず予め、お伝えしなくてはならないのは、この順番が何かしらの優劣を評する
ものではない事は確認しておきたい。

その上で、この順列が心理的、若しくは、物理的なコストとみなす事も可能となった。

また、指標化とモデル化と言う2つの方向性を上手く理解する一助となりうるだろう。

3と4を比較すると、作業若しくは測定者と、(あるシステム内の)分析・制御する構築されたモデルとの関係を記述している。

3と4の関係は、どちらが主で、もう一方が従の関係として捉えられる。ここでは例示せず取り上げなかったが、4を突き詰めるとギャンブルの領域となり、人々が或る確率統計モデルに翻弄される事となる。3と4の関係は、危ういバランスの中で生存している。