二月、革命!

前回の記事で、多くの方から「いいね!」を頂きました。ありがとうございます。

 

その前に、こちらのデータサイエンティストのブログも確認して頂きたい。

tjo.hatenablog.com

非常に明快に手法やTips.などが展開されており、読者としてありがたい。

 

しかし、読みながら、頭の中では、、、

 

『たが、しかし。だが、しかし。』

 

と、言葉にできない疑問と、問題の奥底が見えない不安が襲い掛かる。

 

さて、本題に戻るが、今回は、前回の記事で引用した「統計学の間違い」の中から内容を取り上げ、考察をしてみたい。

この文章自体が、医療向けの用語や例示が数多く、取っ付きにくい心証をお持ちの方もいらっしゃるかと思います。可能な限り、利用出来る形にしようかと考えております。

 

今回は、本文のエラー12で上げている「正常」または「異常」の定義について考察してみる

本文では、検査結果の重要性は、「正常」または「異常」の定義によって左右すると。また、「正常」の定義について6つあると述べている。つまり、診断、治療、リスク因子、統計学、パーセンタイル、社会という見地から見た正常の定義があり、それぞれのフェーズでの定義は異なると述べられている。

 

ある病気の健診を例に考えてみる。

 

健康診断で「病気の疑いあり」と結果を貰ったとしても、即、その病気であると判断するのは、早とちりと言わざるを得ない。

病気が疑わしいと判断されても、その中で本当に存在するのは、実際は3パーセント位とか。

これが「疾患である可能性が高い」と言う、診断的見地と考えられる。

 

「疑いあり」となれば、当然ながら精密検査を経なくてはならない。

専門医の視診から始まり、問診、聴診、触診、打診、そして生体的観察を経て、様々な数値が範囲内かどうかを専門的知見の元、治療を適用するべきなのか?その治療が有益なのか?と判断する。

つまり治療的見地とは、「臨床的に有効なのか?」が定義の要となろう。

 

診断Aで陰性と判断される確率と、検査Bで陰性と診断される確率Bの組み合わせが作られる。それらをポジティブ・ネガティヴとTrueFalseのそれぞれの組み合わせが存在する。前述の診断結果での疑いありなどは、いわゆる「過誤」の領域もあり得て、サンプルが多過ぎても、ノイズが多くなってまともな議論にならない事も注意しなければならないと。

 

第一種過誤と第二種過誤 - Wikipedia

 

本文に戻って、リスク因子の見地からと上げている内容を確認すると、前述の検査では、数々の因子によって、一つの因子では「異常」と判断されないが、別な因子を有する場合は「異常」と判断される事があると。

一般的には、(相互作用)とも呼ばれる事も在ろうか。逆を返せば、「異常値」を有する場合でも、有益性があると判断される場面もあり得るだろう。

 

統計学の見地から、正常の定義の文の最後は、「検査結果の多くは正規分布しない。」と結論している。年収、学力、人口密度、世論の論調、果ては、ルールとモラル、学習の難易度、好き嫌いなどなど、世の中はkhaosにして、群別にして見ると、それぞれが偏在している。

 

一方、統計学の定義では正規分布すると言う前提が一般的(これ自体が前提条件になっているとも言えるか?)である。

つまり、この定義が存在する事で、次のような定義になり得る。

  • 正常範囲は、測定値の平均から上下2標準偏差までの範囲

  • ここにすべての測定値の中央の95%が含まれる、と仮定される。

  • 一方で、正規分布の外れ値となる「異常」上下それぞれ2.5%は、臨床的な意味が無く、単にそれが一般的でないというだけである。

パーセンタイルの話も、前述の「統計学の定義」が前提であるが、正規分布範囲全体における下方(または上方)のパーセンテージとして正常範囲を表し、試験結果全体のうち低いほうから95%を「正常」、上方 5%を「異常」と定義する。 それらは、測定する特性に寄るだろう。パーセンタイルをウィキペディアで検索すると、分位数(ぶんいすう)と言う事で、統計の代表値の一つとして例示されている。中央値、四分位数、ヒンジ、三分位数・五分位数・十分位数、最大値・最小値などなど。

 

ここまで見ていくと、実は、エラー12で提示されていたのは、我々の携わっている業務フローと類似していると思われなかったろうか?

 

例えば、出来上がった部品の検査するべき箇所の寸法、若しくは、重量、平面度、平行度‥etc。その異常値を有する部品をピックアップして、観測、再計測、触れて確認などなどあるでしょう。

先ずは実務者が「疑わしき者(物)」を取り上げ、次のステージに上がるか、はたまた、実務者で対処するかの判断が来る。

その後、疑わしいと判断されたものは、組織の上位レイヤーに引き渡され、精緻な観察や対処法が適切なのか?などの二次判断が施される。

また、測定値が逸脱している場合、処置自体を中止する事もあり得る。こういった場合、しきい値に寄る機械的な振り分けが一般的であり、効率的である。一方で、それぞれの因子だけでは異常と判断はされないが、相互する因子の組み合わせによっては、専門家の判断の元、中止する場合も考えられる。

 

ここで、一冊の本を紹介したい。

富士ゼロックス

「組織のなやみ研究所」

株式会社富士ゼロックス総合教育研究所の組織のなやみ研究所: 01 なぜ、戦略を実行するのはむずかしい?を iBooks で

何故、戦略が実行されないのか?をテーマに、様々な調査を基づき、論を立てている。

企業が立てられる戦略は、そんなに多くは無い中、組織の実務者に実行出来るのかが、経営者の腕の見せ所と言った所だろう。

この著作の中で、「やらない事を止められない」のが、戦略実行の足枷になっていると指摘している。

新たな戦略は、実務者にとっては、今ある業務から、ブラッシュアップするものもあれば、停止すべき箇所も存在するだろう。

今、どういう状況で、何を目指して、何をしようとしているのかは、重々承知したが、実務者に「何で、それやるの?」「何故、その戦略でなきゃならんのか!」と言う事を、納得させるのが、組織の壁になっているとか。

 

改めて。

 

統計学の誤りエラー12の記載は、我々の業務フローに準じて記述しているのだろうか、または、統計学の性質が、大量な案件を処理しようとする会社社会にフィットしていたのか?この時点では、なんとも言えないが、興味深い。

 

さて、前述のブログにおいて、アドホック的な分析を前提に書かせてもらうと記載がある。

 

分析業務の大半は非定型な業務であり、定型的な日常業務が並走する中、行われると想定しているだろう。

定型業務で扱うデータは、前述した組織の悩みから考察すると、断片的、領域を限定する事で誰でも扱いやすく、迅速な処理を前提として業務設計されているかと思われる。

一方の非定型な分析業務は、横断的、包括的な領域や権限の元、それ相応の専門性と適時のアウトプットを要求されるだろう。

 

皮肉な事に、定型業務の現場で形成された知恵や論点などが、中々、分析業務に反映されにくく、分析業務のアウトプットを、現場サイドが改悪だ!と煙たがれる。

その、哀しい現実は、双方ともデータを扱いながらもアプローチが異なると言う立脚点の違いを、実務者・管理者が冷静な頭で理解しなくてはならない。とはいえ、双方ともデータや事実を扱っていると言う自負とそれ相応の根拠が分かり合えず、啀み合う事は中々難しい。

 

今の話を前提に、もし、経営者が、より精度の高い業務を!と望むならば、どう思考するだろうか?多分、双方の良し悪しを鑑みて、一つは、業務フローの解体、もう一つは、分析業務の分業化にと、思いを巡らすだろう。

 

業務フローの解体とは、管理者から実務者へ相当な権限委譲をし、今まで以上の高度な分析を、現場レベルで行うのである。それに伴う人件費の高騰を、先行投資と捉えるか?はたまた、それ以外か?となるだろう。

事象が発生した時に、前例や解法のある内容ならば、迅速な対応が出来る。一方で、筋道を立てて事象に当たると言うケースには、実務者もその筋道に対する根拠が見出せず、管理者側も、指導や軌道修正に骨が折れる。

そういう事に周囲は、分解して仕事をすれば?とアドバイスはもらえる。

しかし、内心、そうじゃねーんだ!と憤りを感じ、耐え偲ぶ。

更に憂慮すべきは、以前のブログの記事にした、日本の子供達の学習能力の高さの裏で、筋道を立てると言った創造性や論理性が、他の国よりも著しく低いのでは?と懸念している。日本の教育って、定型業務を前提とし、如何に早く仕事を処理する事を是とする教育設計になっているのでは?と考えざるを得ない。解法を解く技術よりも、それらを活かす知恵の熟成と人口減少社会の中で継承をする熱意が在るのか?甚だ、疑問である。

kamimura0219.hatenablog.com

もう一方の、分析業務の分業化だが、内容の熟知や、事象に対する組織の目論見が共有されやすくはなるだろう。しかし、前述の通り、筋道を立てるのが厄介であり、この部分の共有は、人数が増えると困難を伴う。

特に、分析業務に社内のリソースを割く事が難しい、規模の小さな企業はルーチンワークの定型業務を如何に増やすか?に集中し、中々統計学やデータサイエンスなどの関心が薄いのでは?と憂慮するばかりである。

こういった企業の場合は、特に、経営者が管理者を兼任しているケースも多く、かなり経営者の個性が色濃く反映されるだろう。(かく言う小生も、相当に泣かされてきました)

そんな彼らに、実務者から導入を試みようとするのは、中々、挑戦的で有ろうが、とはいえ、憂慮するばかりである。

非定型な分析業務は、定型業務に従事する実務者の人数に比して少なく、援軍やサポーターの存在が無ければ、苦しいところである。

 

経営者の理想を言えば、定常業務の持つ、組織の強堅性と迅速さを持ち合わせながら、非定型な分析業務で得られた新たな知見を、顧客・従業員・関係者のそれぞれ三者の納得を得て、包括的な合意が得られるのか?が、気になるところとなるだろう。

問題を、実務者側が主導しているのか、分析クラスタ側の意見を汲みしてくれる組織なのか?現実的には、実務者側の声量が、大きく強い意見が蔓延る中で、コンセンサスを形成するのが課題かもしれない。

 

とはいえ、こんな不毛で、出口の見えない対立構造を提示して終わり!と言うのは、中々厳しく、何処に落とし所が在るのか、悩んでいた所、この雑誌の巻頭言に手掛かりが有ったので、紹介したい。

 

WIRED VOL.21(GQ JAPAN.2016年3月号増刊)/特集 音楽の学校

WIRED VOL.21(GQ JAPAN.2016年3月号増刊)/特集 音楽の学校

 

 

この雑誌が、今回、音楽の学校をテクノロジーや新たな思考をもとに運営されている方々を紹介しながら、巻頭言に、産業革命以降、肥大化した「経済」と言うシステムが、社会を埋め込んでしまった事に危惧を示している。

 

統計そのものも、見えないデータと言う切り口が、時に対立構造や組織のアイデンティティを生み出し、彼らのエコシステムを形成しているかもしれない。

 

それらを動かす全ては『人』であると明記し、この粗分な文章を閉めたいと思う。