単刀直入だが、機械学習を論破してみる。

機械学習とは、データから反復的に学習し、そこに潜むパターンを見つけ出すことです。 そして学習した結果を新たなデータにあてはめることで、パターンにしたがって将来を予測することができます。 

機械学習の入力は、最近の進化は目まぐるしく、文書だけでなく、画像、音声、動画でも対応出来る様になったと聞いている。一般的な手続きを鑑み、機械学習とは何ぞや?と考えると、以下の通りとなるだろうか。

1、(black box)に、反復的に学習する。
2、(学習内容から)パターンを見つける。
3、結果やパターンを(black box)に定義する。
4、パターンに従って、新たな入力に対して予測をする。
※()内は、筆者加筆

さて、懸念すべきは何か?
一つ目は、学習させる内容そのもので有ろう。類する「構成要素」を(black box)に学習をさせるが、素朴な疑問であるが、
何を持って「類似する」を判断するのか?

寺田 寅彦著「比較言語学における統計的研究法の可能性について」にこんな記載がある。

“統計的方法の長所は、初めから偶然を認容してかかる点にある。いろいろな「間違い」や「杜撰」でさえも、最後の結果の桁数には影響しないというところにある。”

成る程、偶然を認容してかかる点とは、鋭い示唆と言える。しかし、例えば、学びもしなかった他言語を機械学習が出来るのかと言えば、ある程度の良識・常識・倫理観が必要となるかも知れない。
例えば、美人の定義とは何か?と問えば、性差を始め、シチュエーション、社会的立場などなど考慮する必要が有ろう。それらを一般化するのは、ある種危険な賭けである。

更に、精度を上げたいと願えば、領域を限定して深く探ろうと考えるのは、人の常であろう。何を持って偶然と判断し、何を持って倫理違反と断ずるのだろうか?そこら辺の境界線は、一体、何だろうか?

次に、「時」についてである。
「反復的に学習」をさせていた時と、
「新たな入力」をした時に、
どれくらいの時間的変化があるのか?というのを議論がされていないだろう。時事刻々と価値観が変わる社会であるのは、昨今のニュースを見ていても感じる。
これ又、素朴な疑問であるが、二つの時間差は、議論に登らないのだろうか?

「入力に対する内容と出力結果」のロスというのを、これ又、素朴な疑問であるが、議論にならないのだろうか?
機械学習は、統計学で言う所の「判別分析」
の一種と看做せる。前述の通り、出力結果は○と✖️の二種類である。確かに、入力すべき内容が相当量あるのも事実で有ろうが、経営者的な視点で考えると、生産性や汎用性が少ないのでは?と考えるのは小生の邪推だろうか?

前述にて、生産性について懸念を示したが、
学習をさせた(Black Box)は、この機械学習でしか使用できず、再利用出来ないというのは、わたしの学習不足なのだろうか?

さて、機械学習、就中、判別分析という手法を批判的に見てきた。ここで視点を広げて考えてみる。

ここで、一冊の書籍を紹介したい。

taschen“East meets West.”


西洋と東洋のそれぞれの文化で生活をしてきた筆者がそれぞれの捉え方を、インフォグラフィックを用いて表現している。
その中の一枚に、個人の物事の捉え方を描いた一枚がある。西洋は、個々人が画一的な捉え方を対人で意見を戦わせる。比して、東洋は個々人が画一的にならず、違う見方も寛容している。これを時として「ずるさ」となるかも知れない。