ライフイズビューティフル

訪問記/書評/勉強日記(TOEIC930/IELTS6.0/HSK5級/Python)

2020年書評#6 | 人工知能はどのようにして「名人」を超えたのか? | プロ棋士を生み出した将棋ソフトイノベーション

今年、一人のアゲアゲさんこと折田さんがアマからプロへと編入しました。

アゲアゲさんのYoutubeで語られていたのですが、昔は中々できなかった「将棋で強くなる」ということが思っていたよりも簡単にできるようになったと語っています。

それは将棋ソフト研究です。

より正確な表現で、元々強かった終盤に加え、ソフト研究による序盤の差し回しで正解に近づけれたため強くなることができた、と語っています。

ohtanao.hatenablog.com

まえがき

将棋の世界は様々な分野に先駆けて人工知能の導入が行われ、アゲアゲさんの事例のように活用が活発に行われています。機械を活用して発展している例です。

将棋ソフト研究から生まれた数々の戦法をプロ棋士が指すというように、将棋ソフトを活用して将棋の質がぐっと上がったように思います。

コンピューターを活用した物事の発展というのは、そもそも数値化(最適化)が難しいようなセンスだよりの物事を、様々な指標を正解に結びつくパラメーターと仮定し、頑張って無理くり正解を導こうとするプロセスです。

この人類意外の物が人類を超えることに対する嫌悪感や拒否反応は「得体のしれない何かに支配されている」感覚からくるのか、受け付けない人も少なくないですが、将棋の世界の知的な棋士たちは上手く活用しています。

人間の限界を機械に教えてもらい、発展する(強くなる)なんて、中々ロマンのあることだと思いませんか?

 

機械の得意なこと

ポナンザの開発者、山本一成さんはコンピュータのできることは本質てきに2つのみと言います。

コンピューターのできる2つのこと:「とても簡単な計算」 「記憶」

コンピュータが難問に挑戦する時にものすごい事が行われていると思っているかもしれませんが、計算と記憶を組み合わせているだけのようです。

また、将棋などの知的な行動、はおおよそ2つの行為を駆使しています。

知的な行動の内容2種:「探索」「評価」

人類はこの知的な行動が優れていたため、どこに向かえばご飯があるのか、何をすれば生殖に有利なのかを探索、評価して「未来を予測」してきました。

未来を正確に予測するためには探索と評価を組み合わせる必要があります。

ここで山本さんはエミュレート(主観や価値判断を加えずに物事を推測する)とシュミレートという言葉を使って定義します。

エミュレート:探索

シュミレート:探索+評価

エミュレートは機械的で正しさ優先の判断基準であるために、間違う可能性が低い予測手法であり、安全や正確性が求められる、航空、金融などの産業で活用されます。

一方、将棋は探索だけでなく正しく「評価」をしなければよい手にはたどり着けないという事がわかりました。人間がよい手を探すのと同じプロセスです。

人工知能の冬の時代では、人間の知を模倣することを目的に研究されていましたが、ある時期から人工知能と人間の知は2つの別ものとして見られるようになります。これは人間の思考を模倣するのが複雑すぎるからです。

そうすると研究者たちは機械が得意な「計算」と「記憶」を用いて「評価」を行おうとします。その過程で機械学習ディープラーニングの活用が始まります、人工知能冬の時代が終わりを告げます。

機械学習人工知能の一部。評価をコンピューター自身に自動的に調整してもらう手法。

ディープラーニング機械学習の一種。画像認識により洗練された対応が得意。

将棋での機械学習

コンピューターが正解にたどり着けなかった問題は、そもそも将棋の何を、どのように計算すればいいのかわからなかった、から人間に勝てませんでした。

人間も、どのように勉強したら良いかわからないと物事の習得が遅いのと同じでコンピューターも何をしたら良いのか分からなかったのでしょう。なぜなら、将棋の評価は「味がいい」「手厚い」「思い」といったニュアンスでの判断が多く、またチェスと比べて局面が非常に多い競技だからです。

そこで、プロ棋士の指してから学ぶ「教師あり学習」を行います。プロの棋譜は5万局ほど残っており、プロの指し手を正解とすることで値付けをし正解・不正解を点数化していきます。

ただし、5万局というデータ量は機械学習にとっては少ないようで、教師例の少なさをタグ付けした画像の回転などかさ増しして補いました。

そうすることで山本さんはポナンザのコーチとなり、ポナンザが自身で正解・不正解を学習し、山本さんにとうとう将棋で勝つことになります。

山本さんはこのときの心境を語っています。

「これほどくやしく、そしてそれをはるかに上回る喜びを私は味わったことはありません。普通、人間は自分が作ったものが、知的な意味で自分を上回る経験はできません…

ポナンザは私の子供で、そして私を超えたのです。」

人工知能の構成要素は、プログラマが書いた部分(探索)と人工知能が学習した部分(評価)になります。評価の部分をプログラマが行う必要がなくなり人工知能プログラマから卒業したことになります。

ディープラーニングという黒魔術

落合陽一さんもよく言いますが、なぜか分からないが計算機の方が良い結果をもたらす魔法の世紀に今差し掛かろうとしています。ポナンザも「よくわからないが」人間よりも良い手を指します。

機械学習の手法は多義に渡り、ディープラーニングSvM、ランダムフォレスト、ロジスティック回帰などがあります。ポナンザは2017年時点でロジスティック回帰をベースに機械学習している一方で、近年ディープラーニングという手法が様々な分野で使用されています。

ディープラーニングの活躍の場は大きく3つあり、「言葉」「音声」「画像」です。様々な入力と出力の自由度が高いディープラーニングは入力を音声にして出力を画像にすることもできます。

ディープラーニングは画像の扱いがとても得意です。そのため、言語であれ何であれ、なんとか画像に結びつけることができたら、ディープラーニングの得意な対象となります。

山本さんは、ディープラーニングの性質から「知能とは画像である」という仮設を考えているようです。もしかすると、人間は目があったから脳が進化したと結論付けられる未来は遠くないかもしれません。

人類が受けた教育では「物事を分解し、細部の構造を理解していけば、全体を理解できる」という還元主義でできています。より科学的な考え方です。しかし「人工知能は科学ではない」と言われるように、もはやなぜ優れているのか分からない状態、は科学の範疇を超えているのかもしれません。

知能と知性

山本さんは、人工知能が「プログラマ」「科学」「天才」から卒業し「人間」からも卒業するかもしれないと言います。

知性:目的を設計できる能力

知能:目的に向かう道を探す能力

現時点で知性の部分は人間が設計しなければいけません。つまり、「将棋で勝つ」という目的です。人間は目的の設計ができ、また目的までの距離が遠い時には中間の目的を設計できます。

コンピューターも中間の目的を設計できれば知性を手にすることができるでしょうが、山本さんの勘では「今のプログラムの構造は、中間の目的の設計が可能なようにできていない」と説明しています。

人間は意味と物語にとらわれているために目的を設計できます。これは、人間の可能性であると同時に限界でもあります。

一方、プログラミング言語は人間によって作られているため、人間の都合にあった、人間の思考の限界を超えることはできないようです。

 

人間から卒業するためには知性を身につける必要があります。2017年時点で一つの方法論としては複数のディープラーニングを組み合わせることです。

ディープラーニングが相互に連携し、他の目的に「転移」させる事ができれば知的活動が可能になってきます。「The Deepr、The Better」と深ければ深いほどうまくいくという格言が生まれています。

 

シンギュラリティ

シンギュラリティ(技術的特異点)を提唱したレイ・カーツワイル2045年にシンギュラリティが起こると予想します。つまりコンピューターの知性が人類の知性を上回る時です。

人間は「指数的な成長を直感的に理解できない」ため、人工知能の指数的な成長に気がつく頃にはあっという間に追い抜かれてしまう。そういった事が様々な分野で起こるであろうと予測されいます。

山本さんは人工知能が人間から卒業し「超知能」が誕生するのは確定的だとしています。その時に「いい人」であれば人工知能は敬意を払い人類を扱ってくれる、尊敬と愛情を感じる関係であるよう山本さんは祈っています。(いい人理論)

 

この本はどんな人におすすめか

人工知能が得意なこと、まだできていないことについて学術的な話を抜きにわかりやすくまとめられてます。

人工知能に対する認識が無い、テクノロジーに対して無知である人にとっても十分に読みやすい本ですので、人工知能の現状と未来予測をする人たちにとってはとても良い本だと思います。

中でも黒魔術化していき「なんでか分からないが良い判断がされる」という点に対して認識を持っているのはとても重要なのではないかと思います。よく分からないなか人工知能を怖がり、煽られて不安に苛まれるよりは、人工知能との共存による新しい豊かさに心を躍らせるというマインドを持てるのではないかと思います。

巻末にアルファ碁とセドルさんの囲碁の解説がありますがそれもとても興味深くかったです。もはや政治の判断よりも囲碁の判断の方が難しいであろうといいます。

人工知能の場合根回しができずや人間の感情を汲み取った判断や責任は取れませんが、もはや人間の判断よりも正解が多いので、そういった人工知能のミスを認めながら意思決定は人工知能に委ねるという世の中もそう遠く無いのではとも感じられます。

ohtanao.hatenablog.com

そういった世界ではセンスに頼った判断から開放されるのでしょうか。この世界まではまだまだ到達はできないと感じていますが、少なくとも心の準備はしておきたいものですね。「人類は指数的な成長」に対して感じることが苦手なのですから。