AIニューラルネットワークは人間のやり方を「学ぶ」と言われています。神経科学者は、なぜそうではないのかを説明します。

Shutterstock

[Published: June 6, 2022 2.06pm AEST]

[AUthor: James Fodor]

Mr. ジェームス・フォドール

メルボルン大学 認知神経科学の博士号候補

記事を音読します。

最近開発された人工知能(AI)モデルは、画像の認識や人間のような言語の生成など、多くの印象的な偉業を成し遂げることができます。しかし、AIが人間のような行動をとることができるからといって、AIが人間のように考えたり理解したりできるわけではありません。

人間が世界についてどのように理解し、推論するかを研究する研究者として、AIシステムが「考える」方法と学ぶ方法が人間のやり方とは根本的に異なることを強調すること、そして、AIが我々のように真に考えることができるようになるまでには長い道のりがありることを強調することが重要だと思います。

広範囲にわたる誤解

AIの開発により、非常に人間のような動作を実行できるシステムが作成されました。言語モデルGPT-3は、人間の発話と見分けがつかないことが多いテキストを生成できます。別のモデルであるPaLMは、これまでに見たことのないジョークの説明を作成できます。

最近では、Gatoと呼ばれる汎用AIが開発されました。これは、画像のキャプション、質問への回答、Atariビデオゲームのプレイ、さらにはロボットアームの制御によるブロックの積み重ねなど、何百ものタスクを実行できます。また、DALL-Eは、テキストの説明に基づいて変更された画像やアートワークを作成するようにトレーニングされたシステムです。

これらのブレークスルーは、そのようなAIの機能、およびそれが人間の知性について私たちに何を教えてくれるかについて、いくつかの大胆な主張をもたらしました。

たとえば、GoogleのAI企業であるDeepMindの研究者であるNando de Freitasは、既存のモデルをスケールアップするだけで、人間レベルの人工知能を生み出すことができると主張しています。他の人はこの見解を繰り返しています。

すべての興奮の中で、人間のような行動は人間のような理解を意味すると簡単に推測できます。しかし、AIと人間の考え方と学習方法には、いくつかの重要な違いがあります。

ニューラルネットと人間の脳

最新のAIは、人工ニューラルネットワーク、または略して「ニューラルネット」から構築されています。 「神経 neural」という用語が使用されるのは、これらのネットワークが人間の脳に触発されているためです。人間の脳では、ニューロンと呼ばれる何十億もの細胞が互いに複雑な接続の網を形成し、信号をやり取りすることで情報を処理します。

ニューラルネットは、生物学の非常に単純化されたバージョンです。実際のニューロンは単純なノード (node) に置き換えられ、ノード間の接続の強さは「重み weight」と呼ばれる単一の数値で表されます。

十分な数の層に積み重ねられた十分な接続ノードを使用して、ニューラルネットをトレーニングして、パターンを認識し、以前に見たものと類似している(ただし同一ではない)刺激を「一般化 (generalise)」することもできます。簡単に言うと、一般化 (generalisation) とは、AIシステムが特定のデータから学んだことを取得し、それを新しいデータに適用する能力を指します。

特徴を識別し、パターンを認識し、結果から一般化できることは、ニューラルネットの成功の中心であり、人間がそのようなタスクに使用する手法を模倣しています。しかし、重要な違いがあります。

ニューラルネットは通常、「教師あり学習 (supervised learning)」によってトレーニングされます。そのため、入力と目的の出力の多くの例が提示され、ネットワークが目的の出力を生成するように「学習 (learn)」するまで、接続の重みが徐々に調整されます。

言語タスクを学習するために、ニューラルネットは一度に1単語ずつ文を提示され、シーケンス内の次の単語を予測することをゆっくりと学習します。

これは、人間が通常学ぶ方法とは大きく異なります。ほとんどの人間の学習は「教師なし (unsupervised)」です。つまり、特定の刺激に対する「正しい (right)」応答が何であるかが明示的に通知されていません。私たちはこれを自分たちで解決しなければなりません。

たとえば、子供には話す方法についての指示は与えられませんが、大人のスピーチ、模倣、フィードバックにさらされる複雑なプロセスを通じてこれを学びます。

Childrens’ learning is assisted by adults, but they’re not fed massive datasets the way AI systems are. Shutterstock
子供の学習は大人によって支援されますが、AIシステムのように大量のデータセットが提供されることはありません。

もう1つの違いは、AIのトレーニングに使用されるデータの規模が非常に大きいことです。 GPT-3モデルは、主にインターネットから取得された4,000億語でトレーニングされました。人間が毎分150語の速度で、これだけのテキストを読むには、4000年近くかかるでしょう。

このような計算は、人間がAIと同じように学習することはおそらく不可能であることを示しています。私たちは少量のデータをより効率的に利用する必要があります。

ニューラルネットは、私たちができない方法で学ぶことができます

さらに根本的な違いは、ニューラルネットの学習方法に関係しています。刺激を目的の応答と一致させるために、ニューラルネットは「バックプロパゲーション (backpropagation)」と呼ばれるアルゴリズムを使用して、ネットワークを介してエラーを逆方向に渡し、重みを適切な方法で調整できるようにします。

ただし、バックプロパゲーションは存在しない外部信号を必要とするため、脳内でバックプロパゲーションを実装できないことは神経科学者によって広く認識されています。

一部の研究者は、バックプロパゲーションのバリエーションを脳で使用できると提案していますが、これまでのところ、人間の脳がそのような学習方法を使用できるという証拠はありません。

代わりに、人間は構造化された精神的概念を作ることによって学びます。そこでは、多くの異なる特性と関連が互いにリンクされています。たとえば、私たちの「バナナ」の概念には、その形、黄色、果物であるという知識、持ち方云々が含まれます。

私たちが知る限り、AIシステムはこのような概念的な知識を形成しません。彼らは、トレーニングデータから複雑な統計的関連性を抽出し、それらを同様のコンテキストに適用することに完全に依存しています。

さまざまなタイプの入力(画像やテキストなど)を組み合わせたAIを構築するためのいくつかの取り組みが進行中ですが、これらのモデルが人間が世界を理解するために使用するのと同じタイプの豊かな心象表現を学習するのに十分かどうかは不明です。

人間がどのように学び、理解し、推論するかについては、まだ多くのことがわかりません。しかし、私たちが本当に知っていることは、人間がこれらのタスクをAIシステムとは非常に異なる方法で実行することを示しています。

そのため、人間のように真に考えて学習する機械を構築する前に、新しいアプローチと、人間の脳がどのように機能するかについてのより基本的な洞察が必要であると、多くの研究者は考えています

この記事は、クリエイティブコモンズライセンス(CCL)の下で The Conversation と各著作者からの承認に基づき再発行されています。日本語訳はarchive4ones(Koichi Ikenoue)の文責で行われています。オリジナルの記事を読めます。original article.

タイトルとURLをコピーしました