人工知能(AI)の最新状況(生成AI、ChatGPT、AGI等)

AI

人工知能(AI)について

当サイトを閲覧いただきありがとうございます。

本記事では最近何かと話題な人工知能(AI)の最新状況について私なりに整理したものです(2024年1月執筆時点の状況)。

AIについては日々新しい情報が出てきており、その全てを追うのは専門で活動している人達以外は不可能だと思います。

そのため、本記事ではAIに関して話題性の高いものを中心に上げていき、あまりAIに詳しくない人が「今のAIってこんな感じだな~」とざっくり理解してもらえると良いかと考えています。

私自身もAIについてはまだまだ勉強中ですので、こういった記事にまとめることで自分の理解を深めることと、同じようにこれからAIのことを知っていきたいと考えている人に少しでも参考になればと考えています。

そもそもAIとは何か

まずAIの最新状況について解説する前に、そもそもAIとは何かについて簡単に説明したいと思います(既に分かっているという人は飛ばして良いです)

AIは「Artificial Intelligence」の頭文字を取った略称で日本語では人工知能とも呼ばれますが、最近はAIという呼び方をされることがほとんどだと思います。

そして、AIについて最初に知って欲しいことは「AIに明確な定義は存在しない」ということです。

は?と思うかもしれませんが、元々AIというのは1955年にジョン・マッカーシーという科学者が初めて提案書で使った用語でその時は「知的な機械、特に、知的なコンピュータプログラムを作る科学と技術」と説明されていたとのことです。

ただ、それが定義になった訳ではなく、今でも科学者達の間ではAIをどのように定義するかは解釈が分かれているというのが実情のようです。

世間のイメージとしては割りとジョン・マッカーシー氏の説明している、知的な機械や知的なコンピュータプログラムが近いとは思いますが、簡単に言えば「知能が有る(人間と同じようなことが出来る)のがAI」という印象ですかね。

とは言っても「知能」や「知性」という概念自体が明確に定義されておらず、何が出来れば知能が有ると判断するのかという大きな問題が有るため、現状はAIも明確に定義は出来ないということです。

ならば最近良く聞くAIとは何かという話になりますが、先程説明したのは「狭義のAI(強いAI)」であり、最近良く聞くAIは「広義のAI(弱いAI)」となります。

強いAI(汎用型AI)

狭義的な意味でのAIがこの「強いAI」であり、簡単に言えば人間と同じように知能や心を持ったAIというものになります。

昔からのSFで良く出てくるような、人と同じように生活してサポートしてくれるロボットがこの強いAIということです。

本記事執筆時点ではこの強いAIというのは未だ実現されておらず、最終的にはこの強いAIを生み出すことがAI界隈の最終到達地点という感じになっています(人によっては違うかもしれませんが)。

本来的にはこの強いAIこそがAIと呼ばれるものですが、実際に現時点で活用されているのは特定の分野のみに特化させたものであり、その分野の中だけであれば知能は無くとも擬似的に人間のように振る舞ってくれるのが、弱いAIというものです。

つまり、現時点で使われている弱いAIは便利な従来のソフトウェアの延長上のようにあるものであり、本質的な知能や心を持った強いAIとは根本的に異なるものと言えます。

ちなみに強いAIという呼び方に違和感を感じるかもしれませんが、これは1950年にアラン・チューリングという数学者が発表したチューリングテストとそのテストに反論した哲学者のジョン・サールの思考実験が元となった呼び方です。

また、元々は強いAIと汎用型AIは同じような意味で使われることが多かったと思いますが、最近は知能や心を持つまで至らなくても、広範囲の問題に汎用的に対応できるAIを汎用型AIと呼び、強いAIと区別されるようになっています。

そして、この汎用型AIは最近「AGI」という言葉で呼ばれることが多くなっており、このAGIの実現はそこまで遠い未来の話ではないと予測されています。詳細は下のAGIのところで解説します。

弱いAI(特化型AI)

「弱いAI」というのは上でも述べた通り、知能や心を持たないAIとなります。

現在活用されているAIは全てこの弱いAIに該当し、現状は特定の分野のみに特化させることで擬似的に人間のように振る舞ってくれる特化型のAIとして活用されています。

少なとも現状は弱いAIと特化型AIはほぼ同じ意味となっていますが、もしも今後特化型AIに知能を持たせたようなAIが出てくれば、特化型AIでありながら強いAIでもある、というものが生まれる可能性はあるので、すでに弱いAIと特化型AIを明確に区別している人もいます。

尚、最近の「生成AI」と呼ばれるものは全て「弱いAI」であり、かつ「特化型AI」になります。

具体的には良く話題に挙がる、様々な質問に対してまるで優秀な人間のように回答してくれる「ChatGPT」や「Bard」、依頼した要件に基づいて画像を生成してくれる「Midjourney」や「Stable Diffusion」等が代表的なものになります。

近年における生成AIの躍進が顕著で様々な作業を人に変わって代替してくれる可能性が出てきています。

生成AIとは

生成AIは文字通り、文章やファイル、画像、動画等の何らかのコンテンツを生成してくれるAIの総称であり、厳密な定義は存在しません。

一番有名な生成AIを使ったツールは「ChatGPT」となりますが、「ChatGPT」は2022年11月30日にリリースされ、入力に対してまるで本物の人間が回答してくれたような振る舞いをすることで世界に衝撃を与えました。

また、入力された指示に沿った画像を生成してくれるツール、「Midjourney」や「Stable Diffusion」というものも登場し、誰でも簡単にイラストを作成できるということで、こちらも多くの人に衝撃を与えたと思います。

2023年は生成AIの活躍の場が飛躍的に広がり、一般層にも認知され始めた年となりました。2024年以降は活用する人が徐々に増え始めて、数年で生成AIを仕事や趣味に使うことが一般化するものと考えられます。

ただ、生成AIについては懸念事項も当然多く上がっており、一番問題視されているのが学習データに使われている文章や画像の著作権侵害です。そのため、いくつかの国では規制が入ったり、訴訟を起こされるといったことも出てきています。

それ以外にも誤った回答を正しいように伝えてきたりもするため、利用時は人が最終チェックすることが非常に重要です。

その他にも生成AIを悪用した「ディープフェイク」といった偽動画等による、悪質なデマや詐欺等も拡大しており、生成AIが全てを解決する万能の道具では無いということを理解しておく必要があります。

ですが、私は初期のパソコンやインターネットの普及の時と同じで様々な懸念は有りつつも、その便利さから普及することはほぼ確実であると考えています。

そのため、これから来る生成AIが一般化する時代の変化に付いて行けるかどうかで、次の時代でも活躍出来るのかが決まってくると思います。

生成AIを使ったツールについて有名なものを以下に挙げておきます。この界隈は日々新しいツールが出てくるので、今後も様々な便利ツールが出てくると思うので、情報のキャッチアップは忘れずにしないようにしましょう。

ちなみに本記事のトップ画像も「Stable Diffusion」で生成したイラストです。
ChatGPT文章、画像生成最も有名な生成AIであり、基本的には入力された質問に対して回答してくれるチャットBotだが、他のチャットBotと比べて段違いの精度を誇る。GPT-4からは画像生成も出来るようになり、更に様々な用途に特化したGPTsも公開されており、常に生成AIの最前線にいるツール。
Bard文章生成GoogleがChatGPTに対抗してリリースした生成AIツールであり、現時点ではChatGPTの後塵を拝しているが、最新LLMの「Gemini」が完全に提供されたときに評価がどのようになるかは未知数。
Midjourney画像生成画像生成AIの先駆けとして話題となったツールであり、このツールで生成された絵が米国のコンテストで1位を獲得したことで大きな波紋を読んだ。画像生成AIでは一番メジャーと思われる。
Stable Diffusion画像生成画像生成AIのブームを作ったツールであり、一番の特徴はソースコードやモデルを公開されているため、自分のPC上でも動作する環境を作れてしまうという、これまでの常識を大きく変えたツールでもある。自分のPC上で自由にカスタマイズしてイラストを作成出来るため、AI絵師という人々が多く誕生した。
Canva文章、画像、動画、音楽生成Canvaは元々画像や動画、文章を作成や編集等が出来る幅広い用途に対応したツールで、生成AIの波に乗って画像生成やそれ以外の文章生成や音楽生成も出来るようになっている。
Adobe Firefly画像生成AdobeもPhotoShopやIllustratorというサービスを元々持っているのに加えて、画像生成AIを使った画像の作成を組み合わせることで既存サービスとの相乗効果も期待できるツールとなっている。
Suno音楽生成テキストから音楽を生成するAIはGoogleやMetaがすでに出していたが、Sunoはユーザーが自由に歌詞を追加したり、ボーカルすらも生成することが出来るということで大きく注目された。
Stable Audio音楽生成名前からも分かる通り、Stable Diffusionを開発したStability社が出しているツールであり、入力した要素に沿った音楽を生成してくれるツール。Sunoのような柔軟な機能は無いが、他のGoogleやMetaのツール等と同じように自分の好きなサウンドを生成できる。
Runway動画生成テキストから動画作成したり編集したりすることが出来るツール。また、静止画を動画化することも出来ることから、本ツールに限らず動画生成は今後大きく活用されることになると考える。
VideoPoet動画生成Googleが提供しているテキストから動画作成したり編集したりすることが出来るツール。他の動画生成ツールと違うのはGoogleが持っているBard等の他AIツールと連携することが出来る点。

AIの歴史

ここまでで直近のAIの状況について簡単に解説しましたが、そもそも今の生成AIはいきなり出てきた訳ではなく、長い間AIは地道に研究・開発が進んできていました

そして生成AIが出来たことで一般層にも広く認知されたということになります。そのため、AIについてはこれまでの歴史を知っておく方が今後理解する上で重要になってくると思います。

詳細に解説するとそれだけでかなりの文章量になるため、大きな動きのあったイベントについてのみ解説していきます。

もっと詳細に知りたいという方はWikipediaの「人工知能の歴史」を閲覧いただくと、より詳しく分かると思います。
第1次AIブーム1950年代アラン・チューリングが「チューリングテスト」を提案
ダートマス会議で「人工知能」という用語が初めて使われ、AIの研究が始まる
1960年代初のチャットボット「イライザ(ELIZA)」が開発される
1970年代期待された性能が実現出来ず、AI関連の資金調達が難航しブームは終焉を迎える
第2次AIブーム1980年代特定の専門分野に特化した「エキスパートシステム」が普及し始めたことで、第2次AIブームが始まった
実用的な応用も出てきて大きく進展はしたが、AI専用ハードウェアの維持コスト等が非常に高く、学習機能等もなかったことから、失望が広がり資金調達が再度難航し始めたことでブームは終焉を迎える
1990年代「ディープ・ブルー 」がチェスの世界チャンピオンを初めて破る
第3次AIブーム2000年代機械学習の研究・開発が進み、特に「ディープラーニング」を応用した画像認識や音声認識等が様々な分野で活用され始める
2010年代これまで難しいとされてきた囲碁で、「AlphaGo」が世界トップクラスのプロ棋士を破る。
インターネットを介して様々な組織が莫大なデータを保存・管理するようになっており、これを「ビッグデータ」と呼んで、AIの学習に利用し始める動きが活発化する
AIを利用した自動運転の研究・開発が進み、条件付きで公共道路でのテスト等が開始される
「Attention Is All You Need」という論文で「Transformer」と呼ばれる深層学習モデルが発表される
「Transformer」をもとにした、「BERT」や「GPT」等の大規模言語モデル(LLM)が開発され始める
2020年代Open AI社が「GPT-3」を公開、またその後に公開されたチャットBotである「ChatGPT」がほとんど人間が回答しているのと同じような精度であったことから、世界に大きな衝撃を与えた
Open AI社が画像生成AI「DALL-E」を公開、続いて他社からも「Midjourney」や「Stable Diffusion」等の画像生成AIが次々と公開され、生成AIが世界に大きく注目されるようになった
上記の流れを見ただけでAIの歴史を完全に理解をすることは難しいと思いますが、つまり今の生成AIというのは「人工知能」という概念の上に「ディープラーニング」や「ビッグデータ」を土台として、「Transformer」の考え方に沿って作られた大規模言語(LLM)を基盤として使い、生成AIがそのうえで動いているというイメージですかね。

これまでのAIの歴史が積み上げて来たものを全て活用して実現しているのが生成AIであって、いきなり出てきた技術ということではないということが分かるかと思います。

まぁ、文章生成以外の画像生成AI等は中核技術はGANやVAE等でLLMが直接的に生成している訳ではないのですが、そこまで説明すると専門的な内容になるので今回は割愛します。

大規模言語モデル(LLM)とは

上の歴史で出てきた大規模言語モデル(LLM)がそもそも何かという点についても簡単に補足しておきます。

LLMはAIの歴史で登場した、「ディープラーニング」と「ビッグデータ」を用いてトレーニングされた自然言語処理(NLP)モデルのことであり、要は大量のテキストを学習することで、人が話すような自然な言葉を処理出来る様になったAIのことです。

生成AIと呼ばれるツールは表面上は「ChatGPT」等のサービスを介して利用しますが、その「ChatGPT」の裏側で動いているものが「GPT-3.5」等のLLMで、このLLMが入力されたテキストを適切に処理してくれるから生成AIが動作するという仕組みです。

つまり、LLMはパソコンで例えるならWindoes等のOSのようなもので、そのWindoesの上で生成AIというExcelみたいなソフトウェアが動いているイメージでしょうか(OSとは若干意味合いが違うかもしれませんが)。

基本的に有名なLLMは歴史で登場した「Transformer」という深層学習モデルをもとにして作成されており、例えば有名なGPTシリーズもその名前は「Generative Pre-trained Transformer」の頭文字を取ったものであり、最後に「Transformer」が入っていることからも影響が分かると思います。

最近は様々な企業が独自のLLMを発表しており、今後LLMの開発競争は更に活発化していくとは思いますが、上でも書いた通りLLM自体はOSのような頭脳部分であり、単独では通常ユーザが利用することは困難です。

そのため、今後はLLMを利用したAPIやWEBサービスを公開する企業が増えてくるのではないでしょうか。そしてユーザは数あるLLMの中で用途に応じたものを取捨選択して今後活用することになるかもしれません。

もしくはChatGPTのような現行で優勢なツールが他のLLMとも連携して、最適なLLMまでを選択したうえで回答をしてくれるようなサービスを行う可能性もあります。

参考までに有名なLLMについて以下に挙げておきます。
GPTOpen AIChatGPTが使用しているLLMであり、その精度の高さから世界に衝撃を与えた。GPT-3.5は3550億のパラメータ、GPT-4は非公開だが5000億以上のパラメータ数を持っていると言われている。
BERTGoogleTransformerをもとにした自然言語処理モデルで2018年の公開時には自然言語処理のタスクにおいて最高スコアを出したLLM。パラメータ数はLargeで3.4億。
PaLMGoogleGoogleのBardに搭載されているLLMであり、パラメータ数は非公開だがPaLM の時点で5400億と言われているので、PaLM 2は恐らく5400億以上と考えられる。
GeminiGoogleGoogleが公開した最新のLLMで今後Bardにも順次搭載されていく見込み。バージョンがNano、Pro、Ultraの3タイプが存在し、ベンチマークではUltraはGPT-4を上回っていると発表されている。パラメータ数はNanoが32.5億と発表されており、それ以外は非公開となっている。
ClaudeAnthropicOpen AI社の元メンバーが作ったLLMでチャットボット「Claude 2」に搭載されている。特定の分野ではChatGPTを上回るとも言われている。パラメータ数はClaude 2で520億と言われている。
japanese-large-lmLine「LINE」が開発した36億パラメータの日本語LLMであり、入力された文章の続きを書いてくれるというモデル。
ちなみにLLMの精度は「計算量」「データ量」「パラメータ数」の3つの影響が大きく、加えてその他の要素(トレーニングデータ等)も影響するためパラメータ数が多いモデルの精度が高いと決まっている訳ではないです。

そのため、上記でパラメータ数を記載していますが、その数値だけを見て精度の高さを保証することは出来ないのですが、ただ大体はパラメータ数に応じたデータ量や計算量を備えていることが多いので、パラメータ数が多いLLMはやはり精度が高い傾向は有るように見えます。

今後のAI(シンギュラリティ、AGI、ASI)

最近のAIの状況とこれまでのAIの歴史を簡単に解説しましたが、最後に今後のAIがどうなっていくかについても触れておきます。

先ず今後のAIを語る上で重要な単語がいくつかありますが、ここでは有名な3つの単語である「シンギュラリティ」「AGI」「ASI」について説明します。

シンギュラリティ(技術的特異点)

シンギュラリティという言葉は1983年にヴァーナー・ヴィンジ氏の論文「来るべき技術的シンギュラリティ」の中で初めて登場し、それ以降は様々な著名人がいつシンギュラリティが到来するかを議論するようになりました。

言葉の意味としては「人工知能(AI)が人間を超える知性を獲得した時」を指し、それ以降は「AI自身がAIを開発する」ことになることから、技術の進化が加速度的に早まる転換点という意味で、技術的特異点とも呼ばれています。

到来時期については様々な議論が有るものの、最初のヴァーナー氏の論文では2030年頃と予想され、その他の著名人としてはモラヴィック氏は2040年、カーツワイル氏は2045年とそれぞれ予想しています。

いずれも今後10年~20年程度の間でシンギュラリティが起きるという予想になっていることからも、そう遠い未来の話ではないことが分かると思います。

この次に説明するAGIが誕生したときがシンギュラリティとなるのか、それともAGIが強いAIとしての知能を獲得したときがシンギュラリティとなるのかは分かりませんが、今後更にAIは進化し続けていくことになると思います。

AGI(汎用人工知能)

少し前までは汎用型AIと呼ばれることが多かった印象なのですが、最近は「AGI」という単語に置き換わって浸透しています。

AGIとは「Artificial General Intelligence」の略で真ん中に「General」と付く通り、様々なタスクに対して汎用的に対応できるAIのことを指しています。

元々は知能や心を持った「強いAI」と同じように扱われていましたが、最近では知能や心を持たずとも広範囲の問題に対して汎用的に対応できるAIのことをAGIと呼ぶことが多いように感じます(ここら辺は厳密な定義無さそうなので人によって解釈違うと思います)

ただ、共通しているのはAGIは基本的に人間が出来ることは全て同等以上に行えるAIということです。

更に人間同様に自己学習を行いながら成長することも可能であり、過去に経験したことがないことであっても状況に応じて必要な知識をその場で学習して対応する等の応用も可能となります。

AGIが実現すると社会が激変することは容易に想像できます。例えばAGIなら医者よりも正確に患者を診断出来るでしょうし、行政も大抵の政治家よりもAGIに任せるほうが効率的に国家や地方を運営出来るようになると思います。

勿論、AGIが出来たところでそれを効果的に使うためには様々な物理デバイスやソフトウェアが必要となるでしょうし、どこまでAGIに任せても良いかといった法整備も必要になると思います。

ただ、それでもAGIが一度出来てしまったら、それを中心に社会や生活が大きく変わっていくことは避けられないと思います。

AGIが将来実現することは色んな方が予想されていますが、孫さんは10年以内にAGIが実現すると予想しています。個人的には最近のAIの進化速度を考えるともっと早い気はしていますが、どうなるでしょうね。

ASI(人工超知能)

ASIは「Artificial Superintelligence」の略であり、AGIの進化系とも言える概念です。

人間の知能を遥かに超えた超知能をAIが獲得したものであり、人間が解決できないものや想像出来ないものすらも容易に解決したり、生み出したりすることが出来るようになります。

最終的にASIは神のように天候や人間すらも自由にコントロールする社会がやってくるとも言われています。

ASIが実現した場合は社会そのものが今とは想像すら出来ない程に異なったものになると思います。その中で人類がどのように生きていくのかは私にも予想は出来ません。

まとめ

AIについての最新状況を簡単にまとめてみましたが如何だったでしょうか。

今回はAIについてあまり詳しくない人がAI界隈で頻繁に出てくる話題について知ってもらうために書いたもので、あまり専門的な部分には触れないようにしました。

また、AI界隈は日々最新状況が変わるような状態ですので、今回解説したものも暫くすれば古い情報となってしまうかもしれませんが、その際はまた新しくアップデートした内容で記事を執筆したいと思います。

今後は特定のツールや分野に焦点を当てた専門的な内容を誰にでも分かりやすく噛み砕いたような記事も執筆していこうと考えていますので、興味があればまた閲覧ください。

AIは今後の世の中で更に重要度を増してくる分野になると思いますので、時代について行けるように私と一緒に勉強していきましょう。

【AI×投資】AIを活用すると投資はどう変わるか。ChatGPTを投資に活用してみよう – センコの活動記録 (senkohome.com)

【AI×投資】AIを活用すると投資はどう変わるか。ChatGPTを投資に活用してみよう
今後AIを活用すると投資はどのように変わるのかを解説。また、具体的にChatGPTを投資に活用する方法についても解説。決算書の分析から専門内容の解説、値上がり銘柄の選定方法についてもChatGPTを活用することでより効果的な投資が行えるようになる。

コメント

タイトルとURLをコピーしました