ナウル政府観光局X、「未開の部族」「蛮族」呼ばわりに「法的措置」検討 生成AIめぐり批判受けるという記事。Twitter に搭載された生成AIを用いてナウルを描いてもらったのをツイートに乗せたら、いわゆる反AIの人々から猛烈な攻撃にあったようだ。いくらなんでもかわいそうではないか。
とはいえ生成AIへの忌避感や嫌悪感についてまったく理解できないとまでは言わない。生成AIそのものが悪いわけではないのだが、無法者たちによる現役絵師の絵を用いたファインチューニングにより似せた絵を描くモデルが割とゴロゴロと転がってたりするからだ。
いま絵描きたちは Pixiv という発表の場を得るのみならず、Skeb のようなイラスト依頼サイトを通して、一定レベル以上の絵が描ける人ならそれなりにお金になる世界にいる。絵の需要は本当にたくさんあり、SNSのアイコンやら妄想したシチュエーションのイラスト化やら様々な依頼が飛び交い、それなりの売上が発生するに至っている。実際 Skeb は創業わずか3年で10億円のバイアウトを成功させている。
Skebは、国内外から日本のクリエイターに対してイラストや音声データを有償でリクエストできる“投げ銭付お題募集サイト”。2018年12月に開設され、21年2月時点で総登録者数100万人、クリエイター登録者数約5万人、月間取引高約2億円の規模に成長。クリエイターを優先した利用ルール、最大13.6%の手数料などが好評で、案件の約20%が海外からの利用だ。
こうした様々な需要を担っていた絵師たちが、生成AIに怯えるのは簡単に想像できる。一般人が見るイラストは商業レベルのものばかりで、こうしたあまり表に出てこない絵師たちの仕事は目に入らないだろう。だがそれで食べていたり生活の足しにしてる絵師たちは思うよりも多いのだ。Skeb の取引高や売却額からそれはうかがい知ることができる。
ひとつ勘違いして欲しくないのは、絵を無断で学習することは別にAIだけがやってるわけじゃなく、人間も勝手にやってるのである。どんな立派な絵師たちも最初は子供の頃にアニメのキャラクターを描こうとしたりしていただろう。人間がやってよくてAIがやってはダメなんてことはないのである。
また被害が生まれる絵柄模倣AIにしても、学習を禁止することが解決なわけではない。例えば田中圭一の絵を学習して手塚治虫の絵柄模倣AIを作ったら、被害者はいったい誰になるのか考えて欲しい。複数の絵柄を模倣してAIは学習したことのない誰かの絵柄を模倣させることだって可能だろう。つまり絵柄模倣AIはそれを作って発表した人間が罰せられるべきであって、学習そのものの禁止は意味がないというわけである。いまのところ取り締まれる法律はないが、これについては上記の用に Skeb などで得ていたはずの利益が絵柄模倣AIによって奪われ金銭的被害が想定できるので、対策の検討はされるべきであろう。
だが本当に怯えるほど生成AIは恐怖なのだろうか。
実際に生成AIを使ってみたらわかるが、そんな簡単に狙った通りのイラストは出てこない。ネットで見かける「すごいAI絵」なんてのは100枚も200枚も生成したうちの1枚だったりする。それも1分くらいかけて低解像度のものを1枚生成するので、気に入ったやつを拡大してもきれいに見えるように引き伸ばしなどしてたりする。しかも何十万円もするGPUを搭載したパソコンを買うなりクラウドで調達するなりしてけっこうお金もかかるのである。
そんなめんどくさいことをするくらいなら絵師に依頼したほうがだいぶマシではなかろうか。
「いまはそうかもしれないが」「未来ではどうなるか」
そんな声も聞こえるかもしれない。だが、生成AIの未来はそんなに明るいものではない。
ChatGPTやGPT-4等の本質は,巨大Transformerをスケーリング則(データ量,計算量,モデルサイズに従い性能上昇が続く)を背景に大規模学習することですが,計算量はほぼ限界ライン 実はデータ量も2026年にWebデータ枯渇の試算(https://arxiv.org/abs/2211.04325 )があり,AIの進化は落ち着く可能性が
もう再来年には学習するネタが尽きるのである。ネットに転がってるデータをかき集めて大規模な学習データを作る手法はもう限界が目に見えてるのだ。
またこうしたデータを処理するだけの半導体もすでに限界が見えている。Apple が昨年から Apple Silicon に使っている 2nm のプロセスルールはいわゆる FinFET と呼ばれる構造では完全に物理的な限界に達している。これ以上微細化を進めることはできないし、微細化ができないということは性能を向上させられないということなのである。
もちろん半導体業界も手をこまねいてみてるわけではない。FinFET に代わる GAA(Gate-All-Around) 構造の半導体にすでに着手している。
- 2021年、インテル独自の GAA 構造を採用した Intel 20A のロードマップを発表 → 2024年に出す予定でしたがキャンセルしました
- 2022年、サムスンはGAAへの切り替えを発表 → 2024年現在まだできてません
- 2022年、TSMCはGAA構造のN2を発表 → 2024年現在「順調」とはいいつつまだできてません
手をこまねいてみてるわけではない。手をこまねいてみてるわけではないが、まだぜんぜんできてないのである。
だいがい実現したにしても GAA 構造で微細化を進められるのは数年程度と見られている。それも nanosheet による GAA から forksheet による GAA という取り組みに成功したとしてだ。その先には CFET と呼ばれる構造への変革が必要になっていく。
そんな次から次へと現れるハードルを本当に突破できるのか? 突破できるにしても想定以上の時間がかかり、思ったより早くは実現しないのではないか?
イラスト生成AIだけの話ではない。いまの ChatGPT にしても1枚500万円くらいするGPUを何枚も乗せたPCを何千台と並列化してやっといまの ChatGPT が運営されてるのである。それだけのものを動かすだけの電力だってどこから持ってきたらいいのかわからない。データセンターといっしょに原発も作ろうとか言い出してる始末である。
以前にも書いたが、時代はローカルAIに移行しようとしてる。データセンターでなんでもやるよりは、比較的簡単な処理はローカルで動く小さくてあまり賢くないAIに任せる。難しいことはクラウドのAIに投げる。Apple Intelligence なんてまさにそういう構造だし、Microsfot が推進してる AI PC もそういう狙いがあるのであろう。だがどのみちこれも半導体の進歩に依存した話だ。
すでに現在の大規模言語モデルによる生成AIは様々な国家試験を優秀な成績で突破するくらいの能力はある。それだけでも人間の知力をすでに越えたと言ってもそう間違ってはいないだろう。だが所詮は学習内容に基づき経験則で答えてるだけで、現物と取っ組み合いをするようにして生み出す知の産物を勝手に生み出してくれるわけではない。そうした活動の大きな武器にはなるであろうが、所詮は道具でしかないのである。
だが便利な道具だ。出力されたものに対して自分が責任を負えるのであれば、だが。
つまり生成AIによって出力されたものは、けっきょく自分がレビューしたり修正したりしないといけないのである。いまも毎日のように仕事でも AI にコードを生成してもらってるが、そのまま使えることなんてほとんどない。書けるけどめんどくさいなあと思うようなものを任せたり、知らないライブラリや部品の使い方を知るために使っている。よく知らないプログラム言語なんかだと基本的な書き方もすぐわかるのでありがたい話である。雛形程度なら割と任せられるのでだいぶ楽になったなとは思うが、それでもまだハルシネーションに騙されて遠回りするハメになったりもする。便利だがまだまだ乗りこなすのは難しい道具だ。
まあでも気軽に誰にも迷惑をかけずに適当なものを生成してもらえるのは楽だ。こないだもあんまり凍結解除されないんで新しい Twitter アカウントを作ってみたのだが、アイコンが思いつかなかったので適当に ChatGPT に生成してもらった。またすぐ凍結されるかもしれないなあと思うので人にアイコンをお願いするのも気が引けたのである。
こんな感じで生成してもらった絵をアイコンにして作ったアカウントがこちらである。
このブログの更新のほか、ニュースのシェアなどもしてる。すぐ凍結されるかなと思ったが名前も変えてあるせいか今のところまだ生きてるようである。
ま、AIなんて道具ですよ道具。奈須きのこが予想する未来のように「人間のパートナー」になる日はまだまだ遠いのではないかなあ。