AI絵師とプロンプトエンジニアという造語に思うこと

数日間、Stable Diffusionで遊んだ。指示した画像が数秒で出力されるのは非常に面白い。ところで最近、プロンプトエンジニアやAI絵師なる単語が生まれている。ちまたでは呪文とも言われているが、画像を出力するためプロンプトに命令を出す。狙った画像を生み出すための呪文をすぐに作り出す人をプロンプトエンジニアと呼ぶらしい。また、AIによって画像を生成する人をAI絵師と呼ぶらしい。

そして最終的に思ったことは、AI絵師として食っていくは不可能と言うことだ。だけど、自作ゲーム開発をはじめホームページ作成の補助、その他プレゼンテーション資料の作成としては可能であると結論づけた。このサイトで画像生成AIを書いている理由も主にゲーム開発にバリバリ利用できるからだ。

要は画像生成ツールが誰でも簡単に利用できることにあるのだ。誰でも参入できることは仕事にならない。誰でも参入できなければ仕事になる。ただ単にそれだけの話だ。

現在、プロンプトエンジニア的なことをしただけでAI絵師と名乗る人が増えているが、それは違うと思う。AI画像にはよく見ると必ず奇妙な部分があり人間には違和感として残る。AI画像を大量出力してその中から最も綺麗に見える1枚を選び出す。さらに、その中から違和感を感じる部分を見つけ出して修正した後にイラストを世に出す人をAI絵師と呼ぶのだと思う。つまり、かなり手間なのだ。また、画像の違和感を感じる能力もいる。

一つ断っておくと、修正部分はイラストレーターだと容易だが、別にイラストレーターで無くとも不可能ではない。修正箇所をインペイント機能でさらに大量に画像生成して最適な1枚を選ぶ。画像編集ソフトを用いて、AI生成画像から人物や物体など必要な物を切り抜きして合成する。ここまで行えば時間はかかるけどイラストレーターの知識が無くとも画像の精度を上げることができる。何より本人の思想が入り込む余地があることがでかい。オリジナリティが出てくる。

これがおそらくAI絵師の作業だと思う。

プロンプトエンジニアとAI絵師は似ているようで異なる。前者は呪文を生み出す人で後者は最終的に世にイラストを出す人だ。AI絵師はプロンプトエンジニア+世にイラストを出すまでの諸所を作業を加えており、プロンプトエンジニアの上位互換に近い。

現在、作業としては似た職業がある。「Webライター」だ。Webライターは主にGoogle検索で情報を集める。集めた情報を元に自分なりの記事を書く。画像生成で言えば前者がプロンプトエンジニアにあたり、後者がAI絵師になる。Webライターは英語圏のサイトを検索できたり、独自の専門分野の記事が書ければ待遇はもの凄くよくなる。AI絵師で言えば出力された画像をブラッシュアップできる人だ。

現在のGoogle画像検索は誰でも必要な画像を探すことができる。現在の画像生成AIはGoogle画像検索ほどの精度は全くない。だが、近い将来には改善するはずだ。呪文ではなくGoogle画像検索レベルまで簡単に好きな画像を生成できるようになるはずだ。その意味で、プロンプトエンジニアは将来的には、それも短期間に必要なくなる仕事だと思っている。

ただ、AI絵師となると話は異なる。上記で語ったと思うが、AI画像生成の違和感が無くなるのは、少なくともStable Diffusionでは仕組み上不可能だと思う。手足を綺麗にしたり、思うような画像が出てこないのは、おそらく学習モデルをチューニングすることによって可能だ。人によってはキメラとも呼ぶが、顔と手足の違和感や全体の姿勢の不自然さがどうしても出てしまう。これを解決する方法が必要だ。

今後、AI画像生成を利用したマッシュアップや、AI画像を利用した独自の改良を施すAI絵師は絶対に出てくると思うが、このようなAI絵師は応援していきたい。

ただ、DLSITEでは適当にAIに画像出力させてCG集として販売する輩が存在する。PIXIVでもAI絵が乱造されはじめている。各サイト、これらとイラストレーターを区別する方向でいくようだが、同じAI絵でもただ出力しただけの画像と手間がかかった画像を区別する方法も編み出してほしいと思う。

コメントを残す

メールアドレスが公開されることはありません。

CAPTCHA