画像生成AI、その主なサービスの特徴と使い方を解説:実務にはどう活用できる?画像生成AI①

wakui toshio/Nature Production/amanaimages 

AIを利用して画像や文書などを生成するジェネレーティブAIサービスは、2022年の夏頃から、それまでの学術研究レベルでの技術開発の域を超えて、急速に一般レベルでの実用化が進んできました。今回の連載では、クリエイティブ制作の現場でも注目を集める画像生成AIサービスにフォーカスをあて、サービスの使い方から画像の権利の考え方まで、実務においてどのように活用できるのかを解説していきます。

第1回は、AI生成画像の活用シーンの広がりや主なサービスの種類・特徴、そしてその使い方について、ITジャーナリストの大谷和利さんに解説していただきます。

  1. 作品制作やマーケティングコンテンツでの利用が進む、AI生成画像
  2. 主な画像生成AIサービスの種類と特徴
  3. 画像生成AIサービスの基本的な利用方法

作品制作やマーケティングコンテンツでの利用が進む、AI生成画像

Netflixが2021年に日本に設立したアニメ・クリエイターズ・ベースでは、画像生成AIサービスが話題になる前から作画プロセスへのAI導入の可能性を探り、『犬と少年』という実験的なアニメ作品を制作していました。人手不足が深刻化するアニメ制作の現場において、少しでもクリエイターの負荷を減らし、その分のマンパワーを本来のクリエイティブ制作、たとえば登場人物の動きやカットごとの構図、全体的な演出に回したいという狙いです。

そのため、AIによる生成画像は、アニメの背景のベースとして用いることにして、かつラフなレイアウトは人がスケッチして決定。それを元にAIが生成したイメージの中から最も意図に沿うものを選び、さらにそこに手を加えるという手法が採られました。したがって、背景部分のクレジットは「human+AI」となっています。

アニメ・クリエイターズ・ベース アニメ『犬と少年』本編映像(Netflix Japan 公式YouTubeチャンネルより)

そう言われなければ(言われても)わからないほどの仕上がりになっているのは、AIに全てを依存することなく、AIが生成したイメージから人が選び、手を加える作り込みが行われたからでした。トータルでは4〜5割の省力化につながり、作品の質を上げるための作業に注力できたと言われています。

ちなみに、既存の画像生成AIでは学習に使われた画像の権利関係が曖昧なため、今回のNetflixの試みでは独自開発のものが使用されています(今回の連載後半では、AI生成画像の権利に関する話題も取り上げます)。

また、クリエイター御用達のAdobe Photoshopをはじめ、いくつかのグラフィックツールには、プラグインなどを介してサードパーティ製の画像生成AIを使うための仕組みが提供されつつあります。

insights_generative_ai_1_Photoshop+AI.jpg

プロのクリエイターが利用するPhotoshopのようなツールにも、画像生成AIサービスを利用するための有償/無償のプラグインが登場。

大量のコンテンツをタイムリーに配信していくことが求められるコンテンツマーケティングの世界においても、今後より一層、AIの活用が進んでいくことが予想されます。2022年9月に行われた、世界的なコンテンツマーケティングイベントであるContent Marketing Worldのセッションでも、コンテンツ制作における画像生成AIの活用に関して言及がありました。

insights_generative_ai_2_cmw.jpg

マーケティング活動におけるAIの活用について、専門家の視点からさまざまな業界のマーケターに語られた(詳細は「Contents Marketing World 2022 注目セッションサマリー」よりダウンロード)。

画像生成AIは、もはや使うか使わないかではなく、いつ、どのように利用するかを考える段階に入ったと言っていいでしょう。

主な画像生成AIサービスの種類と特徴

2023年3月現在、人気の画像生成AIとしては、Stable Diffusion、Midjourney AI、DALL•E2などがあります。また、これらのAIのコアの部分を利用して、さまざまなアプリが作られたり、既存のアプリの拡張機能として組み込まれているケースも増えてきました。

どれも、基本的には入力されたテキスト(「プロンプト」、あるいは「呪文」と呼ばれることもある)を元に、それが表現している情景を具体的なイメージに変換してくれるものですが、それぞれのAIの学習に使われた大量の写真、イラスト、絵画などの数や種類、そして、テキストからイメージを作り出すアルゴリズムの違いによって、生成結果も異なるものが得られます。

たとえば、Stable Diffusionは、プロンプトでスタイル(写真、イラスト、スケッチ、アニメなど)を指定しなければ標準で写真的なイメージが生成され、オープンソースであることから比較的制約のない表現(実在の人物や暴力シーンなど)が可能です。そして、iPhone用の「AIピカソ」のような無料(広告視聴あり)のモバイルアプリにも、その画像生成エンジンが使われるなど、幅広く応用されています。

また、イメージ生成のAIモデルの研究所であるMidjourneyが開発したMidjourney AIは、ドラマチックで見映えのするアーティスティックなイメージ表現が得意です。画像生成後、すぐに高解像度化やバリエーション作成のオプションを利用できるインターフェースも用意されています。

さらに、ChatGPTの開発元として知られるOpenAIという団体が開発したDALL•E2も、アート表現に適していますが、既存のイメージの描かれていない外側の部分を補う「Outpainting」など、独自の機能を備えたサービスです。

なお、原稿執筆の時点では一般公開されていませんが、新たにGoogleが発表したMuseという画像生成AIは、ゼロからの生成に加えて、既存のイメージの一部を改変するような使い方もできるようになっています。現状の画像生成AIでは、完全に意図通りの画像を生成することは難しいわけですが、Museのように、ある程度仕上げたイメージを意図に合わせて調整するようなことができれば、そうした利用法が一般化する可能性もあるでしょう。

画像生成AIサービスの基本的な利用方法

画像生成AIは、サービスによって利用法がまちまちです。

たとえば、Stable Diffusionは、DreamStudioという公式サービスを用意しているほか、使用するコンピュータの性能が一定の仕様を満たせば、その上で無料で機能させることもできます。また、登録不要、無料で使えるStable Diffusion OnlineというWebサービスも提供中です。DreamStudioの場合は会員制で、登録後に無料のクレジット(画質や画像サイズで消費される量が異なる)が付与され、利用料が多ければクレジットを約1000枚あたり100ポンドで買い足す仕組みになっています。

insights_generative_ai_3_Stable_Diffusion.jpg

知名度が高くユーザーも多い画像生成AIサービスのStable Diffusionには、完全無料で手軽に試せるオンラインバージョン(Stable Diffusion Online)が用意されている。

Midjourney AIは、ちょっと変わっていて、まずオンラインコミュニティサービスのDiscordに登録し、その中の指定チャンネルを使ってチャットボットとやり取りをするようにして利用するため、やや慣れが必要です。

insights_generative_ai_4_Midjourney_AI.jpg

Midjourney AIは、Discord経由での使用となる。

利用開始時に無料で25回分の画像生成クレジットが付きますが、それを使いきると、月額10ドルで月200枚まで生成できる「ベーシック」、月額30ドルで枚数無制限の「スタンダード」、月額60ドルで枚数無制限に加えて優先度の高い生成(※)が可能な「プロ」、いずれかの有料プランに移行することになります。 

※CPUタイムを優先的に割り当てることで、プロンプト入力後の画像生成開始が早く、また画像生成自体の時間も短くなる。つまり、画像生成の効率アップが図れるようになっている。

有料プランで生成されたイメージは、商業利用が可能。また、生成された画像や元となったプロンプトは基本的にDiscord上で公開され、他のユーザーによるアレンジも許されていますが、プロプランでは、画像やプロンプトを非公開にできるステルスモードも利用可能です。

DALL•E2も会員登録が必要で、アカウントを作った初月に50クレジットが無料で与えられ、1クレジットで3、4枚の画像を生成できます。その後も毎月15クレジットが同じく無料で付与されますが、それを超えての利用には、115クレジットあたり15ドルでの購入が必要です。生成したイメージは、商業利用も許可されています。

なお、画像生成AIはイメージの解像度が高いほど処理の負荷も増大するため、どのサービスも512×512ピクセルでの生成が基本となっています。Midjourney AIのように、より高い解像度(1024×1024ピクセル)でのイメージ生成オプションが提供されているものもありますが、大きなサイズのイメージが必要な場合には、超解像のリサイズ機能(Photoshopの「スーパー解像度」やPixelmator Proの「超解像技術」など)のあるグラフィックツールで拡大するのも1つの方法です。


今回の記事では、主な画像生成AIサービスの種類と特徴、基本的な使い方を見てきました。次回は、応用編として、希望のイメージに近づけていくための使い方のコツや、使用するうえで留意すべきポイントを解説します。

文:大谷和利
AD [top]:中村圭佑
編集:高橋沙織(amana) 

【関連記事】
画像生成AI、その主なサービスの特徴と使い方を解説:実際にはどう活用できる? 画像生成AI①
AIで作る画像をイメージに近付けるためのコツ:実務にはどう活用できる?画像生成AI②
知っておきたい法的知識と、想定すべきトラブルリスク:実務にはどう活用できる?画像生成AI③
安心・安全に、AIをクリエイティブプロセスに組み込むには:実務にはどう活用できる?画像生成AI④

SOLUTION

amana cgx

amana cgx

amana cgxサイトでは、amanaのCG制作チームが手がけたTV-CMやグラフィック、リアルタイムCGを使ったWEBコンテンツなど、CGを活用する事で、クライアント課題を解決に導いた様々な事例を掲載。
CGクリエイターの細部にまでこだわる表現力と、幅広い手法によるソリューションサービスを紹介しています。

サービス資料ダウンロードはこちら

KEYWORDキーワード

本サイトではユーザーの利便性向上のためCookieを使用してサービスを提供しています。詳しくはCookieポリシーをご覧ください。

閉じる