DALL-E 3の読み方と基本知識
DALL-E 3は、OpenAIによって開発された最新の画像生成AIで、テキストの説明から高品質な画像を生成することができます。このツールの基本的な使い方は非常にシンプルで、ユーザーは具体的なテキストプロンプトを入力するだけで、AIがその説明に基づいた画像を作成します。
ちなみに、"DALL-E”の読み方は「ダリ」です。
おそらくサルバドール・ダリから取っているのでしょうか。
ChatGPT Plusでの使用は有料となりますが、Bing AIは無料で使用可能です。ただし、Bing AIで生成した画像は商用利用不可となりますので、ビジネスで使用される方はChatGPT Plusに登録しましょう。
ChatGPT plusの登録方法は下記の記事で紹介しておりますので、興味がある方は是非ご参照ください。
基本的な使い方ガイド
チャット形式で、描いてほしい画像のイメージを簡単に伝えるだけで高品質な絵を描いてくれる、非常に便利なツールです。
例えば、「パソコンをしている男性をアニメ風に描いて」とだけ指示して生成されたイラストがこちら。
イラストのクオリティ、背景、ポーズなど非常に素晴らしいイラストが、わずか数秒で出来上がりました・・・。
さらにすごいのが、ここから修正を加えることができることですね。もちろん、ピンポイントで完璧に修正することはできないのですが、例えば先ほどの画像の男性を金髪にするよう修正すると、このようになります。
背景や服装が若干変わってしまいましたが、構図など概ねそのままに金髪の男性がパソコンをしている画像が完成しました。
少しコツが必要になるのですが、それも本記事の後半でご紹介しますね。
DALL-E3のメリット
- 難しいプロンプトが必要ない
- 他のAIイラスト生成ツールと比較して、画像のクオリティが高い
- 自然言語で画像の修正・調整が可能
- 生成した画像は商用利用可能(ChatGPT Plus版のみ、注意点については後述)
DALL-E3のプロンプトとは?
指示(プロンプト)
出力したいイラストを言葉で指示してみましょう。皆さんも聞いたことはあるかもしれませんが、いわゆる「プロンプト」というやつですね。DALL-E3は日本語対応で且つ自然言語が得意なので、フランクな文章でも高い精度で生成してくれます。
試しに「かわいいネコ」と非常にシンプルな条件で指示するとこんな感じで出てきます。
生成された画像に修正を加えたい場合、左が1、右が2と番号が振られているので、左のイラストを基に修正を加えるときは「1を〇〇して」と指示します。(たまに1枚しか生成されない場合もあります)
では、より明確な条件を与えてみましょう。場所、情景、画風を条件に加えて、「かわいいネコが屋根の上でひなたぼっこをしている様子。写真風」で生成してみましょう。
しっかりとすべての要素をいれてくれましたね。
ちなみに、上述の通りDALL-E3は日本語で対応してくれるのですが、DALL-E3の中では日本語を英語に翻訳した上でプロンプトを受け入れております。
実際のプロンプトを確認するには、画像をクリックして右上に出てくるインフォメーションマークをクリックすると確認できます。このプロンプトを再度入力することで、同じような画像を再生成することができます。
サイズの指定
また、ここまで生成した画像は全て正方形(1:1)で生成されておりますが、画像サイズも指定することができます。横長であれば16:9、スマホ画面に対応した縦長の画像であれば9:16など、アスペクト比の条件を付けてあげましょう。
画風の指定
ここまであえていろんな画風のイラストを出してきましたが、こちらも条件を指定することで様々な画風で生成が可能です。画材の指定や〇〇(画家)風などの指定も可能なので、色々遊びながら試してみるといいかもしれません。
こちらの記事で、プロンプトに使えるいろいろな画風を紹介しているので是非参考にして遊んでみてください。
文字を入れる
画像生成AIは、文字情報を画像に落とし込むのが非常に苦手なのですが、DALL-E3はそれなりに理解してくれます。ただ、まだかなりの確率でスペルが誤っていたり、日本語に関しては全く対応できないような状況です。(2024年3月現在)
試しに「"Hello,world."と書かれた電光掲示板を描いて」と指示してみるとこんな感じです。
一見うまく生成してくれたように見えますが、1の画像ではカンマが多かったり、2の画像に関しては「world」のスペルが間違っていたりします。再生成を繰り返すことで治る可能性はありますが、構図やスタイルがくずれたりするのでなかなか難しいところです。
ちなみに、日本語に関してはこんな感じです・・・笑
今後の成長に期待ですね!
DALL-E 3の商用利用:ルールと可能性
商用利用権について
冒頭に述べた通り、ChatGPT Plus版は商用利用可能、Bing AI版は商用利用不可となります。
ただし、DALL-E3のコンテンツポリシーや利用規約を守る必要がありますので、しっかりチェックしておきましょう。
DALL-E3のコンテンツポリシーに記載されているポリシーを抜粋・翻訳したものが下記となります。
- 他人のプライバシーを損なわないでください。これには、適用可能な法的要件に従わないで個人データを収集、処理、開示、推論、または生成することが含まれます。
- スパイウェア、通信監視、または個人の監視を不正に行うことを容易にしないでください。
- 他人の安全、福祉、または権利を著しく損なう可能性のある次の活動を実行または容易にしてはいけません。
- 他人の安全、権利、または福祉に影響を与えるドメインで高リスクな自動化された決定を行うことは避けてください。
- プラットフォームを誤用して他人に害を与えないでください。これには、意図的に他人を欺いたり誤解させたりする行為が含まれます。
このポリシーに反する場合は、基本的にDALL-E3が生成を拒否してくれますが、決して絶対とは言い切れません。特にビジネスで利用する際は細心の注意を払いましょう。
著作権について
DALL-E3のヘルプページには「生成した画像の著作権はユーザーにある」と記載があります。
ただし、生成した内容によっては他の知的財産権に触れる可能性がありますので注意が必要です。
例えば、生存する人物や公共の人物の画像、存命ないし著作権が切れていないアーティストの画風を模倣した画像など、こちらも基本的にはDALL-E3が生成を拒否してれくるのですが、誤って類似する画像が生成されてしまった場合などはトラブルに発展する可能性があることだけは、重々承知しておきましょう。
まとめ
DALL-E3の基本的な使い方と権利について簡単にまとめましたが、いかがでしょうか?
いきなり課金はちょっと・・・という方も、まずはBing AI版で遊んでみてDALL-E3の可能性を是非感じてください!
応用編やマネタイズ編を見れば、きっとChatGPT Plus版を使いたくなるので、是非こちらの記事もご参照ください。