DALL·Eの画像編集機能

by Shogo

AIの進化が、創造や表現を変えつつある。文章を書いたり、ストーリーを考えたりに、AIを使っている人が増えたようだ。そして、画像や映像もテキストプロンプトだけで驚くほどのクオリティで画像や映像が生成される。

画像生成の分野でOpenAIは、DALL·Eのアップデートを発表した。OpenAIのDALL·Eは、テキストプロンプトから画像を生成する画像生成AIの一つだが、今回のアップデートで、DALL·Eが生成した画像の編集が可能になった。今までであれば、ガチャのように生成された画像が気に入らなければ、また新しい画像を生成しなければいけなかったが、今回のアップデートで、一部を編集して自分のイメージに合った画像につくりかえることができるようになる。

この新機能は、Web、iOS、Androidデバイスに対応し、ユーザーがChatGPTのインターフェース内で直接、AIによって生成された画像を簡単に修正・加工できるようになる。方法は簡単で、画像が生成された後、ユーザーはペイントブラシのアイコンをクリックするだけで、画像の特定の部分を選択し、変更を加えることが可能になるようだ。このツールには、ブラシのサイズを調整するトグルも備わっており、編集に対するより細かな調整を可能にするようだ。「ようだ」というのは、まだ使っていないからで、この機能は、私のインターフェイスには現れていない。これからなのだろう。

この進歩により、ChatGPTは機能的にAdobe Firefly、Midjourney、Stable Diffusionなどの人気AI画像生成ツールに肩を並べる画像生成AIとなる。これらの競合のツールはすでに類似の編集機能を持つ。

さらに、編集ツールに加え、OpenAIはDALL·E にプレビュー機能も導入するようだ。プロンプトの例が、チャットバーの上に表示され、ユーザーに潜在的な画像アイデアを提案することもできるという。これも、多分便利な機能だろう。

DALL·Eの編集ツールは、ユーザーに画像の特定部分を直接選択し、その部分に変更を加える能力を与えまる。たとえば、生成された風景画に空をもっと青くしたい、または特定の建物を追加または削除したい場合、ユーザーは画像上の該当部分をクリックして選択し、テキストボックスに「空を青くする」や「建物を追加する」といった指示を入力するだけだ。

ペイントブラシの選択ツールを使って、画像上のどの部分を変更したいかを指定する。その後、編集したい内容に関するテキストプロンプトを入力するだけだ。このインターフェイスは、AdobeFireflyとまったく同じだ。

さらに、DALL·Eのアップデートにはスタイルオプションの追加も含まれているようだ。これにより、ユーザーは画像生成時に特定のスタイルを適用することが可能になる。例えば「モーションブラー」を選ぶと、画像に動きのある効果が加わり、動的な印象を与える。一方、「ソーラーパンク」というスタイルを選択すると、未来的で環境問題を意識したテーマの画像が生成されるという。

DALL·EをAdobe Firefly、Midjourney、Stable Diffusionと比較してみる。

Adobe Firefly

Adobe Fireflyは、Adobeの画像処理技術にAIの能力を組み合わせたものだ。ユーザーは、Fireflyを使用して独自の視覚的要素を作成でき、Adobe Creative Cloudとの統合により、デザインワークフローがスムーズになっている。しかし、DALL·Eの最新の画像編集機能と比較すると、Fireflyはより伝統的な画像編集ツールに近いため、AIによる自動生成と編集にはある程度の限界があると評価されている。それでも、Photoshopで、写真をAI機能を使って多少いじっているが、個人的には十分の印象がある。DALL·Eは、もっと自由に画像を編集できるということのようだ。

Midjourney

Midjourneyは、やはりテキストプロンプトを使用して独自の画像を生成できるツールだ。高度なアルゴリズムを利用して幅広いスタイルとテーマの画像を生成する。しかし、今回のDALL·Eのような直接的な画像編集機能は提供していない。

Stable Diffusion

Stable Diffusionは、高品質な画像生成に特化したAIツールだ。しかし、DALL·Eの最新アップデートにあるような画像編集機能は提供しておらず、生成された画像の微調整には別のツールを使用する必要がある。

DALL·Eは、これらのツールと比較して、直接的な画像編集機能を提供する点で際立っている。テキストプロンプトを用いた編集とスタイル選択機能により、より具体的で個性的な画像を簡単に作成できる。一方で、他のツールは特定のアートスタイル生成や統合されたデザインワークフローなど、異なる強みを持っている。

OpenAIは、デモを公開している。DALL·Eが生成したプードルの画像が示され、その画像はリボンのない、普通のプードルだ。ここで、DALL·Eの新しい編集機能を使用し、プードルの耳にリボンを追加する操作をする。まず、ペイントブラシのアイコンをクリックして編集モードに入る。次に、画像の中でリボンを追加したい耳の部分を選択する。そして、「耳にピンクのリボンを追加」というテキストプロンプトを入力する。このプロンプトを基に、DALL·Eはリアルタイムで画像を修正し、プードルの耳にピンクのリボンが追加された新しい画像を生成する。

OpenAIのDALL·Eの新機能は、ChatGPT Plusのサブスクリプションに含まれている。料金は月額20ドル。

このように、画像生成AIが進化すると、悪用や倫理的な側面もある。透かしやメタデータを用いることで、透明性と信頼性を確保することが重要だ。フェイクやや誤情報のリスクを避けるためには、AI技術の使用における制限も必要だろう。だが、今のところ、そのような話はない。

You may also like

Leave a Comment

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください