画像生成ではMidjourneyやStable Diffusionがリアルな画像を作ってくれています。
OpenAIのDALL-E3(MS Copilot含む)はグラフィックスと言っていいでしょう。
さて、GoogleさんはAIにものすごく力を入れているのをご存知の方が多いかと。
そして日進月歩のように進化しています。
それどころか雨後の筍の如くAIを活用したアプリも現れてきています。
もちろんインチキなのも多いです。
Googleさんと言えば Google AI Studio があります。
これを活用すると無料でGemini 1.5 Pro 002というのがあります。
しかしながら、Googleは Deep Mindというところと、AI TEST KITCHENというところがあります。
AI TEST KITCHENのIMAGEFXという画像生成機能があり、恐ろしいくらい美しい画像を作ってきます。
プロンプト:
photorealistic Japanese girl wearing a T-shirt with a picture of a flower and a bikini bottom on a hot summer day at a beach with a background of Enoshima island in Fujisawa .

江の島ではないけど、とりあえずリアルでかわいいお嬢さんが生成されたわ!
同じプロンプトでこれがDALL-E3です・・・

しかし、「江ノ島】を背景にしてというのはこっちが正しいわ。
だかろと言って、Googleがすべて強いというのではありません。
今、Google Gemini 1.5 Proを活用して文字起こしを試しているのですが、データが消える。
Google AI Studioの中野Gemini 1.5 ProはURLからは引き出せませんので、自分が持っているMP3やMPEG4データをGoogle Driveからアップロードする必要があります。
何十回もやっていますが、消えてしまいます。
Gladiaにやらせたほうがいいかなって。