×

Midjourney v7で試した実験のまとめ

Midjourney v7で試した実験のまとめ

Midjourney v7で試した実験のまとめ

はじめに

今回、Midjourney最新バージョンv7を使って、いくつかの画像生成実験を行いました。v7は先行するバージョンと比較して様々な改良が加えられており、特にテキスト理解力の向上、画像生成の品質アップ、そしてユーザー体験を向上させる新機能が注目されています。この記事では、実際に行った実験とその結果を共有します。

Midjourney v7の主な特徴

  • テキストプロンプトの理解力が大幅に向上
  • 画像の質感や細部の表現力が強化
  • 人体(特に手や顔)の描写の自然さが改善
  • ドラフトモードの追加(通常の10倍の速度で生成、コストは半分)
  • パーソナライゼーション機能がデフォルトで有効に

実験1:人物の個別性の表現テスト

目的

複数の人物を含む画像において、それぞれの個性を明確に区別できるかテスト

使用したプロンプト

photorealistic monochrome portrait of two distinct Japanese musicians in studio, high contrast black and white professional photography, neutral gray background, dramatic studio lighting, fashion editorial style, highly detailed skin textures, both wearing black tops, clear focus on their different facial features --v 7

発見

  • v7でもキャラクターの個別性の維持は依然として課題
  • --crefパラメータがv7では使用できないという重要な発見(エラーメッセージ: “Invalid parameter: –cref is not compatible with –version 7″)
  • 髪型や基本的な特徴の区別はできるものの、個人の同一性を完全に保持するには至らず

代替アプローチ

  • 画像URLを直接プロンプトの前に配置する方法
  • より詳細な文章描写による個人の特徴の説明
  • --iw(画像の重み)パラメータでの調整

実験2:アニメ風キャラクターの生成テスト

目的

青い髪のDJキャラクターを使ってv5.2、v6、v7の表現力の違いを比較
(1枚目v6、2枚目がv5、3枚目と4枚目がv7)

元のプロンプト

hyper realistic androgynous DJ, sleek character design, short electric blue hair, black tech wear with luminous circle emblem, standing at futuristic DJ equipment, night cityscape, dramatic lighting, cinematic atmosphere, semi-realistic anime art style, octane render, volumetric lighting, ray tracing, detailed skin texture, subtle facial features

v7向け最適化プロンプト

fantasy cyberpunk DJ with ethereal glowing blue hair, intricate futuristic tech wear with holographic circle emblems, floating music interface, magical energy particles surrounding DJ equipment, otherworldly cityscape background with floating structures, bioluminescent lighting, neon aura effects, dreamlike atmosphere, hyper-detailed fantasy environment, magical realism art style --v 7 --ar 16:9
ファンタジーな表現の幅も広がった。

観察結果

  • v7はテクスチャや照明効果の表現に特に優れている
  • 色彩の微妙な表現やグラデーションが向上
  • 髪の毛や衣服のディテールが大幅に向上
  • ファンタジー要素と現実的要素の融合がより自然に

ドラフトモードの効果

上記のファンタジー最適化コードをドラフトモードで試すと以下のような画像が出力された。体感2秒で生成完了。確かに早い。

  • 高速に結果が生成され、コンセプト確認が容易
  • 品質は低いが、アイデアの検証には十分
  • 気に入った結果があれば高品質版に変換可能

v7で新たに発見された点

  1. パラメータの互換性変更--crefパラメータが使用不可。キャラクターリファレンス機能は別の形で実装されている可能性
  2. プロンプト理解力の向上:より複雑で詳細なプロンプトを理解し、意図した要素を適切に反映
  3. 空間認識の改善:物体や人物間の関係性をより正確に表現
  4. テクスチャと照明の品質向上:特にファンタジー要素や光の表現において顕著

おわりに

Midjourney v7は多くの点で前進がみられますが、特定の機能(キャラクターリファレンスなど)はまだ発展途上であることも明らかになりました。ドラフトモードとフル品質モードを使い分けることで、創作プロセスの効率が大幅に向上します。今後の週次アップデートでさらなる改善が期待されます。

特に、プロンプトを作成する際は以下の点を意識すると良い結果が得られそうです:

  • 空間関係を明確に指定する
  • 詳細な描写を惜しまない
  • テクスチャや照明の特性を具体的に指定する
  • ドラフトモードで素早く実験し、良い結果をフル品質で再生成する

Midjourney v7は確かに大きな進化を遂げており、これからの創作活動がより豊かになることを期待させてくれます。

コメントを送信

CAPTCHA