KLING AIの画像生成機能ガイド:効果的なプロンプトの書き方と活用法

KLING AIの画像生成機能は、テキストを入力するだけで高品質な画像を生成できる強力なツールです。この記事では、KLING AIの基本機能から効果的なプロンプトの書き方まで、画像生成を最大限に活用するためのノウハウを解説します。

目次

1. KLING AIの画像生成機能の基本

KLING AIには主に「Text-to-Image(テキストから画像)」と「Reference/Base Image(参照/ベース画像)」の2つの機能があります。

画像生成の基本ステップ

  1. プロンプト入力:生成したい画像の詳細な説明を入力
  2. 参照/ベース画像のアップロード(任意):スタイルや構図の参考となる画像を追加
  3. パラメータ設定:画像サイズや生成枚数を選択
  4. ワンクリック生成:「Generate」ボタンを押して画像を生成

生成した画像の操作

生成後は以下のアクションが可能です:

  • Like/Dislike:フィードバックの提供
  • Favorite:お気に入りに追加
  • Download:画像のダウンロード
  • Reference/Base Image:生成した画像を新たな参照画像として使用
  • Generate Video:画像をビデオに変換
  • Delete:画像の削除
  • Report:不適切なコンテンツの報告

2. 「5W1H」で考える効果的なプロンプト作成法

単純な「犬」や「女の子」といった短いプロンプトでは、AIの解釈に任せた結果となります。詳細で具体的なプロンプトを書くことで、イメージにより近い画像が生成できます。KLING AIでは「5W1H」の法則に従ってプロンプトを構成することが推奨されています。

Who(誰が・何が)

メイン被写体を具体的に記述します。

カテゴリー
キャラクター医師、ダンサー、魔法使い、ピエロ…
動物キリン、オウム、ホッキョクグマ、イルカ、カタツムリ…
植物桜の木、ひまわり、サボテン、ユーカリの木、バラ…
食べ物スパゲッティ、寿司、イチゴケーキ、ローストチキン、アイスクリーム…
建物城、超高層ビル、木造住宅、寺院、図書館…
その他の物体電気ギター、望遠鏡、熱気球、砂時計、アンティーク…

What(何をしている)

被写体の状態や行動を詳細に記述します。

項目説明
明確な定義メイン対象を明確に定義「博士帽をかぶった教授」
特徴の提供外見や姿勢、服装などの特徴「白衣を着た若い女性科学者」
具体的な状況対象が置かれている場面や文脈「宇宙船のハッチに立つ宇宙飛行士」
感情と行動感情状態と行動の組み合わせ「本を読みながら微笑む高齢者」

When(いつ)

時間の要素を加えることで、より具体的な画像になります。

カテゴリー
特定の時間夜明け、正午、午後6時、真夜中、午前3時…
時間帯朝、午後、夕方、夜、深夜…
歴史的時代ルネサンス、産業革命、中世、第二次世界大戦中、唐王朝…
季節早春、真夏、秋分、初冬、厳冬…

Where(どこで)

環境や背景を指定します。

カテゴリー
自然環境山の小川、熱帯雨林、砂漠、海岸、高山の雪原…
都市環境ビジネス街、静かな郊外、古い地区、ハイテクパーク、大型ショッピングセンター…
室内環境居心地の良いリビング、モダンなオフィス、高級レストラン、小さな寝室、クラシックな図書館…
特殊環境戦場、古代宮殿、未来都市、魔法の森、西部開拓時代の町…

Why(なぜ・何をしている)

被写体の行動や状態の理由を提供します。

カテゴリー
特定の行動本を読む、ピアノを演奏、コーヒーを飲む、自転車を修理…
相互作用友人との会話、ペットの世話、一緒に音楽演奏、電話をかける…
感情表現微笑む、遠くを見つめる、考え事で眉をひそめる、驚く、泣く…
継続的活動公園でのランニング、キャンプ、釣り、自転車に乗る…

How(どのように)

画像の視覚的な要素やスタイルを指定します。

カテゴリー
構図黄金比構図、対角線構図、三角構図…
視点鳥瞰図、見上げる視点、アイレベル…
芸術スタイル印象派、リアリズム、サイバーパンク…
色調クールトーン、暖色系、モノクロ、高彩度…
照明と影柔らかい光、強い影、優しい朝の光…
テクスチャ滑らか、粗い、ふわふわ、絹のような…
細部装飾、背景要素、繊細なパターン…

プロンプト例

上記、5W1Hを含めて書かれたプロンプトの例は以下となります。

prompt: A Chinese girl with brown hair wearing a dress eating an apple in a coffee shop on a summer afternoon, oil painting style, with extreme detail, medium shot.

(日本語訳)
夏の午後、コーヒーショップでドレスを着た茶髪の中国人少女がリンゴを食べている。油絵スタイル、極めて詳細、ミディアムショット。

是非、皆さんもこの5W1Hを意識したプロンプトを書いて、思い通りの結果が得られるか試してみてください。

3. 参照/ベース画像機能の使い方

時に言葉だけでは意図を正確に伝えるのが難しい場合があります。そんな時は「Reference/Base Image」機能を使用しましょう。参照画像をアップロードすることで、AIはそのスタイル、構図、色調などを参考に新しい画像を生成します。

参照画像のアップロード方法

  1. 「Text-to-Image」機能使用中に「Reference/Base Image」ボタンをクリック
  2. JPGまたはPNG形式の画像(10MB以下、300px以上)をアップロード

参照強度の調整

参照画像をアップロードした後、「Reference Strength(参照強度)」オプションが表示されます。

  • 強い参照強度: 生成結果が参照画像により近くなる
  • 弱い参照強度: 生成結果がプロンプトの内容により近くなる

参照強度を調整することで、プロンプトと参照画像のバランスを取ることができます。

4. 画像生成のパラメータ設定

KLING AIでは、画像サイズと生成枚数を調整できます。現在、以下の7種類の画像サイズが提供されています:

  • 1:1 (1024×1024)
  • 2:3 (832×1216)
  • 3:2 (1216×832)
  • 3:4 (832×1152)
  • 4:3 (1152×896)
  • 9:16 (768×1344)
  • 16:9 (1344×768)

一度に最大9枚の画像を生成可能です。用途に合わせて適切なサイズを選択しましょう。

5. テキスト生成機能の活用方法

KLING AIには「Text Generation(テキスト生成)」機能も搭載されています。プロンプトにテキストを含めることで、画像内にテキストを表示することが可能です。

A little white cat is holding up a sign that says “I want to eat fish”

    (日本語訳) 「I want to eat fish(魚が食べたい)」と書かれた看板を持ち上げている小さな白猫

このテキスト生成機能は中国語と英語のテキストに対応しており、両言語を同時に表示することも可能です。誕生日ケーキのメッセージ、犬の名札、バレンタインカードなど、様々な用途に活用できます。

6. よくある質問と回答

プロンプトの最大文字数は?

プロンプトの最大文字数は?

アップロードできる参照画像のファイル形式は?

JPGとPNG形式の画像のみサポートされています。サイズは10MB以下、300px以上である必要があります。

一度に生成できる画像の最大枚数は?

一度のリクエストで最大9枚の画像を生成できます。

すべてのプロンプト要素を含める必要がありますか?

必ずしもすべての要素(5W1H)を含める必要はありません。生成したい画像の内容に応じて、1〜2の要素に重点を置くことも効果的です。

テキスト生成はどの言語に対応していますか?

現在、中国語と英語のテキスト生成に対応しています。


KLING AIの画像生成機能は、詳細なプロンプトと適切なパラメータ設定により、驚くほど高品質な画像を生成できます。「5W1H」の法則に基づいたプロンプト作成を心がけ、必要に応じて参照画像も活用することで、より想像に近い画像を生成することが可能です。ぜひ様々なプロンプトを試して、KLING AIの可能性を探ってみてください。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

株式会社PROMPTは生成AIに関する様々な情報を発信しています。
記事にしてほしいテーマや調べてほしいテーマがあればお問合せフォームからご連絡ください。
---
PROMPT Inc. provides a variety of information related to generative AI.
If there is a topic you would like us to write an article about or research, please contact us using the inquiry form.

コメント

コメントする

目次