KLING AIの画像生成機能は、テキストを入力するだけで高品質な画像を生成できる強力なツールです。この記事では、KLING AIの基本機能から効果的なプロンプトの書き方まで、画像生成を最大限に活用するためのノウハウを解説します。
1. KLING AIの画像生成機能の基本
KLING AIには主に「Text-to-Image(テキストから画像)」と「Reference/Base Image(参照/ベース画像)」の2つの機能があります。
画像生成の基本ステップ
- プロンプト入力:生成したい画像の詳細な説明を入力
- 参照/ベース画像のアップロード(任意):スタイルや構図の参考となる画像を追加
- パラメータ設定:画像サイズや生成枚数を選択
- ワンクリック生成:「Generate」ボタンを押して画像を生成
生成した画像の操作
生成後は以下のアクションが可能です:
- Like/Dislike:フィードバックの提供
- Favorite:お気に入りに追加
- Download:画像のダウンロード
- Reference/Base Image:生成した画像を新たな参照画像として使用
- Generate Video:画像をビデオに変換
- Delete:画像の削除
- Report:不適切なコンテンツの報告
2. 「5W1H」で考える効果的なプロンプト作成法
単純な「犬」や「女の子」といった短いプロンプトでは、AIの解釈に任せた結果となります。詳細で具体的なプロンプトを書くことで、イメージにより近い画像が生成できます。KLING AIでは「5W1H」の法則に従ってプロンプトを構成することが推奨されています。
Who(誰が・何が)
メイン被写体を具体的に記述します。
カテゴリー | 例 |
---|---|
キャラクター | 医師、ダンサー、魔法使い、ピエロ… |
動物 | キリン、オウム、ホッキョクグマ、イルカ、カタツムリ… |
植物 | 桜の木、ひまわり、サボテン、ユーカリの木、バラ… |
食べ物 | スパゲッティ、寿司、イチゴケーキ、ローストチキン、アイスクリーム… |
建物 | 城、超高層ビル、木造住宅、寺院、図書館… |
その他の物体 | 電気ギター、望遠鏡、熱気球、砂時計、アンティーク… |
What(何をしている)
被写体の状態や行動を詳細に記述します。
項目 | 説明 | 例 |
---|---|---|
明確な定義 | メイン対象を明確に定義 | 「博士帽をかぶった教授」 |
特徴の提供 | 外見や姿勢、服装などの特徴 | 「白衣を着た若い女性科学者」 |
具体的な状況 | 対象が置かれている場面や文脈 | 「宇宙船のハッチに立つ宇宙飛行士」 |
感情と行動 | 感情状態と行動の組み合わせ | 「本を読みながら微笑む高齢者」 |
When(いつ)
時間の要素を加えることで、より具体的な画像になります。
カテゴリー | 例 |
---|---|
特定の時間 | 夜明け、正午、午後6時、真夜中、午前3時… |
時間帯 | 朝、午後、夕方、夜、深夜… |
歴史的時代 | ルネサンス、産業革命、中世、第二次世界大戦中、唐王朝… |
季節 | 早春、真夏、秋分、初冬、厳冬… |
Where(どこで)
環境や背景を指定します。
カテゴリー | 例 |
---|---|
自然環境 | 山の小川、熱帯雨林、砂漠、海岸、高山の雪原… |
都市環境 | ビジネス街、静かな郊外、古い地区、ハイテクパーク、大型ショッピングセンター… |
室内環境 | 居心地の良いリビング、モダンなオフィス、高級レストラン、小さな寝室、クラシックな図書館… |
特殊環境 | 戦場、古代宮殿、未来都市、魔法の森、西部開拓時代の町… |
Why(なぜ・何をしている)
被写体の行動や状態の理由を提供します。
カテゴリー | 例 |
---|---|
特定の行動 | 本を読む、ピアノを演奏、コーヒーを飲む、自転車を修理… |
相互作用 | 友人との会話、ペットの世話、一緒に音楽演奏、電話をかける… |
感情表現 | 微笑む、遠くを見つめる、考え事で眉をひそめる、驚く、泣く… |
継続的活動 | 公園でのランニング、キャンプ、釣り、自転車に乗る… |
How(どのように)
画像の視覚的な要素やスタイルを指定します。
カテゴリー | 例 |
---|---|
構図 | 黄金比構図、対角線構図、三角構図… |
視点 | 鳥瞰図、見上げる視点、アイレベル… |
芸術スタイル | 印象派、リアリズム、サイバーパンク… |
色調 | クールトーン、暖色系、モノクロ、高彩度… |
照明と影 | 柔らかい光、強い影、優しい朝の光… |
テクスチャ | 滑らか、粗い、ふわふわ、絹のような… |
細部 | 装飾、背景要素、繊細なパターン… |
プロンプト例
上記、5W1Hを含めて書かれたプロンプトの例は以下となります。
(日本語訳)
夏の午後、コーヒーショップでドレスを着た茶髪の中国人少女がリンゴを食べている。油絵スタイル、極めて詳細、ミディアムショット。
是非、皆さんもこの5W1Hを意識したプロンプトを書いて、思い通りの結果が得られるか試してみてください。
3. 参照/ベース画像機能の使い方
時に言葉だけでは意図を正確に伝えるのが難しい場合があります。そんな時は「Reference/Base Image」機能を使用しましょう。参照画像をアップロードすることで、AIはそのスタイル、構図、色調などを参考に新しい画像を生成します。
参照画像のアップロード方法
- 「Text-to-Image」機能使用中に「Reference/Base Image」ボタンをクリック
- JPGまたはPNG形式の画像(10MB以下、300px以上)をアップロード
参照強度の調整
参照画像をアップロードした後、「Reference Strength(参照強度)」オプションが表示されます。
- 強い参照強度: 生成結果が参照画像により近くなる
- 弱い参照強度: 生成結果がプロンプトの内容により近くなる
参照強度を調整することで、プロンプトと参照画像のバランスを取ることができます。
4. 画像生成のパラメータ設定
KLING AIでは、画像サイズと生成枚数を調整できます。現在、以下の7種類の画像サイズが提供されています:
- 1:1 (1024×1024)
- 2:3 (832×1216)
- 3:2 (1216×832)
- 3:4 (832×1152)
- 4:3 (1152×896)
- 9:16 (768×1344)
- 16:9 (1344×768)
一度に最大9枚の画像を生成可能です。用途に合わせて適切なサイズを選択しましょう。
5. テキスト生成機能の活用方法
KLING AIには「Text Generation(テキスト生成)」機能も搭載されています。プロンプトにテキストを含めることで、画像内にテキストを表示することが可能です。
(日本語訳) 「I want to eat fish(魚が食べたい)」と書かれた看板を持ち上げている小さな白猫
このテキスト生成機能は中国語と英語のテキストに対応しており、両言語を同時に表示することも可能です。誕生日ケーキのメッセージ、犬の名札、バレンタインカードなど、様々な用途に活用できます。
6. よくある質問と回答
KLING AIの画像生成機能は、詳細なプロンプトと適切なパラメータ設定により、驚くほど高品質な画像を生成できます。「5W1H」の法則に基づいたプロンプト作成を心がけ、必要に応じて参照画像も活用することで、より想像に近い画像を生成することが可能です。ぜひ様々なプロンプトを試して、KLING AIの可能性を探ってみてください。
コメント