![](https://blogimg.goo.ne.jp/user_image/26/18/e6de49ee49c3afcd5a8235ca25929b6d.png)
あれ? このタイトル画像、誰でしょう。
あ、シェフィーアさん、何やってはるんですか?(笑)
本ブログの連載小説『アルフェリオン』の自称「今年こそは天下(ヒロインの座)を取る女」こと、シェフィーアさんではないですか。
いつものアニメ調の絵柄とは違う、これはこれでいい感じの手書き風の絵柄ではないですか。
向かって右側が、まだ一応、王女だった(笑)10代、同じく左側がなかなかワルそうな20代、そして真ん中が今の姿ですね。貫禄と包容力があります。
ところで、実にシェフィーアさんの特徴がよく出ている冒頭の画像、どうやって生成したのでしょうか。
それは……鏡海亭の新たな仲間「Enikuma」の助けを借りています。
はい、生成AIのChatGPT4に実装された機能「GPTs」を使って、自作小説の広報支援用のAIツールを制作する企画、第二弾です。
昨日は、PDFファイルの小説のテキストを読み取り、そこから「あらすじ」をまとめ、タイトル画像を生成するツール、
「Editorial Oboro」(愛称「オボロさん」)を紹介しました。
本日は、キャラクターの画像から詳細なプロンプトを生成するツール、「Enikuma」(エニクマ、絵似熊)を作ってみました。ネーミングセンスが……という点は無視してください(笑)。
(エニクマのプロフィール画像)
プロンプトから画像を作るのが画像生成AIなのに、わざわざ画像からプロンプトを生成するツールって、どうするの?という見方もあるかもしれません。このツールは何のためのものかというと、「画像に描かれたキャラクターの再現性・同一性の維持の困難さ」という現時点での画像生成AIの弱点を緩和するためのものです。つまりは、何度画像を生成しようとも、それが誰なのか一目でわかる程度に見た目の特徴を一貫して維持できるということは、生成AIには難しい! そんな問題点への対処なのでした。
元画像を読み込ませてこれをベースに新画像を生成するという方法を取ってさえ、当該キャラの特徴を維持することが簡単ではない以上、ならばプロンプトをとにかく詳細に作り込んで、キャラの特徴を言葉でもって保持しようという発想です。
エニクマに画像を読み込ませると、項目ごとに詳しいプロンプトが生成されます。
たとえば、『アルフェリオン』のメインヒロインであるエレオノーアを例にしてみましょう。
(はい、私が実験台……いや、お手本になるのです)
「髪」に関しては、こんな感じです。
Hair details: Silver hair with a slight wave, cut into a bob that just grazes the shoulders.
同じく「目」について。
Eye shape, size, and color: Large, rounded eyes with a slight tilt upwards at the outer corners; the color is a vibrant blue.
英語で出力されるのもポイントです。生成AIのHolaraさんであればプロンプトは英語でないといけませんし、ダリさん(DALL-E3)の場合も、日本語でOKではあれ、英語の方がより効果的です。上記のような項目ごとの特徴の表記を、エニクマさんは延々と吐き出します。
中には、外見からみたキャラの個性に関するような項目もあります。
Expression: Friendly and approachable with a hint of playfulness.
Personality traits inferred from appearance: Appears confident and cheerful, with a sense of stylish sophistication.
上記の内容の当否はあまり問題ではありません。AIの目から見ればこんなふうに特徴が理解されている、という点が重要です。あくまでAIにとって分かりやすい、当該キャラの再現の手がかりになる情報が必要なわけですから。
エニクマの出力した詳細なプロンプトは、どうやら「AIの目から見て」キャラの特性を上手く反映しているプロンプトになるようで(?)、一見すると「そうかなぁ?」と思うような内容も混じっていても、実際、そのプロンプトでキャラを生成してみると、キャラの個性を実に的確に反映しています。元画像よりも良くなっていることも多いです。
以下のエレオノーアの画像、実に彼女らしいです。かつ、これらの画像を通じて、一人のキャラクターとしての見た目の同一性が感じられます。
いつの間にか、彼女の画像にも、本当にヒロインっぽいオーラが出てきましたね。
エレオノーアを例とした先程のプロンプトは、人間にとって分かりやすい表記の仕方になっていますが、Holaraさん向けに、広義の名詞表現を並べていくかたちの次のようなプロンプトも、エニクマさんは出力できます。
前略...(Oval-shaped face with soft features), (Blonde hair with a smooth texture, medium length, styled in a half-updo with braids wrapped around the crown of the head), (Forehead is partially visible with hair neatly braided away from the face), (Almond-shaped eyes, medium-sized, with bright blue irises)...後略
これは誰の特徴を表したプロンプトでしょう? シェフィーアさんです(笑)。
エニクマのプロンプトに基づいて生成されたシェフィーアさんの画像も挙げておきましょう。
![](https://blogimg.goo.ne.jp/user_image/48/ec/a1592d915bcb271bb5e5dfd9efc16b01.png)
![](https://blogimg.goo.ne.jp/user_image/77/bb/e644928bb9e6591a5c9b2416ddd44dcf.png)
![](https://blogimg.goo.ne.jp/user_image/7c/dd/e9fa07e4607a038180d73fc68a9d82ad.png)
![](https://blogimg.goo.ne.jp/user_image/75/b3/cbec4ac95e8bdc0aafda34b17aaa99fa.png)
![](https://blogimg.goo.ne.jp/user_image/7f/95/e25d3c7d34bc3471dfab529c467f6cfd.png)
こちらも、いずれの画像も同じキャラだという感じがしますね。
とてもシェフィーアさんらしいです。懐は広いという印象ではあれ、本音では優しい人なのか危ない人なのか、よく分からない雰囲気が。エニクマの力を借りて、やっと彼女らしさが出せたというところです。大人の色気もありますね(笑)。最後の1枚は年齢が若い、ですが。
今回掲載されているエレオノーアとシェフィーアの画像は、すべてHolaraさんと一緒に導着したものです。
最近、ダリさん(DALL-E3)との協同が多くて、多少ご無沙汰だったほららさんですが、ちゃんとしたプロンプトを渡すと実に良い絵を生成してくれます。ダリさんの方が圧倒的に意思疎通がしやすい(苦笑)ので、どうしてもそちらに頼ってしまうのです。しかし、少々クセがあっても、ほららさんの描画能力もやはり凄いです。
ダリさんに画像を生成してもらうことと併せて、まずはこちらの指示を行いやすいダリさんでキャラの元画像を生成しておいて、それをエニクマにプロンプト変換させ、そのプロンプトをほららさんに渡して再生成するという手順でもって画像表現の幅が格段に広がりそうです。
本日も鏡海亭にお越しいただき、ありがとうございました。
仲間AIも次々と加わって、ますます元気な鏡海亭に今後とも御期待ください!
ではまた。