カテゴリー: AIアートに吠えろ!

  • AIアートに吠えろ!002

    video
    play-sharp-fill

    吠えている山田夢幻。でも プロンプトはアクビ。

    「AIアートに吠えろ!雄叫びの講義002画像の同一性の継承の失敗と、偶然できた面白い動画」

    まず、キャラクター固定の問題は、時間的に解決するとの楽観的な予測から、昨年の2024年は、キャラクターの固定を先送りして、ドンドンと、ノリノリで、今まで綺麗なキャラクターが描けなかったフラストレーションの反動で、画像生成AIで小説のイメージイラストの画像ファイルを作りまくり。動画生成AIで動画を作っていました。実際、音楽生成AIのSUNOでは、ペルソナというボーカルの固定ができるようになりました。

     ボーカルの固定で、電脳世紀東京のテーマソング「Full metal faith」のボーカルを、ファンタジー小説の音楽で戦う天才ロッカーJ2Jとして固定に成功して、昨年は電脳世紀東京の第二作品で今年に完成予定の「ノーブルパゴーダ」のテーマソングをJ2Jのボーカルで作れました。

     基本的には、IP-AdopterとLoraのどちらが、画像生成AIでのキャラクターの固定に向いているのかが、現在の研究テーマです。

     IP-Adopterを使って、秘密結社ドゲッサー編の二話から登場する、クローン人間のドローンパイロットのジーンのキャラクター固定を考えました。ですが、見事に失敗しました。

     で、マリネでも、IP-Adopterを使って失敗しました。

     ただ、ジーンでもマリネでも、CG画像としてはIP-Adopterを使った場合、面白い作品が出来ました。

     目が大きくなりすぎて目指していたリアル系での人物の固定は見事に失敗しましたが。面白いCGを使ったアニメ風の動画ができました。

     丁度、3DのCGでポリゴンからモデリングして、ボーンで動かして、レンダリングをするという工程を経て作る、従来の高画質の3DのCGの動画が、画像生成AIと動画生成AIを使いジーンとマリネで出来ました。

     これが、それです↓。マリネは、ほぼ同一のプロンプトで、Weekly Portrait用に作ったIP-Adopterを使っていない動画も一緒に掲載するので比較してください。

    video
    play-sharp-fill

    ジーンIP-Adopter使用

    video
    play-sharp-fill

    マリネIP-Adopter使用

    video
    play-sharp-fill

    マリネIP-Adopter使用せず。プロンプトのみ。

     この感想は、人によって違うでしょう。

     漫画やアニメのようなキャラクターが、3DのCGで綺麗に動く動画は、不気味さや、違和感を感じる人達もいると思います。

     アニメ的な表現で、3DのCGで細かい部分が作りこまれる表現方法は、CGが映画やアニメで使われるようになってからの技法です。

     今回のテーマは、偶然できた、このジーンとマリネの動画生成AIを使って作った、動画は、今後、3DのCG作品を作る上では、作業工程と時間を大幅に短縮できる可能性への示唆があると考えられます。

     私も、3DのCGは、大昔から使われているスプライン型と、現在一般的なポリゴン型で、一応勉強はしています。

     リギングと、ボーンの使い方も、一応簡単な3DのCGのモデリングで勉強しています。

     ですが、3DのCGは、モデリングやリギングは別々の専門家のアーティストがいる分野です。

     3DのCGソフトはプロフェッショナル用では非常に高価です。フリーソフトのBlenderの選択肢もありますが。この場合、グラフィックカードが、特殊な製品が必要になります。ですが、勉強用にモニター一つぐらいの接続では、現在OpenGL用のBlender用のグラフィックカードは比較的安価な価格で現在は手に入ります。仮想通貨のマイニング用途では遅すぎる性能ですから、入手はできると思います。コンピュータの性能は向上し続けて、性能に比較して半導体の価格は、安くなり続けています。

     時代の進歩の凄さを実感します。

     YouTubeでは3Dモデルと、画像生成AIや動画生成AIの組み合わせの実験を紹介している、動画も在ります。

     同一キャラクターの固定問題は、肯定的に早い段階で解決できそうな楽観的な予測を私はしています。

     Loraを作るための専用に近い動画の作成方法が、既に、公開されています。

     このような技術進歩の速さから、画像生成AIや動画生成AIでは、同一の登場人物や、メカなどの、キャラクターの固定の課題はかなり速く解決できると楽観的に考えられます。 

     現在、私は、Loraの作成は実験を開始した段階です。 

     ですが、時間的な制約から、なかなか、Loraの作成の勉強の時間はとれません。

     現在、今年中に電子書籍で出版予定の「電脳世紀東京ノーブル・パゴーダ」を書いています。

     ちなみに「電脳世紀東京ノーブル・パゴーダ」はKindleでの販売を行う予定は在りません。

     山田夢幻と針屋忠道が針屋書店の経営を考える「犬猫談義」で詳細は伝えます。

     IP-Adopterも知識自体は昨年の段階であったのですが。どのぐらいの同一キャラクターの固定の精度があるのか、試したのは今年に入ってからです。

     IP-Adopterも設定のパラメータを変えれば、リアル系でのキャラクターの固定が可能かもしれませんが。実験は開始した段階です。

     Loraも高精度のキャラクター固定を行うために色々と勉強しながら実験を続ける予定です。

     現在、新しい技術で、動画生成AIでもLoraを使うことが可能になってきているようです。

     喜ばしい時代の進歩です。

     では、今回の第002回の講義を終えます。

  • AIアートに吠えろ!001

    「AIアートに吠えろ!雄叫びの講義001画像生成AI」

    まず、以前に、「無住心言術道場」の企画で書いた、マリネと迷彩マリネの違いです。

    たった一文字の英単語をスプライトから、カモフラージュに変えただけで、他の設定やプロンプトが全て同じでも、異なる結果が出ます。

    下が、「通常のマリネ・ソルト」と「迷彩マリネ・ソルト」の画像ファイルです。

    私もAIを用いたアート作品の作成には、一年未満という時間的な、未熟練の課題があります。

    ですが、色々と考えさせられる事は多いです。

    私は初期にプロンプト無しで間違えて、画像生成AIで、画像を生成したこともあります。

    その時に、画像生成AIの想像力と呼ぶべきか、表現力には驚かされました。

    予想もしない、表現を画像生成AIは、作り出しました。

    まだ、プロンプトのコントロールに習熟していない状態です。

    私のファンタジー作品のスカイ達は、B5ノートにボールペンと色鉛筆で、イメージイラストを描いていました。

    ですから、画像生成AIでキャラクターを描いて貰う前に、服装とかの大まかなデザインは決まっていました。スカイが、オリーブドライブのカーゴパンツを履いて赤いバンダナと黒いTシャツもイメージイラストでは決まっていました。

    ですが、画像生成AIの方が、良いキャラクターデザインを作成できる場合の方が多いです。

    この問題は昨年の四月頃は悩みの種でした。

    楚宇那が、おかっぱ頭の理由が、ルルとの決闘の髪切りデスマッチの条件で負けたからという設定は、

    大分前に出来ていました。楚宇那は丸坊主にしようとしましたが、ルル達四人が止めて、おかっぱ頭に落ち着く設定です。髪の毛は楚宇那は昔のように伸ばしますが。

     ですが、当時は、画像生成AIで、女性のショートカットのヘアースタイルが出せなかった事も大きいです。プロンプトの、制御ができなかったことは大きいです。

     で、白い日本の着物を着た楚宇那から、おかっぱ頭とデザインが確定し。おかっぱ頭の連想から、日本の大正時代の、女学生の服が採用されました。

     昨年の終わりごろまでは、ほぼ英単語だけでプロンプトを作成していましたが。現在は、大規模言語モデルの生成AIを使ってプロンプトを作る試みを行っていますが。大規模言語モデルが作成するプロンプトも部分的には、やはり英語の単語で構成されている部分も在ります。

     小技のテクニックとしては、英単語は、ブラウザーに「迷彩 英語」と入力すると、検索エンジンが、インターネット上の英語の単語の意味などを記したウェブページを候補として表示します。コロンのベレー帽は「beret 意味」など表示すると英語のネイティブ圏で使われる意味や原義を教えるホームページがブラウザーに表示されます。google の単語の翻訳機能もあります。

     ですが、今回では扱いませんが。生成AIから、英語の単語の意味を教わったり、英文の添削を受けながら、プロンプトの文章を作成する勉強法も含めた方法なども在ります。

     私もキャラクターの固定には悩んでいますが。

     画像生成AIでマリネ・ソルトと、ジーン・セラミカのキャラクター固定をしようとしたらCG風の動画が作成され事もあります。

     この動画と同じ水準の動画作品をCGのモデリングから人力で行うと、ものすごい高額の経費が、コンピュータの力も含めて掛かる事は理解しています。

     ですが画像生成AIと動画生成AIを使うと少ない費用で簡単に作れます。

     針屋書店の芸術活動は、非常に安価なコストで運営されています。

     私もローカルの、高性能かつ高価な環境で、動画作成や、LORAの作成の熟練などは行いたいとは考えていますが。

     クラウドサービスの方が、遥かに安価になります。 

     LORAのトレーニングにクラウドサービスを利用すると、画像ファイルのデータセットを上手く既定の形に整えると、費用は、日本円では、500mlのペットボトルの清涼飲料水一本と同じ程度の費用で、データセットの画像ファイルが比較的多いLORAでも三回以上作成が可能です。画像ファイルのデータセット数を減らしたLORAでは十四回近く可能です。

     私も、LORAは昨日からトレーニングを開始した理由から、習熟しているとは言えませんが。

     針屋書店のコンテンツである、AIアートの経費は、かなり低いんです。誇張でもハッタリでも在りません。

    コンピュータの発展の最初期にはタイムシェアリング処理という、使用時間ごとに課金される利用方法が在りました。この考え方が、現在のクラウドサービスでは、発展した形で使われていると考えられます。

     新しい表現を考えていく上では、画像生成AIの自由な表現力を、デザインを考える上では採用する場合も多いです。

     より、そのキャラクターらしいデザインを画像生成AIが提示することも多いです。組み合わせの天文学的な数字の中から、自分のイメージする、キャラクターのデザインに近づけていく形で、英単語を使った、プロンプトを作成していたのが、昨年2024年の私でした。

     では、今回の第001回の雄叫びの講義を終えます。

Hide picture