カテゴリー: AIアートに吠えろ!

  • AIアートに吠えろ!004

    「AIアートに吠えろ!雄叫びの講義004画像生成AI時代の3Dモデリングの必要性としての画像生成AIとオープンソースの高機能3DソフトウェアBlenderの協同作業」

    まず、3DCGを行っている人たちや、3DCGを職業としようとしている人たちは、現在、動画生成AIにビビりまくっていると思います。今回は、3Dモデリングの将来性と、変化を論じていきます。

     私も、当初は、動画生成AIが、良くわからなかったことも在りましたが。

     YouTubeの動画で、3Dモデリングで作ったポリゴンの街の風景から、画像生成AIを用いて、綺麗な風景画や、海底の神秘的な水没都市を同じポリゴンモデルから画像生成AIで行う実験を見ました。

     この動画の中では、ポリゴンモデルを綺麗な風景画のように作成する手順を「AIによるレンダリング」と呼んでいました。

     少し、3Dソフトウェアでポリゴンモデルの勉強したり、ゲームなどで3Dゲームなどの仕組みに詳しい知識を持っている場合、レンダリングは、何であるか判ると思います。

     結論を先に書けば、3Dモデリングの専門家の仕事は無くならないと考えられます。

     少し前に、YouTubeの動画では、画像生成AIが作り出した、キャラクターをポリゴンモデルにする、技術が紹介されていました。

     この技術は、3Dモデリングの専門家には、ポリゴンモデルの作成の時間を減少させる効果が在ります。

     創造的な芸術の仕事に生産性という、言葉を持ち込むことは、生臭い話ですが、将来的には、3Dモデルの作成の時間が大幅に短くできると考えられます。

     A、生成AIによるレンダリング←ポリゴンモデルの微調整やデザインの変更⇔画像からポリゴンモデルを作成する。

     B、生成AIによるレンダリング←画像からポリゴンモデルを作成する。

     C、生成AIによるレンダリング←過去に作成したり現在作成したポリゴンモデルの微調整やデザインの変更。

     他にも新しい技術は出てくると思います。

     現在進んでいる、生成AIを用いた3DCGのモデリングの技術は、このような状況だと考えられます。

     この場合、3DCGのモデリング作業の専門家は、従来よりも多くの3Dモデリングが可能になります。

     では、少し、現実的な、職業の問題を論点としましょう。

     動画生成AIの発達で、映画俳優の仕事が無くなるのか。と考えた場合。

     全然、そんなことは在りません。

     現在でも、3DのCGを実写の映画では使って、映画俳優も、人間です。

     従来の技術で、合成の技術を使えば、簡単に、コンピュータ上で3DCGと人間が一緒に共演するシーンの合成が可能です。

     そして、画像生成AIでも、全ての人間を、生成AIが作成する画像の中に写真から取り込むことも可能です。正確には画像ファイルの人間の画像からですが。

     このような、現実世界で生きている、もしくは生きていた、人間の写真を取り込んだ画像ファイルを、生成AIを用いて動画として動かす。このような流れは、今後一般的になると考えられます。

     新しい芸術表現です。

     最初期の映画の始祖であるリュミエール兄弟たちの逸話が思い出されるように、現代の世界では、世界の多くの人達が、画像生成AIや動画生成AIを用いた、芸術的な表現で取り組んでいます。

     映画俳優の役割は無くなりませんが。

     低予算でも、現在の大作と呼ばれる映画の水準が再現できる時代へ向かうと考えられます。

     このような、現実の人間を、3Dのポリゴンモデルとして、Blenderなどの3DCGの制作ソフトに取り込んで、現実では不可能な、アクションシーンや、ファンタジーのシーン、SFのシーンを作成することが今後、考えられます。

     このような取り組みは、既に、YouTubeでは、世界的に始まっている事が発信されています。

     従来型の、3DのCGでは、人的な労働力と、クリエーターの能力に大きく左右される面が強いと考えられます。

     ですが、生成AIを使うことで、今までは不可能だった3DCGの動画を作成することができると考えられます。

     世界の多くの人達の、想像力に翼を与える、時代が始まっています。 

     世界各国の生成AIの技術者の方々や、創作活動のフロントランナーの方々の恩恵を受けている私、山田夢幻は、頭を下げる状態です。

     謝辞と共に、では、今回の第004回の講義を終えます。

     

  • AIアートに吠えろ!003

    「AIアートに吠えろ!雄叫びの講義003音楽生成AI、SUNOでの、昨年の2024年からの楽曲作成の実験の報告」

    では、最初にSUNOのリンクを貼っておきます。「https://suno.com/」をクリックするとSUNOのホームページへハイパーリンクで移動します。URLと呼ばれるホームページのアドレスですから、ブラウザーに入力しても辿り着けます。

     昨年、針屋書店のSF小説「電脳世紀東京ネイショニストワルツ」の販促の動画を作成していました。音楽が、どうしても必要で、YouTubeで生成AI関連の動画を追っていると、SUNOという音楽生成AIが優れているという情報を得て、試してみました。

     期待以上の音楽で驚きました。

     生成AIのCopilotが作成した歌詞を使い。SUNOで最初の「Song of Hariyashoten」という、少し過剰なナルシズムさえ感じる女性ボーカルの歌として完成しました。

     次に「電脳世紀東京ネイショニストワルツ」のテーマソングを作成するために、生成AIのCopilotと相談しまた。

     ここからが、音楽関係者や、音楽教育者、生成AIを使って音楽を作ろうとしている人達には、重要ですが。

     音楽生成AIは、大きく分けて、私の経験では、

     1、入力した歌詞から、相応しい音楽を生成する傾向が、私の経験では見られる。

     2、音楽のジャンル(クラシック音楽や、メタル、邦楽など、曲の感情的な面も含める)。

     3、実際に演奏を行うボーカルや使う楽器の種類(男性ボーカルや、女性ボーカル、ピアノや、ドラムス、シンセサイザーなど)。

     が、音楽生成AIに入力する変数(要素)として、使われるようです。

     私が主に使用しているテキストは、松尾公也著秀和システム「SunoAIではじめる音楽生成AI入門」です。

     私が、「電脳世紀東京ネイショニストワルツ」の歌詞を、作曲する際に、サイバーパンクシティ東京で、未来の夢を追いかける若者たちなどの、テーマを生成AIのCopilotに相談するプロンプトに含めて、作成を、お願いしました。

     ちなみに主人公の耕太郎と結貴の夢は、結婚することです。後の話は、夢を叶えて夫婦となった二人の物語となります。

     結果的に、「電脳世紀東京ネイショニストワルツ」の主題歌「Full metal faith」の歌詞が完成しました。

     生成AIのCopilotに歌詞を作詞してもらう相談をする前に、サイバーパンクのSF小説に、相応しい、音楽のジャンルとしてメタルを選択することが良いのか、生成AIのCopilotに相談しています。

     結果はゴーサインです。

     そして、「電脳世紀東京ネイショニストワルツ」の主題歌「Full metal faith」は完成しました。

     下の音楽プレイヤーの▶ボタンを、指でタップしたり、クリックするとストリーミング再生が可能です。ちなみに「…」ボタンを押すとダウンロードも出来ます。

     ですが、「Full metal faith」は、生成AIのSUNOのバージョン3.5で作りました。CROPという曲の場所をカットして編集できる機能で編集しています。当時、SUNOの使い方が良くわからず、試行錯誤を繰り返しています。

     では、比較できるように、SUNOのバージョン4を使ってリマスター化を行い、高音質にした、バージョンの「Full metal faith」を聞くことが出来ます。

     下の音楽プレイヤーの▶ボタンを、指でタップしたり、クリックするとストリーミング再生が可能です。ちなみに「…」ボタンを押すとダウンロードも出来ます。

     私が聞き比べた感想では、バージョン3.5の方がボーカルが上手すぎる感じがします。バージョン4の方は人間のボーカルが歌っている感じがします。

     最初は、ボーカルの固定方法のPersona機能が使えず、不安を感じたまま、SUNOで、

    針屋書店のファンタジー小説、「ダンジョニアン男爵の迷宮競技」などのテーマソングを作成していました。

     ですが、Personaの使い方が、判って、ボーカルの固定ができるようなりました。

     そして、「Song of Hariyashoten」の女性ボーカルを、ファンタジー小説の光堕ちして牧師のマーク・ストーンの妻となる、ルーシー・ルース・ストーンとして固定しています。

     「Full metal Faith」のボーカルは、ファンタジー小説の天才ロッカーJ2Jとして固定しました。結果的に、今、執筆中の「電脳世紀東京ノーブルパゴーダ」のテーマソング「Steel bonds」を作成し出来ました。

     現在、このhariyashoten2.comの、ホームページで、視聴可能な動画「電脳世紀ノーブルパゴーダSF設定動画」で使われているテーマソングが「Steel bonds」です。SUNOのバージョン4で作成した後で、リマスターを掛けています。

     この「Steel bonds」では笑い話が在ります、私が歌詞に「Intro」と「Outro」を入力し忘れて、前奏曲が無い形として仕上がりましたが。予想外の効果が確認できました。

     ボーカルのJ2Jが息継ぎをする所から曲が始まるため、生成AIのSUNOの実力の高さを再確認しました。偶然の結果、予想外のドラマチックな曲ができました。

     ほかにも音楽生成AIでは、色々な試行錯誤の話が在りますが、別の機会に。

     では、今回の第003回の講義を終えます。

    以下のライセンスの概要
    この作品は自由にストリーミングで聴いたり、ダウンロードして個人のMP3プレーヤーやアプリで再生したりすることができます。その際、複製が生じた場合でも例外規定として許可されます。

    この作品「Full metal faith」の生成AIとの協業で作成し加工した音楽、画像は著作権により保護されています。
    © 2025 Hariya Tadamichi. All rights reserved.

    ただし、個人の非営利利用に限り、以下の条件での利用を許可します:

    本楽曲の音楽および画像は著作権により保護されています。無断転載・複製を禁じます。 ただし、以下の条件に限り、非営利目的での配布・共有を許可します:

    [クリエイティブ・コモンズ・ライセンス 表示-非営利-改変禁止4.0

    国際(CC BY-NC-ND 4.0)] https://creativecommons.org/licenses/by-nc-nd/4.0/deed.ja

    2025年04月25日 針屋書店代表 山田夢幻

  • AIアートに吠えろ!002

    video
    play-sharp-fill

    吠えている山田夢幻。でも プロンプトはアクビ。

    「AIアートに吠えろ!雄叫びの講義002画像の同一性の継承の失敗と、偶然できた面白い動画」

    まず、キャラクター固定の問題は、時間的に解決するとの楽観的な予測から、昨年の2024年は、キャラクターの固定を先送りして、ドンドンと、ノリノリで、今まで綺麗なキャラクターが描けなかったフラストレーションの反動で、画像生成AIで小説のイメージイラストの画像ファイルを作りまくり。動画生成AIで動画を作っていました。実際、音楽生成AIのSUNOでは、ペルソナというボーカルの固定ができるようになりました。

     ボーカルの固定で、電脳世紀東京のテーマソング「Full metal faith」のボーカルを、ファンタジー小説の音楽で戦う天才ロッカーJ2Jとして固定に成功して、昨年は電脳世紀東京の第二作品で今年に完成予定の「ノーブルパゴーダ」のテーマソングをJ2Jのボーカルで作れました。

     基本的には、IP-AdopterとLoraのどちらが、画像生成AIでのキャラクターの固定に向いているのかが、現在の研究テーマです。

     IP-Adopterを使って、秘密結社ドゲッサー編の二話から登場する、クローン人間のドローンパイロットのジーンのキャラクター固定を考えました。ですが、見事に失敗しました。

     で、マリネでも、IP-Adopterを使って失敗しました。

     ただ、ジーンでもマリネでも、CG画像としてはIP-Adopterを使った場合、面白い作品が出来ました。

     目が大きくなりすぎて目指していたリアル系での人物の固定は見事に失敗しましたが。面白いCGを使ったアニメ風の動画ができました。

     丁度、3DのCGでポリゴンからモデリングして、ボーンで動かして、レンダリングをするという工程を経て作る、従来の高画質の3DのCGの動画が、画像生成AIと動画生成AIを使いジーンとマリネで出来ました。

     これが、それです↓。マリネは、ほぼ同一のプロンプトで、Weekly Portrait用に作ったIP-Adopterを使っていない動画も一緒に掲載するので比較してください。

    video
    play-sharp-fill

    ジーンIP-Adopter使用

    video
    play-sharp-fill

    マリネIP-Adopter使用

    video
    play-sharp-fill

    マリネIP-Adopter使用せず。プロンプトのみ。

     この感想は、人によって違うでしょう。

     漫画やアニメのようなキャラクターが、3DのCGで綺麗に動く動画は、不気味さや、違和感を感じる人達もいると思います。

     アニメ的な表現で、3DのCGで細かい部分が作りこまれる表現方法は、CGが映画やアニメで使われるようになってからの技法です。

     今回のテーマは、偶然できた、このジーンとマリネの動画生成AIを使って作った、動画は、今後、3DのCG作品を作る上では、作業工程と時間を大幅に短縮できる可能性への示唆があると考えられます。

     私も、3DのCGは、大昔から使われているスプライン型と、現在一般的なポリゴン型で、一応勉強はしています。

     リギングと、ボーンの使い方も、一応簡単な3DのCGのモデリングで勉強しています。

     ですが、3DのCGは、モデリングやリギングは別々の専門家のアーティストがいる分野です。

     3DのCGソフトはプロフェッショナル用では非常に高価です。フリーソフトのBlenderの選択肢もありますが。この場合、グラフィックカードが、特殊な製品が必要になります。ですが、勉強用にモニター一つぐらいの接続では、現在OpenGL用のBlender用のグラフィックカードは比較的安価な価格で現在は手に入ります。仮想通貨のマイニング用途では遅すぎる性能ですから、入手はできると思います。コンピュータの性能は向上し続けて、性能に比較して半導体の価格は、安くなり続けています。

     時代の進歩の凄さを実感します。

     YouTubeでは3Dモデルと、画像生成AIや動画生成AIの組み合わせの実験を紹介している、動画も在ります。

     同一キャラクターの固定問題は、肯定的に早い段階で解決できそうな楽観的な予測を私はしています。

     Loraを作るための専用に近い動画の作成方法が、既に、公開されています。

     このような技術進歩の速さから、画像生成AIや動画生成AIでは、同一の登場人物や、メカなどの、キャラクターの固定の課題はかなり速く解決できると楽観的に考えられます。 

     現在、私は、Loraの作成は実験を開始した段階です。 

     ですが、時間的な制約から、なかなか、Loraの作成の勉強の時間はとれません。

     現在、今年中に電子書籍で出版予定の「電脳世紀東京ノーブル・パゴーダ」を書いています。

     ちなみに「電脳世紀東京ノーブル・パゴーダ」はKindleでの販売を行う予定は在りません。

     山田夢幻と針屋忠道が針屋書店の経営を考える「犬猫談義」で詳細は伝えます。

     IP-Adopterも知識自体は昨年の段階であったのですが。どのぐらいの同一キャラクターの固定の精度があるのか、試したのは今年に入ってからです。

     IP-Adopterも設定のパラメータを変えれば、リアル系でのキャラクターの固定が可能かもしれませんが。実験は開始した段階です。

     Loraも高精度のキャラクター固定を行うために色々と勉強しながら実験を続ける予定です。

     現在、新しい技術で、動画生成AIでもLoraを使うことが可能になってきているようです。

     喜ばしい時代の進歩です。

     では、今回の第002回の講義を終えます。

  • AIアートに吠えろ!001

    「AIアートに吠えろ!雄叫びの講義001画像生成AI」

    まず、以前に、「無住心言術道場」の企画で書いた、マリネと迷彩マリネの違いです。

    たった一文字の英単語をスプライトから、カモフラージュに変えただけで、他の設定やプロンプトが全て同じでも、異なる結果が出ます。

    下が、「通常のマリネ・ソルト」と「迷彩マリネ・ソルト」の画像ファイルです。

    私もAIを用いたアート作品の作成には、一年未満という時間的な、未熟練の課題があります。

    ですが、色々と考えさせられる事は多いです。

    私は初期にプロンプト無しで間違えて、画像生成AIで、画像を生成したこともあります。

    その時に、画像生成AIの想像力と呼ぶべきか、表現力には驚かされました。

    予想もしない、表現を画像生成AIは、作り出しました。

    まだ、プロンプトのコントロールに習熟していない状態です。

    私のファンタジー作品のスカイ達は、B5ノートにボールペンと色鉛筆で、イメージイラストを描いていました。

    ですから、画像生成AIでキャラクターを描いて貰う前に、服装とかの大まかなデザインは決まっていました。スカイが、オリーブドライブのカーゴパンツを履いて赤いバンダナと黒いTシャツもイメージイラストでは決まっていました。

    ですが、画像生成AIの方が、良いキャラクターデザインを作成できる場合の方が多いです。

    この問題は昨年の四月頃は悩みの種でした。

    楚宇那が、おかっぱ頭の理由が、ルルとの決闘の髪切りデスマッチの条件で負けたからという設定は、

    大分前に出来ていました。楚宇那は丸坊主にしようとしましたが、ルル達四人が止めて、おかっぱ頭に落ち着く設定です。髪の毛は楚宇那は昔のように伸ばしますが。

     ですが、当時は、画像生成AIで、女性のショートカットのヘアースタイルが出せなかった事も大きいです。プロンプトの、制御ができなかったことは大きいです。

     で、白い日本の着物を着た楚宇那から、おかっぱ頭とデザインが確定し。おかっぱ頭の連想から、日本の大正時代の、女学生の服が採用されました。

     昨年の終わりごろまでは、ほぼ英単語だけでプロンプトを作成していましたが。現在は、大規模言語モデルの生成AIを使ってプロンプトを作る試みを行っていますが。大規模言語モデルが作成するプロンプトも部分的には、やはり英語の単語で構成されている部分も在ります。

     小技のテクニックとしては、英単語は、ブラウザーに「迷彩 英語」と入力すると、検索エンジンが、インターネット上の英語の単語の意味などを記したウェブページを候補として表示します。コロンのベレー帽は「beret 意味」など表示すると英語のネイティブ圏で使われる意味や原義を教えるホームページがブラウザーに表示されます。google の単語の翻訳機能もあります。

     ですが、今回では扱いませんが。生成AIから、英語の単語の意味を教わったり、英文の添削を受けながら、プロンプトの文章を作成する勉強法も含めた方法なども在ります。

     私もキャラクターの固定には悩んでいますが。

     画像生成AIでマリネ・ソルトと、ジーン・セラミカのキャラクター固定をしようとしたらCG風の動画が作成され事もあります。

     この動画と同じ水準の動画作品をCGのモデリングから人力で行うと、ものすごい高額の経費が、コンピュータの力も含めて掛かる事は理解しています。

     ですが画像生成AIと動画生成AIを使うと少ない費用で簡単に作れます。

     針屋書店の芸術活動は、非常に安価なコストで運営されています。

     私もローカルの、高性能かつ高価な環境で、動画作成や、LORAの作成の熟練などは行いたいとは考えていますが。

     クラウドサービスの方が、遥かに安価になります。 

     LORAのトレーニングにクラウドサービスを利用すると、画像ファイルのデータセットを上手く既定の形に整えると、費用は、日本円では、500mlのペットボトルの清涼飲料水一本と同じ程度の費用で、データセットの画像ファイルが比較的多いLORAでも三回以上作成が可能です。画像ファイルのデータセット数を減らしたLORAでは十四回近く可能です。

     私も、LORAは昨日からトレーニングを開始した理由から、習熟しているとは言えませんが。

     針屋書店のコンテンツである、AIアートの経費は、かなり低いんです。誇張でもハッタリでも在りません。

    コンピュータの発展の最初期にはタイムシェアリング処理という、使用時間ごとに課金される利用方法が在りました。この考え方が、現在のクラウドサービスでは、発展した形で使われていると考えられます。

     新しい表現を考えていく上では、画像生成AIの自由な表現力を、デザインを考える上では採用する場合も多いです。

     より、そのキャラクターらしいデザインを画像生成AIが提示することも多いです。組み合わせの天文学的な数字の中から、自分のイメージする、キャラクターのデザインに近づけていく形で、英単語を使った、プロンプトを作成していたのが、昨年2024年の私でした。

     では、今回の第001回の雄叫びの講義を終えます。

Hide picture