生成AIで画像やビデオを作るのも、だいぶ慣れてきた。とりあえず、一連の作業でまとめるやり方を見つけたので、進めてみることにする。
サボテン、多肉植物は好きなので、これからたくさん生成してみようと思う。


なぜか切り立った場所にある小さい家のイメージが好きなので、これも発展させてみたい。
今日は日中リモートワークをしていた。
午前中、ComfyUIで動画を作った。わけがわからないと思うがYouTubeにアップロードした。
今日YouTubeにアップロードした詩の朗読ファイル。
動画も出力できるので、Stable DiffusionよりComfyUIのほうがいいかな、ということでComfyUIをインストールした。GPUを使うので、新しく発売されている僕が使っているNVIDIAのGK-RTX5070いちばん新しいデバイスドライバをNVIDIAのサイトからダウンロードしてインストールした。4月30日に公開したものらしい。これを使わないとComfyUIはGPUを使えない状態だったと思う。
さっそく画像を生成してみた。画像生成のための文章は書くときに、規則があることがわかった。とりあえずchatGPTに聞いたらたくさんのサンプルを表示してくれた。
この文章を書くときのやり方についてはYouTubeなどにも番組がある。
動画についてはいくつか追加でインストールする必要があるが、簡単にできそうだった。しばらく静止画の練習をしようと思う。
下の風景の映像はchatGPTが表示してくれたサンプルから作ったもの。
この画像のための文章は以下である。
Top Tips for Capturing Stunning Landscapes
[Read More Tips] [Join Our Workshop]
下のようにワークフローがそのまま、生成の条件を決めるようになっている。
動画などの場合は、もっと複雑なワークフロー画面になると思う。
昨日アップロードした朗読ファイル。
今日はリモートで仕事をしていた。夕方から雨になって散歩できなかった。
写真のように、明後日ごろできあがるのでシールをパソコンケース前面に貼っておいた。
今回はStable Diffusionを入れて、生成AIを使い込もうということが目的である。
OSはLinuxで本当はDebianかUbuntuにしたいのだが、たぶんGeforce rtx 5070のnvidiaのドライバがLinuxの正式Packageに入っていない。とにかく使いたいので、Windows11にインストールするのが近道だと思った。いずれDebianで使えるようにしたい。
今日お昼ごろアップロードした詩の朗読ファイル。今日も朗読を収録した。視覚的に派手すぎるのもよくないし、そのビデオに合うデザインを見つけるのも難しい。
firefly.adobeで詩から映像を生成して、朗読の生の声、sunoによる曲の生成、など加工して少しリズムをつけてみた。
映像生成は英語のほうがよさそうなので、chatGPTで英訳してプロンプトに入れて生成。
いつもと違う文字の網目を
投げかけた
同じふうに巻き付くのに
ガチの洗い場
寒がりのお茶など
残存寄生映像が
似ているのは
なぜだろう
English Translation:
A net of unfamiliar characters
was cast upon me.
Though it wraps around the same way as always,
this is a real washing station.
Things like tea that’s afraid of the cold,
and lingering parasitic images—
why do they
seem so alike?
YouTubeはぼくが気に入っているサイト「しげ旅」が更新されたが、まだ見ていないので貼り付けは後日にする。
下はお昼にuploadした朗読ファイル。