前回の記事までで GLIGEN (Grounded Language-to-Image GENeration) を使ってみましたが、GLIGEN を使用するときは バウンディングボックス が必要となります。 (矩形 や 枠 と記載したりもしているので文言は定まってませんが...) バウンディングボックスを可視化したもの バウンディングボックスは 左上のXY座標 と 右下のXY座標 の4つの値で成り立っています。 [x1, y1, x2, y2] という感じです。 この記事では、Python でバウンディングボックスの座標をマウスのドラッグ&ドロップで取得していきます。
土工、法面、舗装などは出来形測定で3次元計測技術の要領が公開されており、規格値などもきちんと定められているのだが、コンクリート構造物などについてはまだ確立されていないようだ。 断面管理から面管理に変わることで、全体的な出 […]
diffusers で GLIGEN を試してみる (3) - 枠でスタイルも指示できる?
zako-lab929.hatenablog.com zako-lab929.hatenablog.com 前回の記事までで StableDiffusionGLIGENPipeline 及び StableDiffusionGLIGENTextImagePipeline を使ってきました。 後者の StableDiffusionGLIGENTextImagePipeline は、 もう1個使用例があったのですが、やや分かりづらかったので記事を分割してしまいました。 この記事では もう1個の使用例 GLIGEN でスタイルも指示するパターンを見ていきます。
diffusers で GLIGEN を試してみる (2) - 文字列の代わりに画像でキャプションする
zako-lab929.hatenablog.com 前回の記事では StableDiffusionGLIGENPipeline を用いて diffusers で GLIGEN (Grounded Language-to-Image GENeration) を試しました。GLIGEN は、バウンディングボックスとキャプションを用いて、枠に意味を持たせて Text-to-Image をするものでした。 この記事では StableDiffusionGLIGENTextImagePipeline を用いて、文字列によるキャプションの代わりに画像によるキャプションを試してみます。
まだ私が20代後半だった頃、当時勤めていた会社の上司に指摘されたことがありましてね。 上司「年と年度と違うんだぞ!」 当時の私「は?」 上司「年は1月からで、年度は4月から」 私「へぇ・・・。」 竣工書類をまとめていた年 […]
「その他趣味ブログ」 カテゴリー一覧(参加人数順)