【簡単】SeaArt AIでLoRAを作成する方法と使い方を解説! - IT.Lifestyle.up

【簡単】SeaArt AIでLoRAを作成する方法と使い方を解説!

【簡単】SeaArt AIでLoRAを作成する方法と使い方を解説! 画像生成
この記事は約10分で読めます。

画像生成をしていると思ったような仕上がりにならないことはありませんか?

そんな時に活躍するのが、LoRAです。

LoRAを使用すれば、プロンプトが分からなくても雰囲気に近い画像を生成してくれます。

本記事を読むことで、LoRAの特徴、SeaArt AIでのLoRAの作り方や使い方がわかります。

2024年1月2日のアップデートによりVIP制限が解除され、SVIP(有料会員)でない方も自由に利用できるようになりました!

スポンサーリンク
スポンサーリンク

LoRAとは

LoRA(ローラ)は”Low-Rank-Adaptation”の略で、少ない計算量で追加学習可能なモデルのことです。

大規模言語モデルによる画像生成を効率的にするためのツールで、さまざまな種類のLoRAが存在しています。

モデルとLoRAの違い

初心者の方はモデルとLoRAの違いに戸惑うことが多いと思います。

モデルは基本的な画風を決定し、生成する画像の大まかなスタイルを定めます。

一方、LoRAはモデルに追加効果を加えるものと考えていただくと理解しやすいでしょう。

LoRAの種類

ここでは、4種類の代表的なLoRAを紹介します。

画風LoRA

線画

線画
https://civitai.com/models/234137/zgxmmn10ganshiba

水彩画

水彩
https://civitai.com/models/37680/architecture-watercolor-style

ジグソーパズル画

パズル
https://civitai.com/models/231789/jigsaw-puzzles-sdxl

服装LoRA

浴衣

浴衣
https://civitai.com/models/207634/a-simple-kimonoyukata

メイド服

メイドコスチューム
https://civitai.com/models/215772/rc-s5

学生服

学生服
https://civitai.com/models/202405/cnhs-shs-student-or-female

背景LoRA

コンビニ背景

コンビニ
https://civitai.com/models/232494/f-sdxl

学校の教室の背景

学校の教室
https://civitai.com/models/222483/japanese-school-classroom-sd15

旅館の背景

旅館の背景
https://civitai.com/models/37055/ryokan-sd15

ポーズLoRA

あぐらをかくポーズ

あぐらのポーズ
https://civitai.com/models/226062/butterfly-sitting

片足で立つポーズ

片足ポーズ
https://civitai.com/models/202165/standing-on-one-legleg-up

ジャンプしているポーズ

ジャンプポーズ
https://civitai.com/models/147583/fly-jump

SeaArt AIでLoRAを作成する方法

先ほどはLoRAの種類を紹介しましたが、実際にLoRAを作ってみたいと思った方はSeaArt AIで簡単に作成できます。

SeaArt AIでのLoRAの作成方法は次のとおりです。

  • データセット作成
  • パラメータ設定
  • 画像のアップロード(最大100枚)
  • LoRAトレーニング開始
  • LoRAの公開
  • 奨励プログラムの参加(任意)

トレーニングへのアクセスとデータセット作成

上部にあるトレーニングへアクセスしたら、「データセット作成」をクリックします。

パラメータ設定

初心者の方は、赤枠で囲った4つのプリセットから選択しましょう。

基本的なパラメータが反映されます。

実写系なら人物像を、アニメ系ならアニメを、風景であればスタイルを選択します。SDXLは基本モデルに左右されないやつです!

高級設定について

高級設定では、個別にパラメータ設定ができるようになっています。以下にいくつか紹介します。

  • U-Net学習率:学習率が高いほど速度が速くなるが、品質が落ちる可能性がある。一方、学習率が低すぎると、生成画像が理想的でなく、学習が遅くなる。推奨値は0.0001。
  • サンプル画像の解像度:解像度が高いほど、必要な時間が長くなる。推奨値は512*512。
  • テキストエンコーダー学習率:テキストの学習で、タグの感度が高くなる。
  • オプティマイザー:AdamWがよく使われる。
  • ネットワークサイズ:値が大きいほど、画像の精度が高く保たれるが、時間がかかる。解像度の高い画像には大きなネットワーク次元が必要で、通常128が選択される。(アニメなら32、キャラクターなら32-128、風景や物体なら128)
  • ネットワークAlpha:ネットワークサイズを超えないよう注意し、1から128の間の値を設定する。

初心者の方は、無理に触る必要はないです。

SDXL用の推奨トレーニングパラメータ

SDXLとは、SD1.5では難しかった小物や構図の生成が容易で、2段階の画像処理により高品質な画像を出力する最新の画像生成AIです。

SDXLでは次のパラメータ値がおすすめです!

リピート:画像が学習される回数。値が高いほど効果が良く、画像の構成が複雑になる。値が高すぎるとオーバーフィッティング(過学習)のリスクが高まりまる。そのため、10に設定すれば、良好なトレーニング結果が得られ、オーバーフィッティングの可能性も最小限に抑えられる

エポック:データセット画像のトレーニングサイクル数で、おすすめは10。しかし、データセットが小さい場合はこの値を上げ、データセットが大きい場合は下げてください。

オーバーフィッティング(過学習)は、機械学習モデルの学習が過度に進行した状態を指します。たとえば、生成された画像が訓練データにない奇妙なノイズやアーチファクトを含んだり、モデルがデータ分布の一部分にのみ特化してしまったりします。これが起きるとモデルの運用が難しくなります。


学習率:各リピートにおける変化の度合いで、値が高いほど学習が速くなるが、モデルがクラッシュしやすくなる。値が低いと学習は遅くなるが、最適な状態に達する可能性が高い。SDXLでは、0.0001がおすすめ。


U-Net学習率:これは、値が高いとフィッティングは速くなるが、細かい部分を見落とすリスクが生まれる。値が低いとアンダーフィッティングが起こるため、SDXLでは0.0002がおすすめ。

アンダーフィッティングとは、機械学習モデルの学習が不十分な状態を指します。たとえば、

生成された画像が訓練データの画像とほとんど同じになってしまったり、生成画像が粗雑で詳細が再現されなかったりします。


テキストエンコーダー学習率:タグをU-Netが理解できる形のエンベディングに変換する。SDXLのText Encoderはすでによく学習されているため、デフォルト値0.00001で問題ない。


学習率スケジューラ:トレーニング中に動的に学習率を調整するためのアルゴリズムのことで、Constantを選択すればよい。


オプティマイザー:深層学習におけるアルゴリズムの1つ。SDXLのトレーニングではデフォルトのAdamWを使用する。しかし、条件次第ではProdigyなど、他のオプティマイザーを選択することもできる。


ネットワークサイズ:SDXLでは、32サイズのLoRAは200M、16サイズのLoRAは100M、8サイズのLoRAは50M。アニメ風の場合は8サイズを選択する。 

ネットワークAlpha:ネットワークサイズの半分または4分の1の値に設定する。サイズが8の場合、Alphaは4に設定する。


サンプル画像の解像度: SDXLの場合は1024×1024または1024×768を推奨。

画像のアップロード

プリセットを選択したら、好きな画像を最大100枚アップロードします。※異なる顔をアップロードするとLoRAトレーニングできないので、顔は統一してください。

ここでは、漫画『SPY×FAMILY』のヨルさんの画像を9枚アップロードしてあります。データセット名は、「Yolforger」にしました。

下部にある、切り抜き方式は「センター切り抜き」にします。これを選ぶことで、画像の主要な被写体を自動的に切り抜いてくれます。

前はこんな機能なかったのに、進化してる・・・

タグ付けアルゴリズムは、Deepbooruが単語による画像の説明、BLIPが文による画像の説明です。

トリガーワードは、生成される画像の内容や特徴を制御するために入力されるキーワードやフレーズのことを指します。今回もし入力するとしたら、「Yolforger」です。

つまり、トリガーワードは生成したい画像のコンセプトや条件を言語的に指定するための手がかりとなります。モデルはこれらのトリガーワードから画像の内容や特徴を”推測”して生成を行います。

問題なければ、「切り抜き/タグ付け」を押します。

切り抜き/タグ付け後

切り抜き/タグ付けが完了すると、画像のサイズが変更され、右下にマークが付きます。このマークにカーソルを合わせると、タグまたは文による説明が表示されます。先ほど、Deepbooruを選択したので、単語で説明が表示されています。

画像をクリックするとタグの登録・削除が行えます。

すべてが完了したら、トレーニングに移ります。

LoRAトレーニングの開始

右上にある「今すぐトレーニング」のボタンを押せば、開始されます。今回の予想コスト消費は128です。

それでは、レッツゴー♪

ちなみに、LoRAトレーニングのコインが無い人は課金するか、以下のタスクを完了させることでコインをゲットできますよ。

タスク画面

LoRAトレーニング中は、さまざまなサンプル画像が表示されます。

ログビューを開いて損失値をチェックすることもできます。通常、曲線が滑らかで徐々に低下していれば問題ありません。

今回、実際にかかったコストは207でした。予想よりかかり過ぎやろ!!w

「投稿」を押せば、LoRAを公開できます。

LoRAの公開

投稿を押すと以下のような画面になります。

名前、タグ、モデル利用、モデル権限を設定し、「次へ」

バージョンにv1.0と記入し、基本モデルSD1.5、トレーニングで設定したトリガーワード、バージョンの紹介を記入します。

「投稿」を押せば、完了です。

奨励プログラムの参加

最後に、「奨励プログラム」の説明です。

3月4日から新たに「奨励プログラム」が開始されました。これに参加すれば、自分で作成したLoRAが使われる度にポイントが貯まり、その数に応じて収益を得ることができます。

ぜひ、参加してみましょう。

プロフィールの矢印をクリックします。

作品ページに移動するので、上にある「奨励プログラムに参加する」をクリックするだけです。

モデルなどが使用されるたびに、ポイントが貯まっていき、貯まった分は月末に送付されます。

私は3月16日から3月31日までに708ポイント獲得しましたが、0.21ドルの収益が発生していました。日本円にすると31円ほどです。これを少ないととるか、多いととるかはあなた次第です!

収益を受け取るには、口座の登録も忘れずに行いましょう。

作成したLoRAの使い方

作成したLoRAの使い方です。

トレーニングで作成したLoRAを使うには、[創作ページ]にアクセスし、画面右側のLoRAを選択します。

創作ページ

自分のLoRA」から、先ほど作成したLoRAが選べるようになっているはずです。

実際に、LoRAを使って生成した画像です。生成する際は、トリガーワードの入力を忘れないようにしてくださいね。

髪型や目、輪郭などヨルさんっぽさが反映されているのが分かるかと思います。

他人が作成したLoRAを探す方法

SeaArt AIでLoRAを探すにはホームの「モデル」から、フィルタの「LoRA」をクリックすればOKです。

まとめ

本記事では、SeaArt AIによるLoRAの作成方法とその使い方について解説しました。

2024年3月現在、SeaArt AIでのLoRA作成は無料でトレーニングを開始できます。

ただし、スタミナかコインが必要なので、足りない場合はタスクで稼ぐか課金が必須です。

LoRAを利用して、満足いく画像を生成してみましょう。

SeaArtについて、もっと知りたい方はこちらの記事で解説しています。参考:SeaArt(シーアート)の使い方!特徴や機能、安全性は?【画像生成AI】

コメント