【簡単】SeaArt AIでLoRAを作成する方法を解説！

画像生成をしていると思ったような仕上がりにならないことはありませんか？そんな時に活躍するのが、LoRAです。

LoRAを使用すれば、プロンプトが分からなくても雰囲気に近い画像を生成してくれます。

本記事を読むことで、LoRAの特徴、SeaArt AIでのLoRAの作り方がわかります。

2024年1月2日のアップデートによりVIP制限が解除され、SVIP（有料会員）でない方も自由に利用できるようになりました！

LoRAとは

LoRA（ローラ）は”Low-Rank-Adaptation”の略で、少ない計算量で追加学習可能なモデルのことです。

大規模言語モデルによる画像生成を効率的にするためのツールで、さまざまな種類のLoRAが存在しています。

モデルとLoRAの違い

初心者の方はモデルとLoRAの違いに戸惑うことが多いと思います。

モデルは基本的な画風を決定し、生成する画像の大まかなスタイルを定めます。

一方、LoRAはモデルに追加効果を加えるものと考えていただくと理解しやすいでしょう。

LoRAの種類

ここでは、4種類の代表的なLoRAを紹介します。

画風LoRA
服装LoRA
背景LoRA
ポーズLoRA

画風LoRA

線画

https://civitai.com/models/234137/zgxmmn10ganshiba

水彩画

https://civitai.com/models/37680/architecture-watercolor-style

ジグソーパズル画

服装LoRA

浴衣

https://civitai.com/models/207634/a-simple-kimonoyukata

メイド服

メイドコスチューム — https://civitai.com/models/215772/rc-s5

学生服

背景LoRA

コンビニ背景

学校の教室の背景

旅館の背景

ポーズLoRA

あぐらをかくポーズ

あぐらのポーズ — https://civitai.com/models/226062/butterfly-sitting

片足で立つポーズ

片足ポーズ — https://civitai.com/models/202165/standing-on-one-legleg-up

ジャンプしているポーズ

ジャンプポーズ — https://civitai.com/models/147583/fly-jump

SeaArt AIでLoRAを作成する方法

先ほどはLoRAの種類を紹介しましたが、実際にLoRAを作ってみたいと思った方はSeaArt AIで簡単に作成できます。

SeaArt AIでのLoRAの作成方法は次のとおりです。

データセット作成
パラメータ設定
画像のアップロード（最大200枚）
LoRAトレーニング開始
LoRAの公開
奨励プログラムの参加（任意）

トレーニングへのアクセスとデータセット作成

上部にあるトレーニングへアクセスします。

次に、「データセット作成」をクリックします

パラメータ設定

プリセットが用意されているので、以下のなかから自由に選択しましょう。

基本的なパラメータが反映されます。

Pony Diffusion、FLUX.1、Stable Diffusion 3.5 Medium (SD3.5M)、Stable Diffusion 3.5 Large (SD3.5L) について、それぞれの特徴を紹介します。

1. Pony Diffusion

コミュニティ主導（特にCivitaiで人気）。元々はアニメ「My Little Pony」に特化したモデルとしてスタートしましたが、現在はアニメやイラスト全般に対応しています。ベースモデルは、Stable Diffusion XL (SDXL)を基盤とした派生モデルです。独自のスコアタグシステム（score_9, score_8_up）などを使用し、品質を制御します。

2. FLUX.1

Black Forest Labsが設立したサービスです（Stable Diffusionのオリジナル開発者）。Stable Diffusionの後継として設計された次世代モデルで、最大2メガピクセルの高解像度の画像生成が可能です。アニメから実写まで幅広いスタイルに対応します。

3. Stable Diffusion 3.5 Medium (SD3.5M)

Stability AIが開発した新しいモデルで、パラメータ数は26億。リリース日は、2024年10月29日です。SD3シリーズの軽量モデルで、プロンプト追従性はFLUX.1に勝るが、美的品質ではやや劣ります。プロンプトの曖昧さによる出力のバラつきが大きいのが難点です（意図的な設計）。

4. Stable Diffusion 3.5 Large (SD3.5L)

SD3シリーズの上位モデルで、パラメータ数は80億。アニメ、実写、アートなど多様なスタイルに対応します。プロンプトへの忠実度が高く、複雑なシーンや詳細な描写を正確に生成できます。

私なら、今流行りの Pony Diffusion か FLUX.1 で作成したいですね♪

高級設定

高級設定では、個別にパラメータ設定ができるようになっています。いくつか紹介します。

U-Net学習率：学習率が高いほど速度が速くなるが、品質が落ちる可能性がある。一方、学習率が低すぎると、生成画像が理想的でなく、学習が遅くなる。推奨値は0.0001。
サンプル画像の解像度：解像度が高いほど、必要な時間が長くなる。推奨値は512*512。
テキストエンコーダー学習率：テキストの学習で、タグの感度が高くなる。
オプティマイザー：AdamWがよく使われる。
ネットワークサイズ：値が大きいほど、画像の精度が高く保たれるが、時間がかかる。解像度の高い画像には大きなネットワーク次元が必要で、通常128が選択される。(アニメなら32、キャラクターなら32-128、風景や物体なら128)
ネットワークAlpha：ネットワークサイズを超えないよう注意し、1から128の間の値を設定する。

とりあえず、わからなければ無理に触る必要はないです。

ネットワークモジュール

続いては、ネットワークモジュールについてです。

そもそもネットワークモジュールは、画像生成AIに「新しいスキルを少しだけ教える」ための小さな道具です。大きなAIモデル全体をいじるのは大変なので、特定の絵柄やキャラを覚えさせるために、軽い「追加パーツ」を使います。これがLoRA、DoRA、LyCORISです。

1. LoRA (Low-Rank Adaptation)

LoRAは、一番簡単で軽いモデルです。AIに「このキャラや絵柄をちょっと覚えて！」と教えるのに使います。ファイルが小さいので、学習も生成もサクサクですが、超複雑な絵柄や細かいディテールは苦手です。

2. DoRA (Weight-Decomposed Low-Rank Adaptation)

DoRAは、LoRAの進化版です。LoRAより丁寧に書かれていて、もっと本格的な絵柄やスタイルをAIに教えられます。ただし、学習するのに時間がかかります。LoRAより絵のクオリティが高いので、芸術や実写風の絵柄に向いています。

3. LyCORIS

LyCORISは、LoRAをベースに作られたやつです。超細かいキャラの服、アニメの背景、独特な絵柄の再現が得意です。細かい部分までこだわったモデルを作りたいときに便利です。

モジュール	使いやすさ	絵のキレイさ	どんな絵にいい？
LoRA	★★★★★	★★★	キャラ、簡単な絵柄
DoRA	★★★★	★★★★	芸術、細かいスタイル
LyCORIS	★★★	★★★★★	超細かい絵、背景