さとまたwiki

AI動画生成ツール比較

クラウド&ローカル - 用途に合わせた最適なツールを選ぶ

🖥️

ローカルAI環境(RTX 4070 Super対応)

12GB VRAM搭載のGPUなら、以下のオープンソースツールをローカルで動かせます。 クラウドサービスと違い、月額費用なし・データプライバシー確保・カスタマイズ自由!

ローカルで動かせるAIツール 無料・OSS

ComfyUI

無料・オープンソース

ノードベースのAI動画・画像生成プラットフォーム。全てのローカルAIモデルの中心ハブ。

対応モデル: Wan2.2, Hunyuan, LTX, AnimateDiff
VRAM: 8GB〜(モデルによる)
公式: comfy.org
必須ツール ワークフロー共有可

Wan 2.2 / Wan2GP

Apache 2.0

Alibabaの最新動画生成モデル。1.3Bモデルは8GB VRAMで動作。14BモデルはGGUF量子化で12GB対応。

1.3Bモデル: 8GB VRAM、480p生成
14B GGUF: 12GB VRAM、720p生成
Text-to-Video Image-to-Video 商用利用可

LTX-Video

Lightricks

軽量・高速な動画生成モデル。768x512で準リアルタイム生成。プロトタイピングに最適。

VRAM: 12GB〜(768x512解像度)
高速生成 低VRAM向け

CogVideoX

清華大学

6秒動画を720x480で生成。2BモデルはGTX 1080Tiでも動作可能。

安定品質

AnimateDiff + ControlNet

8GB VRAM〜

Stable Diffusionベースの動画生成。既存のチェックポイント・LoRAを活用可能。 AnimateDiff-Lightningなら8GB VRAMで動作。

SD互換 超低VRAM

画像から動画を動かす(Image-to-Video)CM制作に最適

商品写真や静止画を動画化する技術。 CM制作では商品画像からダイナミックな映像を生成できます。

MimicMotion(Tencent)

ICML 2025採択

人物画像に自然な動きを付与。ダンス動画やプレゼンテーション動画の生成に最適。 16GB VRAM推奨(4060 Tiで動作確認済み)。

VRAM: 16GB推奨(12GB可)
ポーズ制御 人物アニメーション ComfyUI対応

LivePortrait(Kuaishou/Kling)

Windows版あり

静止画の顔を動かす。表情・視線の制御が可能。Windowsワンクリックインストーラーあり。 Kuaishou、Douyin、JianyingなどのメジャープラットフォームでKlingの一部として採用。

対応: 人物、猫、犬
顔アニメーション 簡単導入

Hallo2

ICLR 2025採択

音声駆動のポートレートアニメーション。4K解像度、1時間超の長尺動画生成に対応。 テキストプロンプトで表情制御も可能。

音声駆動 4K対応 長尺生成

MuseV / MusePose / MuseTalk

Tencent TMElyralab

バーチャルヒューマン生成の統合フレームワーク。MuseTalkはリアルタイムリップシンク。

リップシンク Dockerあり

DynamiCrafter

Tencent AI Lab

静止画像に自然な動きを追加。髪のなびき、水の流れなど微細な動きが得意。16GB VRAM推奨。

自然な動き

HeyGem(HeyGen代替)

完全オフライン

HeyGenのオープンソース代替。完全オフラインでデジタルアバター生成。 1枚の写真からAIアバターを30秒で生成。英語、日本語、韓国語、中国語等8言語対応。

HeyGen代替 完全無料 日本語対応

商品撮影・ライティングAI

IC-Light(ControlNet作者)

ComfyUI対応

商品写真のライティングをAIで変更。「窓からの日光」「ネオンライト」などテキストで指定可能。 Magnific.AIのRelight機能の代替として使える。

用途: 商品写真リライティング
商品撮影 ライティング

クラウドツール比較(参考)

ツール強み解像度商用利用価格帯
Sora 2フォトリアリズム、映画品質4KPro以上$20-200/月
Kling AIモーション品質No.11080pPro以上$10-50/月
Runway Gen-4カメラ制御、一貫性4KPro以上$15-95/月
Pika 2.5コスパ、使いやすさ1080p有料プラン$10-60/月

ローカルとクラウドの使い分け: プロトタイピングや大量生成はローカル、最終納品品質はクラウドという組み合わせがコスパ最強。

VRAM要件まとめ(RTX 4070 Super = 12GB)

VRAM動作可能なモデル
8GBAnimateDiff-Lightning, Wan 1.3B, CogVideoX-2B
12GB(RTX 4070)LTX-Video, Wan 14B (GGUF), LivePortrait, IC-Light
16GBMimicMotion, DynamiCrafter, Hallo2, SVD
24GBHunyuan Video, Wan 14B (FP16), 全モデルフル性能

RTX 4070 Superでの推奨設定

  • GGUF量子化モデルを使用(Q8, Q6_K等)
  • モデルオフロードを有効化(VRAM→RAM)
  • ・ 他のGPUアプリを閉じて専念
  • ・ システムRAMは32GB以上推奨

この記事はClaude Opus 4.6によって作成されました