人間の仕事は撮影だけ?! Claude Code × Remotionで、実写素材から商品紹介動画を自動量産する

公開日:更新日:11分で読めます
Claude CodeRemotion動画自動生成TikTok ShopAI活用

僕らforCreatorsは、TikTok Shop向けの動画を法人相手に月数百本ペースで制作・納品しています。前回の記事では、Claude Codeで制作フロー全体の50〜60%をAI化した話を書きましたが、あの時点で「編集工程はまだ人にやってもらっている」と書いた部分がありました。この記事はその続きで、編集工程の自動化がどこまで進んだかの実況です。

結論から言うと、実写素材が入ったフォルダURLを渡すだけで、商品紹介動画が自動で組み上がるところまで来ました。まず、この2本の動画を見てください。

この2本は、ある商品(あるブランドさんのスマートウォッチ)の映像素材が入ったフォルダURLをClaudeに渡すだけで出来上がった動画の「初稿」です。まだ映像とナレーションが若干合ってなかったり雑音があったりしますが、なかなかいい感じでは?

この記事で分かること

  • 素材フォルダURLを渡すだけで動画が組み上がる仕組みの全体像(台本生成→素材マッチング→TTS→レンダリング)と、1本あたり約$0.17というAPIコストの内訳
  • コードで動画を作る「Remotion」と Claude Code を組み合わせると何が起きるか——意味的な素材選定・設定ファイル自動生成・約750行の制作ルールによる制御
  • 「テンプレート」と「フィードバックループ」という2つの資産化の考え方。修正指示が以降の全動画に効いていく構造

2026年7月追記:この記事の後、レンダリング基盤はRemotionから自社開発のHTMLレンダリング方式へ移行しました。「素材フォルダを渡せば動画が組み上がる」という仕組みの考え方は変わっていません。移行の話はまた別の記事で書きます。

実際の流れ:指示出しから動画完成まで

指示出しから動画書き出しまでの一連の流れを早送りで録画しました。 テキストで補足すると、こんな流れです。

  1. Claude Codeに指示出し:「このURLから動画2本作って」
  2. 台本生成・素材スキャン:台本を生成し、素材フォルダの中身をスキャンして各カットに最適な映像を自動マッチング
  3. TTS(音声読み上げ)生成:ナレーションのテキストを音声ファイルに変換
  4. Remotion Studioでレビュー:ブラウザ上で動画のプレビューを確認。ここで人間が目視チェック
  5. レンダリング:OKであれば最終的なmp4を書き出し

渡した内容は、チームスタッフが撮影した実写素材が入ったフォルダーと、商品情報のみ。AI生成映像は一切ありません。素材フォルダの中から、商品情報のリサーチ、台本作り、どのカットにどの映像を使うかをシステムが判断して、テロップ・ナレーション音声・BGM・効果音・トランジションまで全部乗せて、動画として書き出しています。

しかも、1本あたりの制作費用(Claude Codeのサブスクリプション費用を除くAPI)は合計:約 $0.17(約25円)

  • 台本生成 ─ Claude API (Sonnet) ─ 約$0.04
  • 素材マッチング ─ Claude API (Sonnet) ─ 約$0.07
  • 設定ファイル生成 ─ Claude API (Sonnet) ─ 約$0.03
  • ナレーション音声 ─ Fish Audio ─ 約$0.01
  • 素材スキャン ─ Gemini API ─ 約$0.02
  • 動画レンダリング ─ Remotion(ローカル実行) ─ $0

1本あたり約20セント。日本円で約25円です。もちろんClaudeのサブスクリプション費用は別途かかりますが、純粋にAPIが走る部分だけで見ると、このコストで1本の動画が組み上がります。

僕らが注力して作っているのは、TikTok Shopで商品が売れるための動画。これを法人相手に月に数百本のペースで制作・納品をしています。

「素材フォルダを渡したら、その商品の紹介動画が自然な形で量産される」――この仕組みが安定したら、制作能力を10,000倍にした上で、ブランドさんや自社商品の販促にも活用できる...!

もし「実写」動画制作の自動化・量産の仕組みづくりに興味がある方がいれば、ぜひ記事の最後まで読んでみてください。

Remotionって何?

Remotionの概念図

ここからは少し技術的な話になりますが、できるだけ平易に書きます。

Remotion(リモーション)は、Reactというプログラミング言語のフレームワークを使って動画を作るツールです。

普通、動画編集といえばPremiere ProやCapCutのようなソフトを使いますよね。タイムラインに素材を並べて、エフェクトをかけて、書き出す。

Remotionは全く違うアプローチで、動画の中身をコードで記述します。「0秒から3秒はこの映像を表示」「テロップはこのフォントでこの位置に出す」「BGMの音量はここで下げる」――こういった指示を「プログラム」として書くことで、動画が生成されます。

「なんでわざわざコードで?」と思いますよね。ここがポイントです。

コードで書くということは、設定ファイル(JSON)を差し替えるだけで、違う動画が自動で出来上がるということです。素材・テロップ・ナレーションの情報が入ったJSONを渡せば、それに応じた動画が出てくる。まさに動画の量産に向いた仕組みなんです。

Remotion × Claude Code の組み合わせで何が起きるか

Remotionは「JSONを渡せば動画が出てくる」仕組みですが、そのJSONを人間が手で書くのは相当しんどいです。1本の動画に10〜15カットあって、それぞれのカットに「どの素材を何秒使うか」「テロップは何を何秒ごとに切り替えるか」「モーションはzoom-inかken-burnsか」「効果音はどのタイミングで入れるか」を全部指定する必要があります。

ここにClaude Codeが組み合わさると、一気に実用的になります。

1. 台本を「意味的に」理解して素材を選ぶ

台本に「画面が自由に変えられる」と書いてあったとします。素材フォルダの中には、ファイル名が footage_012.mp4 みたいな番号だけの動画が何十本もある。人間なら1本ずつ再生して「あ、これが画面を動かしてる映像だ」と判断しますよね。

Claude Codeは、事前にスキャンした素材の説明データをもとに、ナレーションの意味と素材の内容を照合して、最適なものを選んできます。キーワードの一致ではなく、意味の近さで判断しているので、ファイル名に"画面"と書いてなくても、画面を操作している映像をちゃんと選びます。

2. 人間が書くと面倒な設定ファイルを自動生成する

1カットごとに「素材ファイル・開始秒・終了秒・モーション・トランジション・テロップ文言・テロップの切り替えタイミング・フォント・色・位置・効果音・音量」を指定するJSONファイルを、Claude Codeが自動で生成します。

10カットの動画なら、ざっくり200〜300行のJSONになります。これを手で書くのは現実的ではないですが、Claude Codeならナレーション音声の長さに合わせてフレーム数を計算し、テロップを2〜3秒ごとに分割し、カット間のトランジションを設定し、一発で生成してくれます。

3. 効果音やテンポを「ルール」に従って入れる

ここが一番面白くて難しい部分かもしれません。人間の感性を言語化してルールに落とすってめちゃめちゃ難しいんですよね...

Claude Codeには、動画制作のルールを大量に読み込ませています。「こういうときはこうする」という判断基準をルールとして与えておくと、毎回の動画生成でそのルールに従って判断してくれます。

ルールで動画を制御する

僕らのシステムでは、TikTok Shopの動画制作に特化したルールを約750行、自分たちで定義してClaude Codeに読み込ませています。

これは「プロンプト」のような曖昧なものではなく、かなり具体的な制作ガイドラインです。一部を紹介します。

<カット・テンポのルール>

  • ワンカット・ワンセンテンス(1カットには1文のみ)
  • 1カット2〜3秒が基本テンポ
  • 1文に2つの意味が含まれる場合はカットを分割する ・NG:「簡単に充電できるし、軽いから持ち運びも簡単」→ 1カットに2つの訴求 ・OK:「簡単に充電できるし、」(カット1) /「軽いから持ち運びも簡単」(カット2)
  • 同じ映像素材は最大5秒まで。超えたら必ず別素材に切り替え

<テロップのルール>

  • 切り替え頻度:2〜3秒に1回(テロップ出っぱなしは離脱の原因)
  • 1テロップ最大2行、1行15文字以内(理想は10〜12文字)
  • 句読点は使わない(改行で代用)
  • ナレーション文を文節で分割してテロップ化する 例:「LEDライト付きの化粧ポーチなんだけど、いつもメイクするとき、蛍光灯暗かったり鏡から遠かったりで全然安定しなかったのが」 → テロップ1:「LEDライト付きの / 化粧ポーチなんだけど」(2秒) → テロップ2:「いつもメイクするとき」(2秒) → テロップ3:「蛍光灯暗かったり / 鏡から遠かったりで」(2秒) → テロップ4:「全然安定しなかったのが」(2秒)

<映像切り替えのルール>

  • 映像はナレーションの句読点の位置でのみ切り替える
  • 単語の途中・文節の途中での切り替えは絶対禁止
  • TTS音声には句読点の位置で自動的に息継ぎ(無音)を挿入する 「。」→ 200ms /「、」→ 130ms /「!」→ 180ms

<音響のルール>

  • BGM音量は0.20〜0.30(ナレーション音量2.2に対する比率)
  • ナレーションは基本1.3倍速でTTS生成(テンポよくポンポン進む感じ)
  • SE(効果音)は使いすぎない。ナレーションをかき消さない
  • カット切り替え時の軽いSEは効果的

これに加えて、Remotionの技術的な使い方(トランジション、モーション、音声制御など)もClaude Codeが参照できるようにしています。

つまり、「TikTokで伸びる動画のルール」と「Remotionでそれを実装する方法」の両方を持った状態で、Claude Codeが動画を組み上げてくれます。

テンプレートという概念

冒頭の2本の動画が同じ素材フォルダから作れた理由は、テンプレートにあります。

テンプレートの概念図

テンプレートが定義するのは「スタイル」だけです。シーン数、各シーンの尺、テロップのフォントや色、モーションの種類、BGMのムード。テンプレートが定義しないのは、実際の素材・ナレーション文言・商品情報。

つまり、テンプレートを1つ作れば、違う商品でも同じスタイルの動画を量産できます。逆に、同じ商品でも違うテンプレートを適用すれば、違うテイストの動画が出てくる。冒頭の2本はまさにこれです。

現状はまだ単調なスタイルのテンプレートが中心ですが、特定のTikTokerの動画スタイルを分析してテンプレート化することもできます。一度テンプレートを固めてしまえば、そのスタイルで大量の動画が作れる。テンプレートの精度とバリエーションが、そのまま会社の資産になっていくと考えています。

フィードバックループで精度を上げていく

冒頭の動画を見ていただいた通り、正直なところ、まだ一発では、センスのある編集者が手で作るTikTok動画にはまだ及びません。

ただ、この仕組みの面白いところは、検証を重ねてフィードバックループが回れば回るほど精度が上がるということです。

「このテンポだとフックが弱い」「このSEのタイミングは遅い」――こうしたフィードバックを1つずつルールに反映していくと、次に生成する動画からはそのフィードバックが自動で適用されます。1本の動画への修正指示が、以降の全ての動画に効く。人間の編集者だと属人的になりがちな「学び」が、仕組みとして蓄積されていきます。

完成した動画は「動画チェックスキル」という別の仕組みに通して、フック・構成・テンポ・CTAの観点でフィードバックをもらい、修正→再生成のサイクルを回しています。

この仕組みでできること

ここまでは自社の制作フローを中心にお伝えしましたが、この仕組みは外部の方にも活用いただけると考えています。

たとえば、「こういう動画を量産したい」というイメージがあれば、それに合わせたテンプレートを構築することが可能です。一度テンプレートが固まれば、素材を差し替えるだけで同じスタイルの動画が量産できます。

将来的に目指しているのは、ブランドさんが商品の素材フォルダを渡すだけで、その商品の紹介動画が自然な形で量産されるという世界観です。アフィリエイト向けの素材提供に近い形で、大量のバリエーションの動画が効率的に作れるようになる。

今はまだ検証段階ですが、仕組みの土台は出来てきました。

最後に

「実写素材をAIが編集して動画にする」。言葉にすると簡単ですが、意味を理解して素材を選び、TikTokの文法に沿ったテンポで組み上げるところまで持っていくのは、ルールの積み上げとテンプレートの設計が必要でした。

完璧ではありません。でも、同じ素材フォルダから複数本の動画が自動で組み上がるところまでは来ました。

以下に興味がある方は、お気軽にご連絡ください。

  • TikTok Shopの動画制作・運用
  • 動画制作の自動化・量産の仕組みづくり
  • Remotion × Claude Codeの活用

ハリー / forCreators Pte. Ltd. 代表 X: @imharry_so


この記事のオリジナルはnoteで公開しています(初出:2026年3月31日 / 会社ブログ向け再構成:2026年7月3日)。

AI活用・クリエイティブ制作の相談はこちら

記事の内容の実践サポートも含めて、まずは気軽に。返答は1営業日以内です。

相談する →

関連記事