オーディオインポートガイド
AutoFlowCut用のTTSダイアログ音声とSFX効果音の準備方法
🚀 クイックスタート 3ステップ
外部でオーディオファイルを生成し、オーディオパッケージフォルダをAutoFlowCutにインポートします。
スクリプトからTTS音声を生成
TypecastまたはElevenLabsを使用して、キャラクターごとのダイアログ音声を生成します。キャラクターフォルダに整理してください。
SFX効果音を生成
ElevenLabs Sound Generation APIで環境音、足音、小道具の音などをカテゴリ別に生成します。
AutoFlowCutでオーディオパッケージをインポート
プロジェクトディレクトリのmedia/フォルダにすべてのオーディオファイルを配置します。AutoFlowCutが自動的にオーディオパッケージを検出してインポートします。
💡 ヒント: ファイル名にタイムコードが含まれるオーディオファイルは、対応するSRT字幕タイムスタンプに自動マッチングされます。
📁 オーディオパッケージ構造
プロジェクトフォルダ内で以下のディレクトリ構造でオーディオファイルを整理してください:
media/ ├── voices/ # キャラクター別TTSファイル │ ├── narrator/ │ │ ├── narrator_001_0000.mp3 │ │ └── narrator_002_0035.mp3 │ └── scholar/ │ └── scholar_001_0120.mp3 ├── sfx/ # カテゴリ別効果音 │ ├── 01_props/ │ ├── 02_ambience_wind/ │ ├── 03_breath/ │ ├── 04_footsteps/ │ ├── 05_metal_doors/ │ ├── 06_writing/ │ └── 07_crowd/ └── .audio_review.json # 不適切オーディオの追跡
💡 注意: voices/フォルダにはキャラクター別サブフォルダが、sfx/フォルダにはカテゴリ別サブフォルダが入ります。
🎙️ TTS(ダイアログ音声)
Text-to-Speech APIで生成するキャラクター別ダイアログ音声です。
生成API: Typecast
API: https://api.typecast.ai/v1/text-to-speech
ファイル命名規則
{character}_{number}_{MMSS}.mp3
例:
narrator/narrator_001_0000.mp3 # ナレーター、1行目、00:00
scholar/scholar_003_0245.mp3 # 学者、3行目、02:45
タイムコード(MMSS)により、SRT字幕タイムスタンプと自動マッチングされます。
感情パラメータ
| 感情 | 説明 |
|---|---|
normal | デフォルト |
happy | 明るい / 嬉しい |
sad | 悲しい |
angry | 怒り / 激しい |
🔊 SFX(効果音)
AIサウンド生成による環境音、フォーリー、効果音です。
生成API: ElevenLabs
API: https://api.elevenlabs.io/v1/sound-generation
7つのSFXカテゴリ
01_props/ — 物体操作、クリック02_ambience_*/ — 風、雨、鳥03_breath/ — 息遣い、ため息04_footsteps/ — 歩行、走行05_metal_doors/ — ドア、錠前、衝撃06_writing/ — 筆、ペンの音07_crowd/ — ざわめき、話し声ファイル命名規則
{category}/{descriptive_name}.mp3
タイムコード付きSFX(特定シーンに同期):
abacus_beads_dark_01_0015.mp3 # 00:15のシーン用
abacus_beads_01_0134.mp3 # 01:34のシーン用
タイムコードファイル名(_MMSSで終わる)は対応するシーンに自動マッチングされます。
🔍 オーディオレビューシステム
アプリUIまたはClaude Code MCPツールで不適切なオーディオファイルにフラグを付けます。フラグされたファイルは.audio_review.jsonで追跡されます。
.audio_review.json 構造
{
"media/sfx/02_ambience_wind/wind_howl_01.mp3": {
"status": "flagged",
"reason": "タイムコードなし",
"flaggedAt": "2026-03-16T05:44:55.228Z"
}
}
MCPツール
list_audio_reviews
— フラグ付きオーディオ一覧の表示
update_audio_review
— フラグの追加・解除
🎧 アプリ内オーディオタブ
インポート後、オーディオタブでオーディオパッケージの全体概要を確認できます。
キャラクター別音声数、カテゴリ別SFX数、合計再生時間の分析。
タイムコードによる自動シーンマッチングと時系列表示。
インラインプレーヤーでアプリ内から直接オーディオファイルをプレビュー。
不適切なオーディオにフラグ。名前、再生時間、ステータスでソート。