🎵 オーディオガイド

オーディオインポートガイド

AutoFlowCut用のTTSダイアログ音声とSFX効果音の準備方法

🚀 クイックスタート 3ステップ

外部でオーディオファイルを生成し、オーディオパッケージフォルダをAutoFlowCutにインポートします。

1

スクリプトからTTS音声を生成

TypecastまたはElevenLabsを使用して、キャラクターごとのダイアログ音声を生成します。キャラクターフォルダに整理してください。

2

SFX効果音を生成

ElevenLabs Sound Generation APIで環境音、足音、小道具の音などをカテゴリ別に生成します。

3

AutoFlowCutでオーディオパッケージをインポート

プロジェクトディレクトリのmedia/フォルダにすべてのオーディオファイルを配置します。AutoFlowCutが自動的にオーディオパッケージを検出してインポートします。

💡 ヒント: ファイル名にタイムコードが含まれるオーディオファイルは、対応するSRT字幕タイムスタンプに自動マッチングされます。

📁 オーディオパッケージ構造

プロジェクトフォルダ内で以下のディレクトリ構造でオーディオファイルを整理してください:

media/
├── voices/                    # キャラクター別TTSファイル
│   ├── narrator/
│   │   ├── narrator_001_0000.mp3
│   │   └── narrator_002_0035.mp3
│   └── scholar/
│       └── scholar_001_0120.mp3
├── sfx/                       # カテゴリ別効果音
│   ├── 01_props/
│   ├── 02_ambience_wind/
│   ├── 03_breath/
│   ├── 04_footsteps/
│   ├── 05_metal_doors/
│   ├── 06_writing/
│   └── 07_crowd/
└── .audio_review.json         # 不適切オーディオの追跡

💡 注意: voices/フォルダにはキャラクター別サブフォルダが、sfx/フォルダにはカテゴリ別サブフォルダが入ります。

🎙️ TTS(ダイアログ音声)

Text-to-Speech APIで生成するキャラクター別ダイアログ音声です。

生成API: Typecast

API: https://api.typecast.ai/v1/text-to-speech

ファイル命名規則

{character}_{number}_{MMSS}.mp3

例:
  narrator/narrator_001_0000.mp3    # ナレーター、1行目、00:00
  scholar/scholar_003_0245.mp3      # 学者、3行目、02:45

タイムコード(MMSS)により、SRT字幕タイムスタンプと自動マッチングされます。

感情パラメータ

感情 説明
normalデフォルト
happy明るい / 嬉しい
sad悲しい
angry怒り / 激しい

🔊 SFX(効果音)

AIサウンド生成による環境音、フォーリー、効果音です。

生成API: ElevenLabs

API: https://api.elevenlabs.io/v1/sound-generation

7つのSFXカテゴリ

🧮
小道具
01_props/ — 物体操作、クリック
🌿
環境音
02_ambience_*/ — 風、雨、鳥
💨
呼吸
03_breath/ — 息遣い、ため息
👣
足音
04_footsteps/ — 歩行、走行
🚪
金属 / ドア
05_metal_doors/ — ドア、錠前、衝撃
✍️
筆記
06_writing/ — 筆、ペンの音
👥
群衆
07_crowd/ — ざわめき、話し声

ファイル命名規則

{category}/{descriptive_name}.mp3

タイムコード付きSFX(特定シーンに同期):
  abacus_beads_dark_01_0015.mp3   # 00:15のシーン用
  abacus_beads_01_0134.mp3        # 01:34のシーン用

タイムコードファイル名(_MMSSで終わる)は対応するシーンに自動マッチングされます。

🔍 オーディオレビューシステム

アプリUIまたはClaude Code MCPツールで不適切なオーディオファイルにフラグを付けます。フラグされたファイルは.audio_review.jsonで追跡されます。

.audio_review.json 構造

{
  "media/sfx/02_ambience_wind/wind_howl_01.mp3": {
    "status": "flagged",
    "reason": "タイムコードなし",
    "flaggedAt": "2026-03-16T05:44:55.228Z"
  }
}

MCPツール

list_audio_reviews — フラグ付きオーディオ一覧の表示
update_audio_review — フラグの追加・解除

🎧 アプリ内オーディオタブ

インポート後、オーディオタブでオーディオパッケージの全体概要を確認できます。

📊 サマリービュー

キャラクター別音声数、カテゴリ別SFX数、合計再生時間の分析。

⏱️ タイムラインビュー

タイムコードによる自動シーンマッチングと時系列表示。

▶️ 再生

インラインプレーヤーでアプリ内から直接オーディオファイルをプレビュー。

🚩 フラグとソート

不適切なオーディオにフラグ。名前、再生時間、ステータスでソート。