🎵 オーディオガイド

オーディオインポートガイド

AutoFlowCut用のTTSダイアログ音声とSFX効果音の準備方法

🚀 クイックスタート 3ステップ

外部でオーディオファイルを生成し、オーディオパッケージフォルダをAutoFlowCutにインポートします。

スクリプトからTTS音声を生成

TypecastまたはElevenLabsを使用して、キャラクターごとのダイアログ音声を生成します。キャラクターフォルダに整理してください。

SFX効果音を生成

ElevenLabs Sound Generation APIで環境音、足音、小道具の音などをカテゴリ別に生成します。

AutoFlowCutでオーディオパッケージをインポート

プロジェクトディレクトリのmedia/フォルダにすべてのオーディオファイルを配置します。AutoFlowCutが自動的にオーディオパッケージを検出してインポートします。

💡 ヒント: ファイル名にタイムコードが含まれるオーディオファイルは、対応するSRT字幕タイムスタンプに自動マッチングされます。

📁 オーディオパッケージ構造

プロジェクトフォルダ内で以下のディレクトリ構造でオーディオファイルを整理してください：

media/
├── voices/                    # キャラクター別TTSファイル
│   ├── narrator/
│   │   ├── narrator_001_0000.mp3
│   │   └── narrator_002_0035.mp3
│   └── scholar/
│       └── scholar_001_0120.mp3
├── sfx/                       # カテゴリ別効果音
│   ├── 01_props/
│   ├── 02_ambience_wind/
│   ├── 03_breath/
│   ├── 04_footsteps/
│   ├── 05_metal_doors/
│   ├── 06_writing/
│   └── 07_crowd/
└── .audio_review.json         # 不適切オーディオの追跡

💡 注意: voices/フォルダにはキャラクター別サブフォルダが、sfx/フォルダにはカテゴリ別サブフォルダが入ります。

🎙️ TTS（ダイアログ音声）

Text-to-Speech APIで生成するキャラクター別ダイアログ音声です。

生成API: Typecast

API: https://api.typecast.ai/v1/text-to-speech

ファイル命名規則

{character}_{number}_{MMSS}.mp3

例：
  narrator/narrator_001_0000.mp3    # ナレーター、1行目、00:00
  scholar/scholar_003_0245.mp3      # 学者、3行目、02:45

タイムコード（MMSS）により、SRT字幕タイムスタンプと自動マッチングされます。

感情パラメータ

感情	説明
`normal`	デフォルト
`happy`	明るい / 嬉しい
`sad`	悲しい
`angry`	怒り / 激しい

🔊 SFX（効果音）

AIサウンド生成による環境音、フォーリー、効果音です。

生成API: ElevenLabs

API: https://api.elevenlabs.io/v1/sound-generation

7つのSFXカテゴリ

🧮

小道具

01_props/ — 物体操作、クリック

🌿

環境音

02_ambience_*/ — 風、雨、鳥

💨

呼吸

03_breath/ — 息遣い、ため息

👣

足音

04_footsteps/ — 歩行、走行

🚪

金属 / ドア

05_metal_doors/ — ドア、錠前、衝撃

✍️

筆記

06_writing/ — 筆、ペンの音

👥

群衆

07_crowd/ — ざわめき、話し声

ファイル命名規則

{category}/{descriptive_name}.mp3

タイムコード付きSFX（特定シーンに同期）：
  abacus_beads_dark_01_0015.mp3   # 00:15のシーン用
  abacus_beads_01_0134.mp3        # 01:34のシーン用

タイムコードファイル名（_MMSSで終わる）は対応するシーンに自動マッチングされます。

🔍 オーディオレビューシステム

アプリUIまたはClaude Code MCPツールで不適切なオーディオファイルにフラグを付けます。フラグされたファイルは.audio_review.jsonで追跡されます。

`.audio_review.json` 構造

{
  "media/sfx/02_ambience_wind/wind_howl_01.mp3": {
    "status": "flagged",
    "reason": "タイムコードなし",
    "flaggedAt": "2026-03-16T05:44:55.228Z"
  }
}

MCPツール

list_audio_reviews — フラグ付きオーディオ一覧の表示

update_audio_review — フラグの追加・解除

🎧 アプリ内オーディオタブ

インポート後、オーディオタブでオーディオパッケージの全体概要を確認できます。

📊 サマリービュー

キャラクター別音声数、カテゴリ別SFX数、合計再生時間の分析。

⏱️ タイムラインビュー

タイムコードによる自動シーンマッチングと時系列表示。

▶️ 再生

インラインプレーヤーでアプリ内から直接オーディオファイルをプレビュー。

🚩 フラグとソート

不適切なオーディオにフラグ。名前、再生時間、ステータスでソート。

AutoFlowCutに戻る

オーディオインポートガイド

🚀 クイックスタート 3ステップ

📁 オーディオパッケージ構造

🎙️ TTS（ダイアログ音声）

生成API: Typecast

ファイル命名規則

感情パラメータ

🔊 SFX（効果音）

生成API: ElevenLabs

7つのSFXカテゴリ

ファイル命名規則

🔍 オーディオレビューシステム

.audio_review.json 構造

MCPツール

🎧 アプリ内オーディオタブ

📚 関連ガイド

`.audio_review.json` 構造