🎵 Audio-Anleitung

Audio-Import-Anleitung

So bereiten Sie TTS-Dialogaudio und SFX-Soundeffekte fuer AutoFlowCut vor

🚀 Schnellstart 3 Schritte

Erstellen Sie Audiodateien extern und importieren Sie dann den Audiopaket-Ordner in AutoFlowCut.

1

TTS-Audio aus Ihrem Skript generieren

Verwenden Sie Typecast oder ElevenLabs, um charakterspezifische Dialogstimmen zu generieren. Organisieren Sie die Dateien nach Charakter-Ordnern.

2

SFX-Soundeffekte generieren

Verwenden Sie die ElevenLabs Sound Generation API, um Umgebungsgeraeusche, Schritte, Requisiten und andere Effekte nach Kategorie zu erstellen.

3

Audiopaket in AutoFlowCut importieren

Platzieren Sie alle Audiodateien im media/-Ordner Ihres Projektverzeichnisses. AutoFlowCut erkennt und importiert das Audiopaket automatisch.

💡 Tipp: Audiodateien mit Timecodes im Dateinamen werden automatisch den entsprechenden SRT-Untertitel-Zeitstempeln zugeordnet.

📁 Audiopaket-Struktur

Organisieren Sie Ihre Audiodateien in folgender Verzeichnisstruktur innerhalb Ihres Projektordners:

media/
├── voices/                    # TTS-Dateien pro Charakter
│   ├── narrator/
│   │   ├── narrator_001_0000.mp3
│   │   └── narrator_002_0035.mp3
│   └── scholar/
│       └── scholar_001_0120.mp3
├── sfx/                       # Soundeffekte nach Kategorie
│   ├── 01_props/
│   ├── 02_ambience_wind/
│   ├── 03_breath/
│   ├── 04_footsteps/
│   ├── 05_metal_doors/
│   ├── 06_writing/
│   └── 07_crowd/
└── .audio_review.json         # Ungeeignete Audio-Verfolgung

💡 Hinweis: Der voices/-Ordner enthaelt Unterordner pro Charakter. Der sfx/-Ordner enthaelt kategoriebasierte Unterordner.

🎙️ TTS (Dialogstimme)

Charakterspezifische Dialogaudio, generiert ueber Text-to-Speech-APIs.

Generierungs-API: Typecast

API: https://api.typecast.ai/v1/text-to-speech

Dateibenennungskonvention

{charakter}_{nummer}_{MMSS}.mp3

Beispiele:
  narrator/narrator_001_0000.mp3    # Erzaehler, Zeile 1, bei 00:00
  scholar/scholar_003_0245.mp3      # Gelehrter, Zeile 3, bei 02:45

Der Timecode (MMSS) ermoeglicht die automatische Zuordnung zu SRT-Untertitel-Zeitstempeln.

Emotionsparameter

Emotion Beschreibung
normalStandard
happyFreudig / hell
sadTraurig
angryWuetend / intensiv

🔊 SFX (Soundeffekte)

Umgebungsgeraeusche, Foley und Effekte, generiert durch KI-Soundgenerierung.

Generierungs-API: ElevenLabs

API: https://api.elevenlabs.io/v1/sound-generation

7 SFX-Kategorien

🧮
Requisiten
01_props/ — Objektinteraktionen, Klicks
🌿
Umgebung
02_ambience_*/ — Wind, Regen, Voegel
💨
Atmung
03_breath/ — Atmen, Seufzen
👣
Schritte
04_footsteps/ — Gehen, Laufen
🚪
Metall / Tueren
05_metal_doors/ — Tueren, Schloesser, Aufprall
✍️
Schreiben
06_writing/ — Pinsel, Stiftgeraeusche
👥
Menschenmenge
07_crowd/ — Gemurmel, Geplauder

Dateibenennung

{kategorie}/{beschreibender_name}.mp3

Timecode-SFX (synchronisiert mit bestimmter Szene):
  abacus_beads_dark_01_0015.mp3   # fuer Szene 00:15
  abacus_beads_01_0134.mp3        # fuer Szene 01:34

Timecode-Dateinamen (enden auf _MMSS) werden automatisch den entsprechenden Szenen zugeordnet.

🔍 Audio-Review-System

Markieren Sie ungeeignete Audiodateien ueber die App-Oberflaeche oder Claude Code MCP-Tools. Markierte Dateien werden in .audio_review.json verfolgt.

.audio_review.json Struktur

{
  "media/sfx/02_ambience_wind/wind_howl_01.mp3": {
    "status": "flagged",
    "reason": "Kein Timecode",
    "flaggedAt": "2026-03-16T05:44:55.228Z"
  }
}

MCP-Tools

list_audio_reviews — Markierte Audiodateien anzeigen
update_audio_review — Markierungen hinzufuegen oder entfernen

🎧 Audio-Tab in der App

Nach dem Import bietet der Audio-Tab eine vollstaendige Uebersicht Ihres Audiopakets.

📊 Zusammenfassungsansicht

Stimmenanzahl pro Charakter, SFX-Anzahl pro Kategorie, Gesamtdauer-Aufschluesselung.

⏱️ Zeitleistenansicht

Chronologische Liste mit automatischer Szenenzuordnung ueber Timecodes.

▶️ Wiedergabe

Vorschau jeder Audiodatei direkt in der App mit Inline-Player.

🚩 Markieren & Sortieren

Ungeeignete Audio markieren. Nach Name, Dauer oder Status sortieren.