Audio-Import-Anleitung
So bereiten Sie TTS-Dialogaudio und SFX-Soundeffekte fuer AutoFlowCut vor
🚀 Schnellstart 3 Schritte
Erstellen Sie Audiodateien extern und importieren Sie dann den Audiopaket-Ordner in AutoFlowCut.
TTS-Audio aus Ihrem Skript generieren
Verwenden Sie Typecast oder ElevenLabs, um charakterspezifische Dialogstimmen zu generieren. Organisieren Sie die Dateien nach Charakter-Ordnern.
SFX-Soundeffekte generieren
Verwenden Sie die ElevenLabs Sound Generation API, um Umgebungsgeraeusche, Schritte, Requisiten und andere Effekte nach Kategorie zu erstellen.
Audiopaket in AutoFlowCut importieren
Platzieren Sie alle Audiodateien im media/-Ordner Ihres Projektverzeichnisses. AutoFlowCut erkennt und importiert das Audiopaket automatisch.
💡 Tipp: Audiodateien mit Timecodes im Dateinamen werden automatisch den entsprechenden SRT-Untertitel-Zeitstempeln zugeordnet.
📁 Audiopaket-Struktur
Organisieren Sie Ihre Audiodateien in folgender Verzeichnisstruktur innerhalb Ihres Projektordners:
media/ ├── voices/ # TTS-Dateien pro Charakter │ ├── narrator/ │ │ ├── narrator_001_0000.mp3 │ │ └── narrator_002_0035.mp3 │ └── scholar/ │ └── scholar_001_0120.mp3 ├── sfx/ # Soundeffekte nach Kategorie │ ├── 01_props/ │ ├── 02_ambience_wind/ │ ├── 03_breath/ │ ├── 04_footsteps/ │ ├── 05_metal_doors/ │ ├── 06_writing/ │ └── 07_crowd/ └── .audio_review.json # Ungeeignete Audio-Verfolgung
💡 Hinweis: Der voices/-Ordner enthaelt Unterordner pro Charakter. Der sfx/-Ordner enthaelt kategoriebasierte Unterordner.
🎙️ TTS (Dialogstimme)
Charakterspezifische Dialogaudio, generiert ueber Text-to-Speech-APIs.
Generierungs-API: Typecast
API: https://api.typecast.ai/v1/text-to-speech
Dateibenennungskonvention
{charakter}_{nummer}_{MMSS}.mp3
Beispiele:
narrator/narrator_001_0000.mp3 # Erzaehler, Zeile 1, bei 00:00
scholar/scholar_003_0245.mp3 # Gelehrter, Zeile 3, bei 02:45
Der Timecode (MMSS) ermoeglicht die automatische Zuordnung zu SRT-Untertitel-Zeitstempeln.
Emotionsparameter
| Emotion | Beschreibung |
|---|---|
normal | Standard |
happy | Freudig / hell |
sad | Traurig |
angry | Wuetend / intensiv |
🔊 SFX (Soundeffekte)
Umgebungsgeraeusche, Foley und Effekte, generiert durch KI-Soundgenerierung.
Generierungs-API: ElevenLabs
API: https://api.elevenlabs.io/v1/sound-generation
7 SFX-Kategorien
01_props/ — Objektinteraktionen, Klicks02_ambience_*/ — Wind, Regen, Voegel03_breath/ — Atmen, Seufzen04_footsteps/ — Gehen, Laufen05_metal_doors/ — Tueren, Schloesser, Aufprall06_writing/ — Pinsel, Stiftgeraeusche07_crowd/ — Gemurmel, GeplauderDateibenennung
{kategorie}/{beschreibender_name}.mp3
Timecode-SFX (synchronisiert mit bestimmter Szene):
abacus_beads_dark_01_0015.mp3 # fuer Szene 00:15
abacus_beads_01_0134.mp3 # fuer Szene 01:34
Timecode-Dateinamen (enden auf _MMSS) werden automatisch den entsprechenden Szenen zugeordnet.
🔍 Audio-Review-System
Markieren Sie ungeeignete Audiodateien ueber die App-Oberflaeche oder Claude Code MCP-Tools. Markierte Dateien werden in .audio_review.json verfolgt.
.audio_review.json Struktur
{
"media/sfx/02_ambience_wind/wind_howl_01.mp3": {
"status": "flagged",
"reason": "Kein Timecode",
"flaggedAt": "2026-03-16T05:44:55.228Z"
}
}
MCP-Tools
list_audio_reviews
— Markierte Audiodateien anzeigen
update_audio_review
— Markierungen hinzufuegen oder entfernen
🎧 Audio-Tab in der App
Nach dem Import bietet der Audio-Tab eine vollstaendige Uebersicht Ihres Audiopakets.
Stimmenanzahl pro Charakter, SFX-Anzahl pro Kategorie, Gesamtdauer-Aufschluesselung.
Chronologische Liste mit automatischer Szenenzuordnung ueber Timecodes.
Vorschau jeder Audiodatei direkt in der App mit Inline-Player.
Ungeeignete Audio markieren. Nach Name, Dauer oder Status sortieren.