오디오 임포트 가이드
AutoFlowCut용 TTS 대사 음성과 SFX 효과음 준비 방법
🚀 빠른 시작 3단계
외부에서 오디오 파일을 생성한 후, 오디오 패키지 폴더를 AutoFlowCut에 임포트합니다.
스크립트에서 TTS 음성 생성
Typecast 또는 ElevenLabs를 사용하여 인물별 대사 음성을 생성합니다. 캐릭터별 폴더로 정리하세요.
SFX 효과음 생성
ElevenLabs Sound Generation API로 환경음, 발소리, 소품 소리 등을 카테고리별로 생성합니다.
AutoFlowCut에서 오디오 패키지 임포트
프로젝트 디렉토리의 media/ 폴더에 모든 오디오 파일을 배치합니다. AutoFlowCut이 자동으로 오디오 패키지를 감지하고 임포트합니다.
💡 팁: 파일명에 타임코드가 포함된 오디오 파일은 해당 SRT 자막 타임스탬프에 자동으로 매칭됩니다.
📁 오디오 패키지 구조
프로젝트 폴더 내에서 다음 디렉토리 구조로 오디오 파일을 구성하세요:
media/ ├── voices/ # 인물별 TTS 파일 │ ├── narrator/ │ │ ├── narrator_001_0000.mp3 │ │ └── narrator_002_0035.mp3 │ └── scholar/ │ └── scholar_001_0120.mp3 ├── sfx/ # 카테고리별 효과음 │ ├── 01_주판/ │ ├── 02_환경음_바람/ │ ├── 03_침묵_호흡/ │ ├── 04_발소리/ │ ├── 05_금속_타격_문/ │ ├── 06_붓소리/ │ └── 07_군중/ └── .audio_review.json # 부적합 오디오 추적
💡 참고: voices/ 폴더에는 캐릭터별 서브폴더가, sfx/ 폴더에는 카테고리별 서브폴더가 들어갑니다.
🎙️ TTS (대사 음성)
Text-to-Speech API로 생성하는 인물별 대사 음성입니다.
생성 API: Typecast
API: https://api.typecast.ai/v1/text-to-speech
파일명 규칙
{인물명}/{인물}_{번호}_{타임코드}.mp3
예시:
소은/소은_01_0159.mp3 # 소은, 1번 대사, 01:59 위치
곽주사/곽주사_05_1030.mp3 # 곽 주사, 5번 대사, 10:30 위치
타임코드(MMSS)를 통해 SRT 자막 타임스탬프와 자동 매칭됩니다.
감정 파라미터
| 감정 | 설명 |
|---|---|
normal | 기본 |
happy | 밝은 / 기쁜 |
sad | 슬픈 |
angry | 화난 / 강한 |
🔊 SFX (효과음)
AI 사운드 생성으로 만드는 환경음, 폴리, 효과음입니다.
생성 API: ElevenLabs
API: https://api.elevenlabs.io/v1/sound-generation
7가지 SFX 카테고리
01_주판/ — 물체 상호작용, 클릭02_환경음_*/ — 바람, 빗소리, 새소리03_침묵_호흡/ — 숨소리, 한숨04_발소리/ — 걷기, 뛰기05_금속_타격_문/ — 문 여닫기, 자물쇠06_붓소리/ — 붓, 펜 소리07_군중/ — 수군거림, 웅성거림파일명 규칙
{카테고리}/{설명적_이름}.mp3
타임코드 SFX (특정 씬에 동기화):
abacus_beads_dark_01_0015.mp3 # 00:15 씬용
abacus_beads_01_0134.mp3 # 01:34 씬용
타임코드 파일명(_MMSS로 끝남)은 해당 씬에 자동 매칭됩니다.
🔍 오디오 리뷰 시스템
앱 UI 또는 Claude Code MCP 도구를 통해 부적합한 오디오 파일에 플래그를 지정합니다. 플래그된 파일은 .audio_review.json에서 추적됩니다.
.audio_review.json 구조
{
"media/sfx/02_환경음_바람/wind_howl_01.mp3": {
"status": "flagged",
"reason": "타임코드 없음",
"flaggedAt": "2026-03-16T05:44:55.228Z"
}
}
MCP 도구
list_audio_reviews
— 부적합 마크 목록 조회
update_audio_review
— 마크 추가/해제
🎧 앱 내 오디오 탭
임포트 후, 오디오 탭에서 오디오 패키지의 전체 개요를 확인할 수 있습니다.
캐릭터별 음성 수, 카테고리별 SFX 수, 전체 재생 시간 분석.
타임코드를 통한 자동 씬 매칭과 함께 시간순으로 표시.
인라인 플레이어로 앱 내에서 바로 오디오 파일 미리듣기.
교체가 필요한 오디오에 플래그. 이름, 재생시간, 상태별 정렬.