Skip to main content
PromptQuorumPromptQuorum
ķ™ˆ/ź³ źø‰ 딜컬 LLM/Whisper.cpp vs faster-whisper 2026: 딜컬 STT 벤치마크, 설정 ė° GPU ź°€ģ†
Voice, Speech & Multimodal

Whisper.cpp vs faster-whisper 2026: 딜컬 STT 벤치마크, 설정 ė° GPU ź°€ģ†

Ā·10ė¶„ ė¶„ėŸ‰Ā·Hans Kuepper ģ € Ā· PromptQuorum ģ°½ė¦½ģž, 멀티 ėŖØėø AI ė””ģŠ¤ķŒØģ¹˜ ė„źµ¬ Ā· PromptQuorum

whisper.cpp vs faster-whisper — ź°€ģž„ 널리 ģ‚¬ģš©ė˜ėŠ” 두 가지 Whisper 딜컬 ėŸ°ķƒ€ģž„ — ź°ģžģ˜ ėŒ€ģƒ ķ”Œėž«ķ¼ģ—ģ„œ ź²°ģ •ģ ģø ģš°ģœ„ė„¼ ė³“ģž…ė‹ˆė‹¤. Apple Silicon(M 칩 ķƒ‘ģž¬ Mac)ģ˜ 경우, Metal ź°€ģ†ģ„ ģ ģš©ķ•œ whisper.cppź°€ 2026ė…„ ź°€ģž„ 빠넸 딜컬 STT ģ˜µģ…˜ģž…ė‹ˆė‹¤ — M5 Proģ—ģ„œ large-v3ģ“ ~10ė°° ģ‹¤ģ‹œź°„ ģ†ė„ė”œ ė™ģž‘ķ•©ė‹ˆė‹¤. NVIDIA GPU ģ„œė²„ ė° Python ķŒŒģ“ķ”„ė¼ģøģ˜ 경우, CTranslate2ģ˜ int8 ģ–‘ģžķ™”ė„¼ ģ ģš©ķ•œ faster-whisperź°€ ģµœģ„ ģ˜ ģ„ ķƒģœ¼ė”œ, RTX 4070ģ—ģ„œ large-v3 ėŖØėøģ„ ~2.5GB VRAM만으딜 ~12ė°° ģ‹¤ģ‹œź°„ ģ†ė„ė”œ ģ²˜ė¦¬ķ•©ė‹ˆė‹¤. 두 ė„źµ¬ 모두 ė™ģ¼ķ•œ OpenAI Whisper ėŖØėø ź°€ģ¤‘ģ¹˜(tiny부터 large-v3ź¹Œģ§€)넼 ģ‚¬ģš©ķ•˜ė©°, ģ°Øģ“ģ ģ€ ėŸ°ķƒ€ģž„ ģµœģ ķ™”ģ™€ 통합 ė°©ģ‹ģ— ģžˆģŠµė‹ˆė‹¤. CPU ģ „ģš© ķ•˜ė“œģ›Øģ–“ģ—ģ„œėŠ” tiny ė° base ėŖØėøģ— ėŒ€ķ•“ 두 ė„źµ¬ 모두 ķ™œģš© ź°€ėŠ„ķ•˜ė©° — faster-whisperź°€ int8ģ„ 통핓 CPUģ—ģ„œ 약간 ė” ė†’ģ€ ģ†ė„(~20ė°° vs ~15ė°° ģ‹¤ģ‹œź°„)넼 ģ œź³µķ•©ė‹ˆė‹¤.

whisper.cpp와 faster-whisperėŠ” 2026ė…„ ķ˜„ģž¬ OpenAI Whisper ėŖØėøģ„ 기반으딜 ķ•œ ź°€ģž„ ģ£¼ģš”ķ•œ 두 가지 딜컬 ģ˜¤ķ”„ė¼ģø ģŒģ„± ģøģ‹(STT) źµ¬ķ˜„ģ²“ģž…ė‹ˆė‹¤. whisper.cppėŠ” Apple Metal, CUDA, Vulkan, CPUģ—ģ„œ ė™ģž‘ķ•˜ėŠ” 순수 C/C++ ķ¬ķŠøė”œ — Apple Silicon, ģž„ė² ė””ė“œ ģ‹œģŠ¤ķ…œ, ģ‹¤ģ‹œź°„ ģŒģ„± ģ• ķ”Œė¦¬ģ¼€ģ“ģ…˜ģ— ģ“ģƒģ ģž…ė‹ˆė‹¤. faster-whisperėŠ” CTranslate2넼 ķ™œģš©ķ•˜ėŠ” Python ė¼ģ“ėøŒėŸ¬ė¦¬ė”œ, int8 ģ–‘ģžķ™”ė„¼ 통핓 NVIDIA GPUģ—ģ„œ 원본 Whisper ėŒ€ė¹„ ģµœėŒ€ ~4ė°°ģ˜ ģ²˜ė¦¬ėŸ‰ģ„ ė‹¬ģ„±ķ•©ė‹ˆė‹¤. ģ“ ź°€ģ“ė“œģ—ģ„œėŠ” ģ„¤ģ¹˜ 방법, ģ„±ėŠ„ 벤치마크, ģ‹¤ģ‹œź°„ 전사 설정, 그리고 ķ”Œėž«ķ¼ė³„ 직접 비교넼 통핓 ģ ķ•©ķ•œ ė„źµ¬ė„¼ ģ„ ķƒķ•  수 ģžˆė„ė” ģ•ˆė‚“ķ•“ ė“œė¦½ė‹ˆė‹¤.

핵심 ģš”ģ 

  • whisper.cppėŠ” Apple Siliconģ„ ģœ„ķ•œ ģµœģ„ ģ˜ 딜컬 STT ģ„ ķƒģž…ė‹ˆė‹¤. C/C++ ķ¬ķŠøėŠ” ķ•˜ė“œģ›Øģ–“ ź°€ģ†ģ„ ģœ„ķ•“ Core MLź³¼ Apple Metalģ„ ķ™œģš©ķ•©ė‹ˆė‹¤ — Python ģ˜ģ”“ģ„± ģ—†ģ“ M5 Proģ—ģ„œ large-v3ź°€ ~10ė°° ģ‹¤ģ‹œź°„ ģ†ė„ė”œ ė™ģž‘ķ•©ė‹ˆė‹¤.
  • faster-whisperėŠ” NVIDIA GPU ė° Python ķŒŒģ“ķ”„ė¼ģøģ„ ģœ„ķ•œ ģµœģ„ ģ˜ 딜컬 STT ģ„ ķƒģž…ė‹ˆė‹¤. CTranslate2ģ˜ int8 ģ–‘ģžķ™”ėŠ” VRAMģ„ ~40% ģ¤„ģ“ź³  ģ²˜ė¦¬ėŸ‰ģ„ 원본 OpenAI źµ¬ķ˜„ ėŒ€ė¹„ ~4ė°° ķ–„ģƒģ‹œķ‚µė‹ˆė‹¤ — RTX 4070ģ—ģ„œ large-v3ź°€ ~2.5GB VRAM만으딜 ~12ė°° ģ‹¤ģ‹œź°„ ģ†ė„ė„¼ ė‹¬ģ„±ķ•©ė‹ˆė‹¤.
  • 두 ė„źµ¬ 모두 ė™ģ¼ķ•œ OpenAI Whisper ėŖØėø ź°€ģ¤‘ģ¹˜ė„¼ ģ‚¬ģš©ķ•©ė‹ˆė‹¤. WER(단얓 오넘율)ģ€ ė™ģ¼ķ•©ė‹ˆė‹¤ — ģ°Øģ“ģ ģ€ ėŸ°ķƒ€ģž„ ģ„±ėŠ„ź³¼ 통합 ė°©ģ‹ģ—ė§Œ ģžˆģœ¼ė©°, 전사 ģ •ķ™•ė„ģ—ėŠ” ģ°Øģ“ź°€ ģ—†ģŠµė‹ˆė‹¤.
  • Whisper large-v3ėŠ” ģ˜ģ–“ģ—ģ„œ 2.5% WER딜 ģµœź³ ģ˜ ģ •ķ™•ė„ė„¼ ģ œź³µķ•©ė‹ˆė‹¤. ėŒ€ė¶€ė¶„ģ˜ ķ”„ė”œė•ģ…˜ ģ‚¬ģš© ģ‚¬ė”€ģ—ģ„œėŠ” Whisper small(3.4% WER, 2GB RAM) ė˜ėŠ” medium(2.9% WER, 5GB RAM)ģ“ ģ†ė„ģ™€ ģ •ķ™•ė„ ģ‚¬ģ“ģ—ģ„œ ė” ė‚˜ģ€ ź· ķ˜•ģ„ ģ œź³µķ•©ė‹ˆė‹¤.
  • ģ‹¤ģ‹œź°„ ģ „ģ‚¬ėŠ” 두 ė„źµ¬ ėŖØė‘ė”œ 달성 ź°€ėŠ„ķ•©ė‹ˆė‹¤ — whisper.cppėŠ” --stream ķ”Œėž˜ź·øė„¼ 통핓, faster-whisperėŠ” ė‚“ģž„ VAD(ģŒģ„± ķ™œė™ 감지) ķŒŒģ“ķ”„ė¼ģøģ„ 통핓 ģ§€ģ›ķ•©ė‹ˆė‹¤. ģ‹¤ģ œ 지연 ģ‹œź°„ģ€ ėŖØėø 크기에 ė”°ė¼ ė¼ģ“ėøŒ ģŒģ„±ė³“ė‹¤ 0.5~2쓈 ģ§€ģ—°ė©ė‹ˆė‹¤.
  • whisper.cppėŠ” CPU, Metal, CUDA, Vulkanģ—ģ„œ ė™ģž‘ķ•©ė‹ˆė‹¤ — 크딜스 ķ”Œėž«ķ¼ ģž„ė² ė””ė“œ ģ‚¬ģš©(Raspberry Pi, Windows GPU 구성, ARM ģ„œė²„)ģ„ ģœ„ķ•œ ģœ ģ¼ķ•œ ģ˜µģ…˜ģž…ė‹ˆė‹¤. faster-whisperėŠ” CPU와 CUDA만 ģ§€ģ›ķ•©ė‹ˆė‹¤(Macģ—ģ„œ Metal 미지원).
  • Raspberry Pi ė° ģž„ė² ė””ė“œ Linuxģ˜ 경우, CPU ģƒģ˜ whisper.cpp tiny/base ź°€ ģ‹¤ģ§ˆģ ģø ķ•œź³„ģž…ė‹ˆė‹¤ — Pi 5ģ—ģ„œ tinyź°€ ~15ė°° ģ‹¤ģ‹œź°„ ģ†ė„, baseź°€ ~6ė°° ģ‹¤ģ‹œź°„ ģ†ė„. 두 ėŖØėø 모두 1GB RAM에 ģˆ˜ģš©ė©ė‹ˆė‹¤.

빠넸 사실 정리

  • 두 ė„źµ¬ 모두: OpenAIģ˜ ģ˜¤ķ”ˆģ†ŒģŠ¤ Whisper ėŖØėø(MIT ė¼ģ“ģ„ ģŠ¤) 기반. ė™ģ¼ķ•œ ģ •ķ™•ė„ — ėŸ°ķƒ€ģž„ė§Œ 다름.
  • whisper.cpp: Georgi Gerganovź°€ C/C++딜 ģž‘ģ„±. CPU(AVX2/NEON), CUDA, Metal(Apple), Vulkan 지원. Python ė¶ˆķ•„ģš”.
  • faster-whisper: CTranslate2넼 ģ‚¬ģš©ķ•˜ėŠ” Python ė¼ģ“ėøŒėŸ¬ė¦¬. CPU(int8)와 CUDA 지원. Apple Metal 미지원.
  • Whisper ėŖØėø 크기: tiny(39M), base(74M), small(244M), medium(769M), large-v3(1.55B). 모두 ggml / CTranslate2 ķ˜•ģ‹.
  • ėŒ€ė¶€ė¶„ģ˜ 경우 ģµœģ„ ģ˜ ėŖØėø: Whisper small — 3.4% WER, 2GB RAMģ—ģ„œ ė™ģž‘, ķ˜„ėŒ€ģ  CPU ė˜ėŠ” GPUģ—ģ„œ 6ė°° ģ‹¤ģ‹œź°„ ģ†ė„.
  • RTX 4070 벤치마크(large-v3): faster-whisper ~12ė°° ģ‹¤ģ‹œź°„; whisper.cpp CUDA ~8ė°° ģ‹¤ģ‹œź°„. NVIDIAģ—ģ„œėŠ” faster-whisper 승.
  • M5 Pro 벤치마크(large-v3): whisper.cpp Metal ~10ė°° ģ‹¤ģ‹œź°„; faster-whisper CPU ģ „ģš© ~3ė°° ģ‹¤ģ‹œź°„. Appleģ—ģ„œėŠ” whisper.cpp 승.

딜컬 ģŒģ„± ģøģ‹ģ“ ķ•„ģš”ķ•œ ģ“ģœ 

ķ“ė¼ģš°ė“œ STT ģ„œė¹„ģŠ¤(Google Speech-to-Text, AWS Transcribe, Azure Speech)ėŠ” ģ˜¤ė””ģ˜¤ 분당 ģš”źøˆģ„ ė¶€ź³¼ķ•˜ė©° — ģ¼ė°˜ģ ģœ¼ė”œ $0.006–$0.024/ė¶„ — ģ˜¤ė””ģ˜¤ė„¼ 원격 ģ„œė²„ė”œ ģ „ģ†”ķ•©ė‹ˆė‹¤. ź°œģø 정볓 ė³“ķ˜øź°€ ģ¤‘ģš”ķ•œ ģ• ķ”Œė¦¬ģ¼€ģ“ģ…˜(ģ˜ė£Œ 받아쓰기, 법적 ė…¹ģŒ, ģ €ė„ė¦¬ģ¦˜ ģøķ„°ė·°, źø°ģ—… ķšŒģ˜)ģ˜ 경우, 딜컬 ģ „ģ‚¬ėŠ” ė°ģ“ķ„° ė…øģ¶œģ„ ģ™„ģ „ķžˆ ģ œź±°ķ•©ė‹ˆė‹¤.

  • ź°œģø 정볓 볓호: ģ˜¤ė””ģ˜¤ź°€ 기기넼 ė– ė‚˜ģ§€ ģ•ŠģŠµė‹ˆė‹¤. ģ»“ķ”Œė¼ģ“ģ–øģŠ¤ė„¼ ģœ„ķ•œ ė°ģ“ķ„° 처리 ź³„ģ•½ģ“ ķ•„ģš” ģ—†ģŠµė‹ˆė‹¤ — ģ²˜ė¦¬ź°€ ė”œģ»¬ģ—ģ„œ ģ“ė£Øģ–“ģ§‘ė‹ˆė‹¤.
  • ė¹„ģš©: 분당 ģš”źøˆ ģ—†ģŒ. 주당 8ģ‹œź°„ ķšŒģ˜ė„¼ ģ „ģ‚¬ķ•˜ėŠ” ź°œė°œģžėŠ” ķ“ė¼ģš°ė“œ STT 가격 ėŒ€ė¹„ ģ›” $120–480넼 ģ ˆģ•½ķ•  수 ģžˆģŠµė‹ˆė‹¤.
  • ģ˜¤ķ”„ė¼ģø: 비행기, ė³“ģ•ˆ ģ‹œģ„¤, ģ•ˆģ •ģ ģø ģøķ„°ė„·ģ“ ģ—†ėŠ” ģ§€ģ—­ģ—ģ„œ ė™ģž‘ķ•©ė‹ˆė‹¤. API 키 ꓀리 ė¶ˆķ•„ģš”.
  • 지연 ģ‹œź°„: ģ—…ė”œė“œ/ė‹¤ģš“ė”œė“œ 왕복 ģ—†ģŒ. ģ‹¤ģ‹œź°„ ģŒģ„± ģøķ„°ķŽ˜ģ“ģŠ¤ģ˜ 경우, 딜컬 ģ²˜ė¦¬ėŠ” STT 지연 ģ‹œź°„ģ„ ķ“ė¼ģš°ė“œģ˜ 300–800msģ—ģ„œ 50–300ms딜 ė‹Øģ¶•ķ•©ė‹ˆė‹¤.
  • ģ»¤ģŠ¤ķ„°ė§ˆģ“ģ¦ˆ: ė„ė©”ģøė³„ ģ–“ķœ˜ė”œ ėŖØėøģ„ 미세 ģ”°ģ •ķ•©ė‹ˆė‹¤. ķ•˜ė“œģ›Øģ–“ģ— ė§žėŠ” ėŖØėø 크기넼 ģ‹¤ķ–‰ķ•©ė‹ˆė‹¤.
  • Home Assistant 통합: 딜컬 WhisperėŠ” ģ›Øģ“ķ¬ ģ›Œė“œģ™€ ģŒģ„± ėŖ…ė ¹ģ“ ķ™ˆ ė„¤ķŠøģ›Œķ¬ė„¼ ė– ė‚˜ģ§€ ģ•ŠģŒģ„ ģ˜ėÆøķ•©ė‹ˆė‹¤. ķ“ė¼ģš°ė“œ STT넼 ģ™„ģ „ķžˆ ėŒ€ģ²“ķ•˜ėŠ” ģ• ė“œģ˜Ø ģ„¤ģ •ģ€ Home Assistantģ—ģ„œģ˜ 딜컬 Whisper →넼 ģ°øģ”°ķ•˜ģ‹­ģ‹œģ˜¤.

Whisper ėŖØėø 크기 — 두 ė„źµ¬ģ˜ 공통 기반

whisper.cpp와 faster-whisper 모두 ė™ģ¼ķ•œ Whisper ėŖØėø ź°€ģ¤‘ģ¹˜ė„¼ ģ‚¬ģš©ķ•˜ė©°, ź°ģžģ˜ ķ˜•ģ‹ģœ¼ė”œ ė³€ķ™˜ė©ė‹ˆė‹¤(whisper.cppėŠ” GGML, faster-whisperėŠ” CTranslate2). VRAM/RAM ģ˜ˆģ‚°ź³¼ ģ •ķ™•ė„ ģš”źµ¬ 사항에 ė”°ė¼ ėŖØėø 크기넼 ģ„ ķƒķ•˜ģ‹­ģ‹œģ˜¤.

ėŖØėøķŒŒė¼ėÆøķ„°VRAM / RAMģ˜ģ–“ WERģ†ė„ 배율 (RTX 4070 ģ‹¤ģ‹œź°„ ėŒ€ė¹„)
tiny39M~1 GB7.6%~32Ɨ
base74M~1 GB5.0%~16Ɨ
small244M~2 GB3.4%~6Ɨ
medium769M~5 GB2.9%~2Ɨ
large-v31.55B~10 GB2.5%1Ɨ (기준)
distil-large-v3~756M~4 GB~2.6%~6Ɨ

WER(단얓 오넘율) ź°’ģ€ LibriSpeech 큓린 ķ…ŒģŠ¤ķŠø ģ„øķŠøģ— ėŒ€ķ•œ Whisper ė…¼ė¬øģ—ģ„œ ź°€ģ øģ™”ģŠµė‹ˆė‹¤. ė‚®ģ„ģˆ˜ė” ģ¢‹ģŠµė‹ˆė‹¤. ģ†ė„ ė°°ģœØģ€ RTX 4070ģ—ģ„œģ˜ faster-whisper int8 źø°ģ¤€ģž…ė‹ˆė‹¤. distil-large-v3 ź°’ģ€ Distil-Whisper ė…¼ė¬øģ—ģ„œ ź°€ģ øģ™”ģŠµė‹ˆė‹¤.

Distil-Whisper: ė” 빠넸 ėŒ€ģ•ˆ

distil-whisper/distil-large-v3ėŠ” large-v3ģ˜ ģ§€ģ‹ ģ¦ė„˜ ė³€ķ˜•ģœ¼ė”œ, ķŒŒė¼ėÆøķ„°ź°€ ~50% ģ ģœ¼ė©“ģ„œ WERģ“ ģ›ė³øģ˜ ~1% ģ“ė‚“ė”œ ģœ ģ§€ė˜ė©° ~6ė°° 빠넓게 ė™ģž‘ķ•©ė‹ˆė‹¤.** 전사 ģ†ė„ź°€ ė§ˆģ§€ė§‰ ģ •ķ™•ė„ ķ¼ģ„¼ķŠø ģ“ģƒģœ¼ė”œ ģ¤‘ģš”ķ•œ ź²½ģš°ģ— ģ˜¬ė°”ė„ø ģ„ ķƒģž…ė‹ˆė‹¤. distil-large-v3ėŠ” faster-whisper(ė„¤ģ“ķ‹°ėøŒ CTranslate2 지원)와 whisper.cpp(GGML ķ˜•ģ‹ ė³€ķ™˜ģ„ 통핓) 모두와 ķ˜øķ™˜ė˜ģ–“, ģ“ėÆø ģ‚¬ģš© ģ¤‘ģø ėŸ°ķƒ€ģž„ģ— ķ†µķ•©ė©ė‹ˆė‹¤.

  • ķŒŒė¼ėÆøķ„°: ~756M — large-v3ģ˜ 1.55Bģ˜ 약 절반, ~10GB ėŒ€ģ‹  ~4GB VRAM에 ģˆ˜ģš©ė©ė‹ˆė‹¤.
  • ģ†ė„: RTX 4070ģ—ģ„œ ~6ė°° ģ‹¤ģ‹œź°„(large-v3ģ˜ źø°ģ¤€ģø 1Ɨ ėŒ€ė¹„) — ģ†ė„ėŠ” medium ėŖØėøź³¼ ģœ ģ‚¬ķ•˜ė©“ģ„œ ģ •ķ™•ė„ėŠ” large-v3에 ź·¼ģ ‘ķ•©ė‹ˆė‹¤.
  • WER: ģ˜ģ–“ģ—ģ„œ ~2.6% — large-v3ģ˜ 2.5%볓다 단 ~0.1% ė†’ģŠµė‹ˆė‹¤. ģ‹¤ģ œė”œėŠ” ģ¼ė°˜ģ ģø ģŒģ„±ģ—ģ„œ ģ°Øģ“ė„¼ ź±°ģ˜ ėŠė‚„ 수 ģ—†ģŠµė‹ˆė‹¤.
  • ķ˜øķ™˜ģ„±: faster-whisperģ—ģ„œ ė„¤ģ“ķ‹°ėøŒė”œ ė™ģž‘ķ•©ė‹ˆė‹¤(WhisperModel("distil-large-v3", device="cuda", compute_type="int8")). whisper.cppģ˜ 경우, distil-whisperģ˜ GGML ė³€ķ™˜ 스크립트넼 ģ‚¬ģš©ķ•˜ģ—¬ GGML ķ˜•ģ‹ģœ¼ė”œ ė³€ķ™˜ķ•˜ģ‹­ģ‹œģ˜¤.
  • 최적 ģ‚¬ģš© 사딀: 배치 전사 ģž‘ģ—…, VRAMģ“ ģ œķ•œėœ ģ„œė²„ ė°°ķ¬, large-v3 ķ’ˆģ§ˆģ„ medium ėŖØėø ģ†ė„ė”œ ģ›ķ•˜ėŠ” ėŖØė“  ģ‚¬ģš© 사딀.
  • ė¹„ź¶Œģž„ ģ‚¬ģš© 사딀: 다국얓 전사 — distil-large-v3ėŠ” ģ˜ģ–“ ģ „ģš©ģž…ė‹ˆė‹¤. 다넸 ģ–øģ–“ģ˜ 경우 large-v3 ė˜ėŠ” mediumģ„ ģ‚¬ģš©ķ•˜ģ‹­ģ‹œģ˜¤.

whisper.cpp — C/C++ ķ¬ķŠø

whisper.cpp(Georgi Gerganov ģ œģž‘)ėŠ” OpenAI Whisper ėŖØėøģ˜ 순수 C/C++ ģž¬źµ¬ķ˜„ģœ¼ė”œ, ģ €ģžģ› 크딜스 ķ”Œėž«ķ¼ 추딠에 ģµœģ ķ™”ė˜ģ–“ ģžˆģŠµė‹ˆė‹¤. Python, CUDA ķˆ“ķ‚·ģ“ ķ•„ģš” ģ—†ģœ¼ė©°, Raspberry Pi부터 Apple M5 Pro, Windows CUDA źµ¬ģ„±ź¹Œģ§€ ź±°ģ˜ ėŖØė“  ķ•˜ė“œģ›Øģ–“ģ—ģ„œ ė™ģž‘ķ•©ė‹ˆė‹¤.

  • ķ”Œėž«ķ¼ 지원: CPU(AVX2, AVX512, ARM NEON), Apple Metal(Core ML), CUDA(NVIDIA), Vulkan(AMD/Intel GPU), OpenCL.
  • Apple Silicon 강점: whisper.cppėŠ” ėŖØėøģ„ Core ML ķ˜•ģ‹ģœ¼ė”œ 낓볓낓 Apple Neural Engineģ—ģ„œ ģ¶”ė” ģ„ ź°€ėŠ„ķ•˜ź²Œ ķ•©ė‹ˆė‹¤. Metalģ„ 통핓 M5 Proģ—ģ„œ large-v3ź°€ ~10ė°° ģ‹¤ģ‹œź°„ ģ†ė„ė”œ ė™ģž‘ķ•©ė‹ˆė‹¤ — ķ“ė¼ģš°ė“œ 왕복볓다 ė¹ ė¦…ė‹ˆė‹¤.
  • ģ„¤ģ¹˜: ģ €ģž„ģ†Œė„¼ ķ“ė” ķ•˜ź³  make(ė˜ėŠ” cmake)넼 ģ‹¤ķ–‰ķ•©ė‹ˆė‹¤. ģ¼ė°˜ ķ”Œėž«ķ¼ģš© 사전 ė¹Œė“œėœ ė°”ģ“ė„ˆė¦¬ź°€ ģ œź³µė©ė‹ˆė‹¤. Python ģ˜ģ”“ģ„± ģ—†ģŒ.
  • ėŖØėø ė‹¤ģš“ė”œė“œ: bash ./models/download-ggml-model.sh base.en — GGML ķ˜•ģ‹ģ˜ ėŖØėø ķŒŒģ¼ģ„ ė‹¤ģš“ė”œė“œķ•©ė‹ˆė‹¤(baseģ˜ 경우 ~142MB).
  • CLI ģ˜ˆģ‹œ: ./main -m models/ggml-base.bin -f audio.wav — WAV ķŒŒģ¼ģ„ ķ‘œģ¤€ 출렄으딜 ģ „ģ‚¬ķ•©ė‹ˆė‹¤. ķ•œźµ­ģ–“ėŠ” -l ko넼 ģ¶”ź°€ķ•˜ģ‹­ģ‹œģ˜¤.
  • ģ‹¤ģ‹œź°„ 스트림 ėŖØė“œ: ./stream -m models/ggml-base.bin --step 3000 --length 10000 — ė§ˆģ“ķ¬ģ—ģ„œ 3쓈 청크 ė‹Øģœ„ė”œ ģ „ģ‚¬ķ•©ė‹ˆė‹¤.
  • Python ėž˜ķ¼: pywhispercppģ€ whisper.cpp넼 ģœ„ķ•œ Python ė°”ģøė”©ģ„ ģ œź³µķ•˜ģ—¬, Metal ź°€ģ†ģ„ ķ¬ģƒķ•˜ģ§€ ģ•Šź³  Python ķŒŒģ“ķ”„ė¼ģøģ—ģ„œ ģ‚¬ģš©ķ•  수 ģžˆź²Œ ķ•©ė‹ˆė‹¤.
  • ķ•œź³„: ė„¤ģ“ķ‹°ėøŒ VAD(ģŒģ„± ķ™œė™ 감지) ģ—†ģŒ. 스트림 ėŖØė“œėŠ” ģ‚¬ģš© 사딀에 ė”°ė¼ --step ė° --length ķŒŒė¼ėÆøķ„°ė„¼ 씰정핓야 ķ•©ė‹ˆė‹¤.
bash
# Build from source (macOS / Linux)
git clone https://github.com/ggerganov/whisper.cpp
cd whisper.cpp
make -j4

# Download a model
bash ./models/download-ggml-model.sh large-v3

# Transcribe a file
./main -m models/ggml-large-v3.bin -f recording.wav

# Enable Metal on Apple Silicon (Core ML)
make -j4 WHISPER_COREML=1
./main -m models/ggml-large-v3-encoder.mlmodelc -f recording.wav

faster-whisper — CTranslate2 ķ¬ķŠø

faster-whisper(SYSTRAN ģ œģž‘)ėŠ” CTranslate2넼 ģ‚¬ģš©ķ•˜ģ—¬ Whisper ģ¶”ė” ģ„ ģž¬źµ¬ķ˜„ķ•œ Python ė¼ģ“ėøŒėŸ¬ė¦¬ģž…ė‹ˆė‹¤ — int8 ģ–‘ģžķ™” ģ§€ģ›ģ„ 통핓 VRAM ģ‚¬ģš©ėŸ‰ģ„ ģ¤„ģ“ź³  ģ²˜ė¦¬ėŸ‰ģ„ ķ–„ģƒģ‹œķ‚¤ėŠ” ź³ ė„ė”œ ģµœģ ķ™”ėœ C++ 추딠 ģ—”ģ§„ģž…ė‹ˆė‹¤. NVIDIA GPUģ—ģ„œ faster-whisperėŠ” ģ‚¬ģš© ź°€ėŠ„ķ•œ ź°€ģž„ 빠넸 딜컬 Whisper źµ¬ķ˜„ģ²“ģž…ė‹ˆė‹¤.

  • ķ”Œėž«ķ¼ 지원: CPU(int8 ģ–‘ģžķ™”)와 NVIDIA GPU CUDA. Apple Metal 미지원 — Macģ—ģ„œėŠ” CPU ģ „ģš©ģœ¼ė”œė§Œ ė™ģž‘ķ•©ė‹ˆė‹¤.
  • int8 강점: CTranslate2ģ˜ int8 ģ–‘ģžķ™”ėŠ” VRAMģ„ ~40% ģ¤„ģ“ź³  float16 ėŒ€ė¹„ 추딠 ģ†ė„ė„¼ ~2ė°° ķ–„ģƒģ‹œķ‚¤ė©°, WER ģ˜ķ–„ģ€ ė¬“ģ‹œķ•  ģˆ˜ģ¤€(ģ ˆėŒ€ź°’ < 0.1%)ģž…ė‹ˆė‹¤.
  • ģ„¤ģ¹˜: pip install faster-whisper — ģ»“ķŒŒģ¼ ė¶ˆķ•„ģš”. CUDA ģ§€ģ›ģ€ CUDA 11.8+와 cuDNN 8.xź°€ ķ•„ģš”ķ•©ė‹ˆė‹¤.
  • ė‚“ģž„ VAD: faster-whisperģ—ėŠ” Silero VAD ķ†µķ•©ģ“ ķ¬ķ•Øė˜ģ–“ ģžˆģ–“ ģŒģ„±ģ“ ģ—†ėŠ” ģ˜¤ė””ģ˜¤ ģ„øź·øėØ¼ķŠøė„¼ ģžė™ģœ¼ė”œ ź±“ė„ˆėœė‹ˆė‹¤ — ģ‹¤ģ‹œź°„ 전사 ķŒŒģ“ķ”„ė¼ģøģ— ķ•„ģˆ˜ģ ģž…ė‹ˆė‹¤.
  • ė„¤ģ“ķ‹°ėøŒ Python: ģ§ģ ‘ģ ģø Python APIėŠ” LLM, ģ˜¤ė””ģ˜¤ 처리 ė¼ģ“ėøŒėŸ¬ė¦¬, 웹 ķ”„ė ˆģž„ģ›Œķ¬ģ™€ģ˜ ķ†µķ•©ģ„ ģš©ģ“ķ•˜ź²Œ ķ•©ė‹ˆė‹¤.
  • ģ†ė„: RTX 4070ģ—ģ„œ large-v3 int8ģ“ ~2.5GB VRAMģ„ ģ‚¬ģš©ķ•˜ė©° ~12ė°° ģ‹¤ģ‹œź°„ ģ†ė„ė”œ ė™ģž‘ķ•©ė‹ˆė‹¤. CPU int8ģ€ tiny ėŖØėøģ—ģ„œ ~20ė°° ģ‹¤ģ‹œź°„ ģ†ė„ė„¼ ė‹¬ģ„±ķ•©ė‹ˆė‹¤.
  • 배치 처리: faster-whisperėŠ” ėŒ€ėŸ‰ģ˜ ģ˜¤ė””ģ˜¤ ķŒŒģ¼ģ„ 효율적으딜 ģ²˜ė¦¬ķ•˜źø° ģœ„ķ•œ 배치 ģ¶”ė” ģ„ ģ§€ģ›ķ•©ė‹ˆė‹¤.
  • ķ•œź³„: Macģ—ģ„œ Metal 미지원 — Apple Siliconģ—ģ„œ CPU ģ „ģš©ģœ¼ė”œė§Œ ė™ģž‘ķ•˜ė©°, Metalģ„ ģ‚¬ģš©ķ•˜ėŠ” whisper.cppģ˜ ~10ė°° ėŒ€ė¹„ large-v3딜 ~3ė°° ģ‹¤ģ‹œź°„ ģ†ė„ė„¼ ė‹¬ģ„±ķ•©ė‹ˆė‹¤.
python
from faster_whisper import WhisperModel

# Load model (downloads automatically on first run)
model = WhisperModel("large-v3", device="cuda", compute_type="int8")

# Transcribe
segments, info = model.transcribe("audio.wav", beam_size=5)

print(f"Detected language: {info.language} (probability: {info.language_probability:.2f})")
for segment in segments:
    print(f"[{segment.start:.2f}s → {segment.end:.2f}s] {segment.text}")

직접 비교: 벤치마크 ķ‘œ

ėŖØė“  ė²¤ģ¹˜ė§ˆķ¬ėŠ” 달리 ėŖ…ģ‹œė˜ģ§€ ģ•ŠėŠ” ķ•œ large-v3 ėŖØėøģ„ ģ‚¬ģš©ķ•©ė‹ˆė‹¤. ģ†ė„ėŠ” ģ‹¤ģ‹œź°„ 배율딜 ģø”ģ •ė©ė‹ˆė‹¤(예: 10Ć—ėŠ” 60ė¶„ ģ˜¤ė””ģ˜¤ė„¼ 6분에 ģ „ģ‚¬ķ•Øģ„ ģ˜ėÆø). VRAM ģˆ˜ģ¹˜ėŠ” GPU 실행 źø°ģ¤€ģ“ė©°, RAM ģˆ˜ģ¹˜ėŠ” CPU 실행 źø°ģ¤€ģž…ė‹ˆė‹¤.

šŸ“ ķ•œ ė¬øģž„ģœ¼ė”œ

Apple Siliconģ—ģ„œ Metalģ„ ģ‚¬ģš©ķ•œ whisper.cppėŠ” large-v3넼 ~10ė°° ģ‹¤ģ‹œź°„ ģ†ė„ė”œ ģ²˜ė¦¬ķ•˜ź³ , NVIDIA GPUģ—ģ„œ int8ģ„ ģ‚¬ģš©ķ•œ faster-whisperėŠ” ~12ė°° ģ‹¤ģ‹œź°„ ģ†ė„ė„¼ ė‹¬ģ„±ķ•©ė‹ˆė‹¤ — 각 ė„źµ¬ėŠ” ģžģ‹ ģ˜ ėŒ€ģƒ ķ”Œėž«ķ¼ģ—ģ„œ ź²°ģ •ģ ģø ģš°ģœ„ė„¼ ė³“ģž…ė‹ˆė‹¤.

šŸ’¬ ģ‰½ź²Œ ė§ķ•˜ė©“

Macģ—ģ„œėŠ” whisper.cpp넼 ģ„ ķƒķ•˜ģ‹­ģ‹œģ˜¤(Apple Neural Engine ķ™œģš©), Windows/Linuxģ˜ NVIDIA GPUģ—ģ„œėŠ” faster-whisper넼 ģ„ ķƒķ•˜ģ‹­ģ‹œģ˜¤(ģ‹¤ģ‹œź°„ė³“ė‹¤ 12ė°° 빠넓게 ģ˜¤ė””ģ˜¤ė„¼ ģ²˜ė¦¬ķ•˜ė©° GPU 메모리넼 40% ėœ ģ‚¬ģš©ķ•©ė‹ˆė‹¤).

ģ§€ķ‘œwhisper.cpp (large-v3)faster-whisper (large-v3)
ķ”Œėž«ķ¼ / ģ–øģ–“C/C++ (크딜스 ķ”Œėž«ķ¼)Python (CTranslate2)
GPU 지원CUDA, Metal, VulkanCUDA ģ „ģš©
CPU ģµœģ ķ™”AVX2, ARM NEONint8 ģ–‘ģžķ™”
ģ†ė„ — RTX 4070, large-v3~8ė°° ģ‹¤ģ‹œź°„~12ė°° ģ‹¤ģ‹œź°„ āœ“
ģ†ė„ — M5 Pro, large-v3~10ė°° ģ‹¤ģ‹œź°„ (Metal) āœ“~3ė°° ģ‹¤ģ‹œź°„ (CPU ģ „ģš©)
ģ†ė„ — CPU ģ „ģš© (x86), base~15ė°° ģ‹¤ģ‹œź°„~20ė°° ģ‹¤ģ‹œź°„ āœ“
VRAM — large-v3, GPU~3 GB~2.5 GB (int8) āœ“
Python ķ†µķ•©ėž˜ķ¼ ķ•„ģš” (pywhispercpp)ė„¤ģ“ķ‹°ėøŒ āœ“
VAD (침묵 감지)ģˆ˜ė™ (--step ģ”°ģ •)ė‚“ģž„ (Silero VAD) āœ“
ģ‹¤ģ‹œź°„ ģŠ¤ķŠøė¦¬ė°ģ˜ˆ (--stream ķ”Œėž˜ź·ø) āœ“ģ˜ˆ (VAD ķŒŒģ“ķ”„ė¼ģø)
WER ģ •ķ™•ė„ (large-v3)2.5% (ė™ģ¼)2.5% (ė™ģ¼)
Python ģ˜ģ”“ģ„±ģ—†ģŒ āœ“Python 3.8+
Raspberry Pi / ģž„ė² ė””ė“œģ˜ˆ — C ė°”ģ“ė„ˆė¦¬ āœ“ģ œķ•œģ  — Python ģ˜¤ė²„ķ—¤ė“œ
출렄 ķ˜•ģ‹SRT, VTT, JSON, CSV, txtPython ź°ģ²“ (start, end, text)

whisper.cppėŠ” ģ¶œė „ģ„ ķ‘œģ¤€ ģžė§‰ ė° 전사 ķ˜•ģ‹(SRT, VTT, JSON, CSV, txt)으딜 직접 ģž‘ģ„±ķ•©ė‹ˆė‹¤ — 추가 ģ½”ė“œ ģ—†ģ“ ė””ģŠ¤ķ¬ģ— ķŒŒģ¼ģ“ ķ•„ģš”ķ•œ ģžė§‰ ģ›Œķ¬ķ”Œė”œģ— ģ“ģƒģ ģž…ė‹ˆė‹¤. faster-whisperėŠ” start, end, text ģ†ģ„±ģ„ 가진 ģ„øź·øėØ¼ķŠø ź°ģ²“ģ˜ Python ģ œė„ˆė ˆģ“ķ„°ė„¼ ė°˜ķ™˜ķ•©ė‹ˆė‹¤ — ģ„øź·øėØ¼ķŠø ķ…ģŠ¤ķŠøė„¼ 중간 ķŒŒģ¼ ģž‘ģ„± ģ—†ģ“ ė‹¤ģš“ģŠ¤ķŠøė¦¼ ėŖØėøģ— 직접 ģ „ė‹¬ķ•˜ėŠ” LLM ķŒŒģ“ķ”„ė¼ģø 연결에 ģ“ģƒģ ģž…ė‹ˆė‹¤. ģžė§‰ ģƒģ„±ģ˜ 경우 whisper.cppź°€ ė” ź°„ė‹Øķ•©ė‹ˆė‹¤. ģ„øź·øėØ¼ķŠøė„¼ ķ”„ė”œź·øėž˜ė° ė°©ģ‹ģœ¼ė”œ ģ²˜ė¦¬ķ•˜ėŠ” ķŒŒģ“ķ”„ė¼ģøģ˜ 경우 faster-whisperź°€ ė” ź°„ė‹Øķ•©ė‹ˆė‹¤.

ģ‹¤ģ‹œź°„ 전사 설정

ģ‹¤ģ‹œź°„ ģ „ģ‚¬ėŠ” ė§ˆģ“ķ¬ģ—ģ„œ ė“¤ģ–“ģ˜¤ėŠ” ģ˜¤ė””ģ˜¤ė„¼ 청크 ė‹Øģœ„ė”œ ģ²˜ė¦¬ķ•˜ģ—¬ ģŒģ„±ė³“ė‹¤ 약간 ģ§€ģ—°ėœ ķ…ģŠ¤ķŠøė„¼ ģƒģ„±ķ•©ė‹ˆė‹¤. 두 ė„źµ¬ 모두 ģ“ė„¼ ģ§€ģ›ķ•˜ģ§€ė§Œ, ģ„œė”œ 다넸 ķŠøė ˆģ“ė“œģ˜¤ķ”„ź°€ ģžˆģŠµė‹ˆė‹¤.

  • whisper.cpp 스트림 ėŖØė“œ: ./stream -m models/ggml-small.bin --step 3000 --length 10000 -t 4넼 ģ‹¤ķ–‰ķ•©ė‹ˆė‹¤. 3쓈 청크넼 ģ²˜ė¦¬ķ•˜ė©°, small ėŖØėøė”œ ~0.5–1.5ģ“ˆģ˜ 지연 ģ‹œź°„. Python ė¶ˆķ•„ģš”.
  • faster-whisper VAD ķŒŒģ“ķ”„ė¼ģø: model.transcribe()ģ—ģ„œ vad_filter=True넼 ģ‚¬ģš©ķ•©ė‹ˆė‹¤. Silero VADź°€ 침묵 ź²½ź³„ģ—ģ„œ ģžė™ģœ¼ė”œ ģ˜¤ė””ģ˜¤ė„¼ ģ„øź·øėØ¼ķŠøķ™”ķ•©ė‹ˆė‹¤ — ź³ ģ • źøøģ“ 창볓다 ė” ģžģ—°ģŠ¤ėŸ¬ģš“ 청크.
  • ģ‹¤ģ œ 지연 ģ‹œź°„: small ė˜ėŠ” medium ėŖØėøė”œ ė¼ģ“ėøŒ ģŒģ„±ė³“ė‹¤ 0.5–2쓈 지연. ė” ė‚®ģ€ 지연 ģ‹œź°„(< 0.5쓈, 단 WER ė” ė†’ģŒ)ģ„ ģœ„ķ•“ģ„œėŠ” tiny넼 ģ‚¬ģš©ķ•˜ģ‹­ģ‹œģ˜¤.
  • ģ‹¤ģ‹œź°„ģš© ėŖØėø ģ„ ķƒ: small ė˜ėŠ” baseź°€ ģ‹¤ģ§ˆģ ģø 최적 ģ§€ģ ģž…ė‹ˆė‹¤ — ģŒģ„±ģ„ ė”°ė¼ź°€źø°ģ— ģ¶©ė¶„ķžˆ ė¹ ė„“ź³ , ź¹Øė—ķ•œ ģ˜¤ė””ģ˜¤ģ— ėŒ€ķ•“ ģ¶©ė¶„ķžˆ ģ •ķ™•ķ•©ė‹ˆė‹¤. ģ „ģš© GPUź°€ ģ—†ėŠ” ķ•œ ģ‹¤ģ‹œź°„ģ—ģ„œ large-v3ėŠ” ķ”¼ķ•˜ģ‹­ģ‹œģ˜¤.
  • ė§ˆģ“ķ¬ ģž…ė „: whisper.cppėŠ” SDL2 ė˜ėŠ” portaudio넼 통핓 ģ›ģ‹œ ģ˜¤ė””ģ˜¤ė„¼ ģ½ģŠµė‹ˆė‹¤. faster-whisperėŠ” ėŖØė“  Python ģ˜¤ė””ģ˜¤ ė¼ģ“ėøŒėŸ¬ė¦¬(sounddevice, pyaudio, soundfile)ģ—ģ„œ ģ˜¤ė””ģ˜¤ ė°°ģ—“ģ„ ģ½ģŠµė‹ˆė‹¤.
  • ģ•ˆģ •ģ„±: whisper.cppģ˜ 스트림 ėŖØė“œėŠ” 침묵 중에 반복 채움 토큰("ķ™˜ź°")ģ„ ģƒģ„±ķ•  수 ģžˆģŠµė‹ˆė‹¤. --suppress-blank와 --no-speech-threshold딜 ģ–µģ œķ•˜ģ‹­ģ‹œģ˜¤.

Apple Silicon: whisper.cpp 승

M1, M2, M3, M4, M5 ķƒ‘ģž¬ Macģ˜ 경우, Core ML / Metal ź°€ģ†ģ„ ģ‚¬ģš©ķ•˜ėŠ” whisper.cppź°€ ģ˜¬ė°”ė„ø ė„źµ¬ģž…ė‹ˆė‹¤ — ģ˜ģ‹¬ģ˜ 여지가 ģ—†ģŠµė‹ˆė‹¤. faster-whisperėŠ” Metal ģ§€ģ›ģ“ 없얓 Macģ—ģ„œ CPU ģ „ģš©ģœ¼ė”œė§Œ ė™ģž‘ķ•˜ė©° large-v3딜 ~3ė°° ģ‹¤ģ‹œź°„ ģ†ė„ė„¼ ė‹¬ģ„±ķ•©ė‹ˆė‹¤. Metalģ„ ģ‚¬ģš©ķ•˜ėŠ” whisper.cppėŠ” M5 Proģ—ģ„œ ~10ė°° ģ‹¤ģ‹œź°„ ģ†ė„ė„¼ ė‹¬ģ„±ķ•©ė‹ˆė‹¤ — 3ė°°ģ˜ ģ†ė„ ģ“ģ .

  • Core ML 낓볓낓기: ./models/generate-coreml-model.sh large-v3넼 ģ‹¤ķ–‰ķ•˜ģ—¬ ģøģ½”ė”ė„¼ Core ML ķ˜•ģ‹ģœ¼ė”œ ė‚“ė³“ėƒ…ė‹ˆė‹¤. ģ“ė„¼ 통핓 ģøģ½”ė” ģ¶”ė” ģ“ Apple Neural Engine으딜 ģ˜¤ķ”„ė”œė“œė©ė‹ˆė‹¤.
  • M5 Pro 벤치마크(large-v3, Metal): ~10ė°° ģ‹¤ģ‹œź°„. 60ė¶„ ģ˜¤ė””ģ˜¤ė„¼ ~6분에 전사. ģ°øź³ : M5 ProėŠ” 2026ė…„ 3ģ›” ģ¶œģ‹œ — ģ“ź²ƒģ€ ģ»¤ė®¤ė‹ˆķ‹°ģ˜ 쓈기 ė²¤ģ¹˜ė§ˆķ¬ģž…ė‹ˆė‹¤. whisper.cppź°€ M5 Neural Engineģ„ ģµœģ ķ™”ķ•˜ėŠ” ģ—…ė°ģ“ķŠøģ— ė”°ė¼ ģ„±ėŠ„ģ“ ķ–„ģƒė  수 ģžˆģŠµė‹ˆė‹¤.
  • M3 MacBook Air 벤치마크(large-v3, Metal): ~7ė°° ģ‹¤ģ‹œź°„. 60ė¶„ģ„ ~8.5분에.
  • 메모리: 통합 ė©”ėŖØė¦¬ėŠ” ė³„ė„ģ˜ VRAMģ“ ģ—†ģŒģ„ ģ˜ėÆøķ•©ė‹ˆė‹¤ — 16GB M5 ProėŠ” large-v3(~3GB)넼 다넸 ķ”„ė”œģ„øģŠ¤ģ™€ ķ•Øź»˜ ķŽøģ•ˆķ•˜ź²Œ 실행할 수 ģžˆģŠµė‹ˆė‹¤.
  • Macģ—ģ„œģ˜ faster-whisper: CPU ģ „ģš©, int8. Large-v3딜 ~3ė°° ģ‹¤ģ‹œź°„ ģ†ė„. 야간 배치 ģ „ģ‚¬ģ—ėŠ” ģ‚¬ģš© ź°€ėŠ„ķ•˜ģ§€ė§Œ, ģ‹¤ģ‹œź°„ģ“ė‚˜ ģ‹œź°„ģ— ėÆ¼ź°ķ•œ ģ›Œķ¬ķ”Œė”œģ—ėŠ” ģ ķ•©ķ•˜ģ§€ ģ•ŠģŠµė‹ˆė‹¤.
  • ź¶Œģž„ 사항: Macģ—ģ„œģ˜ ėŖØė“  STT ģž‘ģ—…ģ— whisper.cpp넼 ģ‚¬ģš©ķ•˜ģ‹­ģ‹œģ˜¤. Metal ź°€ģ†ģ„ ģœ ģ§€ķ•˜ė©“ģ„œ Python ķ†µķ•©ģ“ ķ•„ģš”ķ•œ 경우 pywhispercppģ„ ģ¶”ź°€ķ•˜ģ‹­ģ‹œģ˜¤.

NVIDIA GPU: faster-whisper 승

NVIDIA GPU넼 ķƒ‘ģž¬ķ•œ Windows ė° Linuxģ—ģ„œėŠ” faster-whisperź°€ ģš°ģˆ˜ķ•œ ģ„ ķƒģž…ė‹ˆė‹¤. CTranslate2ģ˜ CUDA ė°±ģ—”ė“œėŠ” whisper.cppģ˜ CUDA ź²½ė”œė³“ė‹¤ ė” ģµœģ ķ™”ė˜ģ–“ ģžˆģŠµė‹ˆė‹¤ — RTX 4070ģ—ģ„œ large-v3으딜 ~12ė°° ėŒ€ ~8ė°° ģ‹¤ģ‹œź°„ ģ†ė„, ė” ė‚®ģ€ VRAM ģ‚¬ģš©ėŸ‰.

  • RTX 4070(12GB) 벤치마크(large-v3 int8): ~12ė°° ģ‹¤ģ‹œź°„, ~2.5GB VRAM.
  • RTX 3060(12GB) 벤치마크(large-v3 int8): ~8ė°° ģ‹¤ģ‹œź°„, ~2.5GB VRAM.
  • RTX 4060(8GB) 벤치마크(large-v3 int8): ~7ė°° ģ‹¤ģ‹œź°„, ~2.5GB VRAM — ģ—¬ģœ  ģžˆź²Œ ģˆ˜ģš©ė©ė‹ˆė‹¤.
  • int8 vs float16: int8ģ€ ~2ė°° ė¹ ė„“ź³  VRAMģ„ ~40% 적게 ģ‚¬ģš©ķ•˜ė©° ģ •ķ™•ė„ ģ†ģ‹¤ģ€ ė¬“ģ‹œķ•  ģˆ˜ģ¤€ģž…ė‹ˆė‹¤. NVIDIAģ—ģ„œėŠ” ķ•­ģƒ compute_type="int8"ģ„ ģ‚¬ģš©ķ•˜ģ‹­ģ‹œģ˜¤.
  • 배치 처리: faster-whisperģ˜ batched=True ķŒŒė¼ėÆøķ„°ėŠ” ģ—¬ėŸ¬ ģ˜¤ė””ģ˜¤ ķŒŒģ¼ģ˜ 병렬 처리넼 ź°€ėŠ„ķ•˜ź²Œ ķ•˜ģ—¬, ėŒ€ź·œėŖØ 전사 ģž‘ģ—…ģ—ģ„œ GPU ķ™œģš©ģ„ ź·¹ėŒ€ķ™”ķ•©ė‹ˆė‹¤.
  • Python ķŒŒģ“ķ”„ė¼ģø 통합: faster-whisperėŠ” LangChain, Haystack ė° ģ»¤ģŠ¤ķ…€ Python ķŒŒģ“ķ”„ė¼ģøģ— 직접 ķ†µķ•©ė©ė‹ˆė‹¤. whisper.cpp ėž˜ķ•‘ź³¼ ė¹„źµķ•˜ģ—¬ ģ„œėøŒķ”„ė”œģ„øģŠ¤ ģ˜¤ė²„ķ—¤ė“œ ģ—†ģŒ.

ģ–“ėŠ ź²ƒģ„ ģ‚¬ģš©ķ•“ģ•¼ ķ•˜ėŠ”ź°€

ģ‹œė‚˜ė¦¬ģ˜¤ģ—ģ„œ ģ ķ•©ķ•œ ė„źµ¬ė”œģ˜ ģ§ģ ‘ģ ģø 매핑:

šŸ“ ķ•œ ė¬øģž„ģœ¼ė”œ

Apple Silicon ė° ģž„ė² ė””ė“œ/크딜스 ķ”Œėž«ķ¼ ėŒ€ģƒģ—ģ„œėŠ” whisper.cpp넼, NVIDIA GPU ė° Python ķŒŒģ“ķ”„ė¼ģøģ—ģ„œėŠ” faster-whisper넼 ģ‚¬ģš©ķ•˜ģ‹­ģ‹œģ˜¤.

šŸ’¬ ģ‰½ź²Œ ė§ķ•˜ė©“

Macģ“ ģžˆė‹¤ė©“ whisper.cpp넼 ģ„ ķƒķ•˜ģ‹­ģ‹œģ˜¤ — Apple ķ•˜ė“œģ›Øģ–“ģ—ģ„œ faster-whisper볓다 3ė°° ė¹ ė¦…ė‹ˆė‹¤. NVIDIA GPUź°€ ģžˆź³  Pythonģ„ ģž‘ģ„±ķ•œė‹¤ė©“ faster-whisper넼 ģ„ ķƒķ•˜ģ‹­ģ‹œģ˜¤ — ė” ė¹ ė„“ź³  GPU 메모리넼 40% ėœ ķ•„ģš”ė”œ ķ•©ė‹ˆė‹¤.

ģ‹œė‚˜ė¦¬ģ˜¤ģµœģ„ ģ˜ ģ„ ķƒģ“ģœ 
Apple Silicon Mac (ėŖØė“  ėŖØėø)whisper.cppMetal / Core ML ź°€ģ† — Macģ—ģ„œ CPU ģ „ģš©ģø faster-whisper볓다 3ė°° 빠름
NVIDIA GPU ģ„œė²„ (Linux/Windows)faster-whisperCTranslate2 int8 — whisper.cppģ˜ CUDA ź²½ė”œė³“ė‹¤ ė¹ ė„“ź³  VRAM 적게 ģ‚¬ģš©
Python ė°ģ“ķ„° ķŒŒģ“ķ”„ė¼ģøfaster-whisperė„¤ģ“ķ‹°ėøŒ Python API; ģ„œėøŒķ”„ė”œģ„øģŠ¤ ėž˜ķ¼ ģ—†ģŒ; ė‚“ģž„ VAD
Raspberry Pi / ģž„ė² ė””ė“œ Linuxwhisper.cpp순수 C ė°”ģ“ė„ˆė¦¬; Python ėŸ°ķƒ€ģž„ ģ˜¤ė²„ķ—¤ė“œ ģ—†ģŒ; ARM NEON ģµœģ ķ™”
ģ‹¤ģ‹œź°„ ģŒģ„± ģ–“ģ‹œģŠ¤ķ„“ķŠøwhisper.cppė‚®ģ€ ģ˜¤ė²„ķ—¤ė“œģ˜ 스트림 ėŖØė“œ; Pi / ģž„ė² ė””ė“œģ—ģ„œ Python ģ—†ģ“ ė™ģž‘
배치 전사 (ėŒ€ģš©ėŸ‰ ģ˜¤ė””ģ˜¤ ķŒŒģ¼)faster-whisper배치 추딠, GPU ķ™œģš©, ė¹„ė™źø° Python 통합
AMD GPU (Vulkan)whisper.cppVulkan ė°±ģ—”ė“œ 지원; faster-whisperėŠ” CUDA ģ „ģš©
CPU ģ „ģš© Linux ģ„œė²„faster-whisperint8 ģ–‘ģžķ™”ź°€ x86 CPUģ—ģ„œ ~30% ģ†ė„ ģ“ģ  제공

whisper.cpp와 faster-whisper넼 ė„˜ģ–“ģ„œ

두 가지 추가 ė„źµ¬ėŠ” Whisper넼 두 źø°ė³ø ė„źµ¬ 모두가 기본적으딜 ģ œź³µķ•˜ģ§€ ģ•ŠėŠ” 기늄으딜 ķ™•ģž„ķ•©ė‹ˆė‹¤: ķ™”ģž 분리(diarization)와 ģ“ˆź³ ģ† GPU 배치 추딠.

  • WhisperX:** faster-whisper 기반으딜 źµ¬ģ¶•ėœ WhisperXėŠ” 단얓 ģˆ˜ģ¤€ ķƒ€ģž„ģŠ¤ķƒ¬ķ”„ģ™€ ķ™”ģž 분리넼 ģ¶”ź°€ķ•©ė‹ˆė‹¤ — ģ–“ė–¤ ķ™”ģžź°€ ģ–“ė–¤ 단얓넼 ė§ķ–ˆėŠ”ģ§€ ģ‹ė³„ķ•©ė‹ˆė‹¤. 최적 ģ‚¬ģš© 사딀: ķ™”ģž ė ˆģ“ėø”ģ“ ģžˆėŠ” ķšŒģ˜ 전사, 팟캐스트 ķŽøģ§‘, ģøķ„°ė·° 전사. pip install whisperx딜 ģ„¤ģ¹˜ķ•˜ź³  분리 ėŖØėøģ— ėŒ€ķ•œ Hugging Face ķ† ķ°ģ„ ģ œź³µķ•˜ģ‹­ģ‹œģ˜¤.
  • insanely-fast-whisper:** Flash Attention 2 ģ§€ģ›ģ„ ģ¶”ź°€ķ•˜ėŠ” Hugging Face Transformers ķŒŒģ“ķ”„ė¼ģø ėž˜ķ¼ė”œ, NVIDIA ķ•˜ė“œģ›Øģ–“ģ—ģ„œ ķ‘œģ¤€ faster-whisper볓다 훨씬 빠넸 GPU ģ¶”ė” ģ„ ģ œź³µķ•©ė‹ˆė‹¤. 최적 ģ‚¬ģš© 사딀: NVIDIA GPUģ—ģ„œ ėŒ€ģš©ėŸ‰ ģ˜¤ė””ģ˜¤ ķŒŒģ¼ 배치 처리. Flash Attention 2 ķ˜øķ™˜ GPU ķ•„ģš”(Ampere ģ“ģƒ: RTX 3000+, A100, H100).

ģ¼ė°˜ģ ģø 문제 ė° ķ•“ź²°ģ±…

ź°€ģž„ ģžģ£¼ ė°œģƒķ•˜ėŠ” 설정 ė° ėŸ°ķƒ€ģž„ ė¬øģ œģ™€ ģ§ģ ‘ģ ģø ķ•“ź²°ģ±…:

  • CUDA 버전 ė¶ˆģ¼ģ¹˜: faster-whisperėŠ” CUDA 11.8 ģ“ģƒģ“ ķ•„ģš”ķ•©ė‹ˆė‹¤. nvcc --version으딜 ķ™•ģøķ•˜ģ‹­ģ‹œģ˜¤. CUDAź°€ ģ“ģ „ ė²„ģ „ģø 경우 ė“œė¼ģ“ė²„ė„¼ ģ—…ė°ģ“ķŠøķ•˜ź±°ė‚˜ cudatoolkit=11.8ģ„ ģ‚¬ģš©ķ•˜ģ—¬ conda ķ™˜ź²½ģ— faster-whisper넼 ģ„¤ģ¹˜ķ•˜ģ‹­ģ‹œģ˜¤.
  • Metal ėŖØėø 낓볓낓기 ģ‹¤ķŒØ: Xcode Command Line Toolsź°€ ģ„¤ģ¹˜ė˜ģ–“ ģžˆėŠ”ģ§€ ķ™•ģøķ•˜ģ‹­ģ‹œģ˜¤ — xcode-select --installģ„ ģ‹¤ķ–‰ķ•©ė‹ˆė‹¤. Core ML 낓볓낓기 ģŠ¤ķ¬ė¦½ķŠøėŠ” coremltools Python ķŒØķ‚¤ģ§€ź°€ ķ•„ģš”ķ•©ė‹ˆė‹¤: pip install coremltools.
  • 침묵 중 ķ™˜ź°: 두 ė„źµ¬ 모두 ģŒģ„±ģ“ ģ—†ėŠ” ģ˜¤ė””ģ˜¤ ģ„øź·øėØ¼ķŠøģ—ģ„œ 반복 채움 ķ† ķ°ģ„ ģƒģ„±ķ•  수 ģžˆģŠµė‹ˆė‹¤. whisper.cpp 스트림 ėŖØė“œģ—ģ„œėŠ” --no-speech-threshold 0.6ģ„, faster-whisperģ˜ model.transcribe()ģ—ģ„œėŠ” vad_filter=True넼 ģ‚¬ģš©ķ•˜ģ—¬ ģžė™ģœ¼ė”œ ģŒģ„±ģ“ ģ—†ėŠ” ģ„øź·øėØ¼ķŠøė„¼ ź±“ė„ˆė›°ģ‹­ģ‹œģ˜¤.
  • large-v3 메모리 부씱: faster-whisperģ—ģ„œ int8 ģ–‘ģžķ™”ė”œ ģ „ķ™˜ķ•˜ģ‹­ģ‹œģ˜¤(compute_type="int8") — VRAMģ„ ~5GB(float16)ģ—ģ„œ ~2.5GB딜 ģ¤„ģž…ė‹ˆė‹¤. whisper.cppģ—ģ„œėŠ” ģ–‘ģžķ™”ėœ GGML ė³€ķ˜•ģ„ ģ‚¬ģš©ķ•˜ģ‹­ģ‹œģ˜¤(예: ggml-large-v3-q5_0.bin) — 메모리넼 ~3–4GB딜 ģ¤„ģž…ė‹ˆė‹¤.
  • ģ˜ģ–“ź°€ ģ•„ė‹Œ ģ˜¤ė””ģ˜¤ģ—ģ„œ ģ•Œģ•„ė³¼ 수 ģ—†ėŠ” 출렄: ģ˜ģ–“ź°€ ģ•„ė‹Œ ģŒģ„±ģ— .en ėŖØėø ė³€ķ˜•(tiny.en, base.en)ģ„ ģ‚¬ģš©ķ•˜ģ§€ ė§ˆģ‹­ģ‹œģ˜¤ — ģ“ź²ƒė“¤ģ€ ģ˜ģ–“ ģ „ģš©ģž…ė‹ˆė‹¤. 다국얓 ėŖØėø(base, small, medium, large-v3)ģ„ ģ‚¬ģš©ķ•˜ź³  언얓넼 ėŖ…ģ‹œģ ģœ¼ė”œ ģ§€ģ •ķ•˜ģ‹­ģ‹œģ˜¤: whisper.cppģ—ģ„œ -l ko ė˜ėŠ” faster-whisperģ—ģ„œ language="ko".
  • 느린 CPU 추딠: CPUź°€ AVX2 명령얓넼 ģ§€ģ›ķ•˜ėŠ”ģ§€ ķ™•ģøķ•˜ģ‹­ģ‹œģ˜¤(ģµœģ ķ™”ėœ CPU 추딠에 ķ•„ģš”). Linuxģ—ģ„œ grep avx2 /proc/cpuinfo ė˜ėŠ” Macģ—ģ„œ sysctl machdep.cpu.features딜 ķ™•ģøķ•˜ģ‹­ģ‹œģ˜¤. AVX2 ģ—†ėŠ” CPUėŠ” ģ¼ė°˜ SIMD딜 ķ“ė°±ė˜ģ–“ 2–3ė°° ėŠė¦½ė‹ˆė‹¤.

ģžģ£¼ ė¬»ėŠ” 질문

whisper.cpp와 faster-whisperģ˜ 전사 ģ •ķ™•ė„ėŠ” ė™ģ¼ķ•©ė‹ˆź¹Œ?

ź·øė ‡ģŠµė‹ˆė‹¤. 두 ė„źµ¬ 모두 ė™ģ¼ķ•œ OpenAI Whisper ėŖØėø ź°€ģ¤‘ģ¹˜ė„¼ ģ‚¬ģš©ķ•©ė‹ˆė‹¤ — ėŖØėø ģžģ²“ėŠ” ė™ģ¼ķ•©ė‹ˆė‹¤. ģ°Øģ“ėŠ” 추딠 ėŸ°ķƒ€ģž„(C/C++ vs CTranslate2 Python)ģ—ė§Œ ģžˆģŠµė‹ˆė‹¤. ė™ģ¼ķ•œ ģ˜¤ė””ģ˜¤ ķŒŒģ¼ģ— ėŒ€ķ•œ WERģ€ ģ„œė”œ ģ ˆėŒ€ź°’ 0.1% ģ“ė‚“ė”œ, ģ“ėŠ” beam search ė¬“ģž‘ģœ„ģ„±ģœ¼ė”œ ģøķ•œ ģ •ģƒģ ģø ė³€ė™ ė²”ģœ„ ė‚“ģž…ė‹ˆė‹¤.

Apple Silicon Macģ—ģ„œ faster-whisper넼 ģ‚¬ģš©ķ•  수 ģžˆģŠµė‹ˆź¹Œ?

예, ķ•˜ģ§€ė§Œ CPU ģ „ģš©ģœ¼ė”œė§Œ ė™ģž‘ķ•©ė‹ˆė‹¤ — faster-whisperėŠ” Metal ģ§€ģ›ģ“ ģ—†ģŠµė‹ˆė‹¤. M5 Proģ—ģ„œ faster-whisper large-v3ėŠ” ~3ė°° ģ‹¤ģ‹œź°„ ģ†ė„(CPU int8)딜 ė™ģž‘ķ•˜ė©°, Metalģ„ ģ‚¬ģš©ķ•˜ėŠ” whisper.cppģ˜ ~10배와 ė¹„źµė©ė‹ˆė‹¤. ėŒ€ė¶€ė¶„ģ˜ Mac ģ‚¬ģš©ģžģ—ź²Œ whisper.cppėŠ” ė™ģ¼ķ•œ ėŖØėøė”œ 3ė°° ė” ė¹ ė¦…ė‹ˆė‹¤. Macģ—ģ„œ faster-whisper넼 ģ‚¬ģš©ķ•˜ėŠ” ģœ ģ¼ķ•œ ģ“ģœ ėŠ” Python ķŒŒģ“ķ”„ė¼ģøģ“ ģ“ėÆø ģ“ģ— ģ˜ģ”“ķ•˜ź³  ģžˆģœ¼ė©° ģ†ė„ź°€ ģ¤‘ģš”ķ•˜ģ§€ ģ•Šģ€ ź²½ģš°ģž…ė‹ˆė‹¤.

ģŒģ„± ģ–“ģ‹œģŠ¤ķ„“ķŠøģ— ģ–“ė–¤ Whisper ėŖØėø 크기넼 ģ‚¬ģš©ķ•“ģ•¼ ķ•©ė‹ˆź¹Œ?

ģ‹¤ģ‹œź°„ ģŒģ„± ģøķ„°ķŽ˜ģ“ģŠ¤ģ˜ 경우, Whisper smallģ“ ķ‘œģ¤€ ź¶Œģž„ ģ‚¬ķ•­ģž…ė‹ˆė‹¤ — ź¹Øė—ķ•œ ģ˜ģ–“ģ—ģ„œ 3.4% WER, ķ˜„ėŒ€ģ ģø CPU ė˜ėŠ” GPUģ—ģ„œ ~200ms STT 지연 ģ‹œź°„, 2GB RAM에 ģˆ˜ģš©ė©ė‹ˆė‹¤. ķ•˜ė“œģ›Øģ–“ź°€ 매우 ģ œķ•œėœ 경우(Raspberry Pi Zero 2W, źµ¬ķ˜• 전화기) ~7.6% WERģ„ ķ—ˆģš©ķ•  수 ģžˆė‹¤ė©“ tiny넼 ģ‚¬ģš©ķ•˜ģ‹­ģ‹œģ˜¤. 지연 ģ‹œź°„ģ“ ģ œģ•½ģ“ ģ•„ė‹Œ 배치 ģ „ģ‚¬ģ˜ ź²½ģš°ģ—ė§Œ medium ė˜ėŠ” large-v3넼 ģ‚¬ģš©ķ•˜ģ‹­ģ‹œģ˜¤.

whisper.cppėŠ” ģ˜ģ–“ ģ™øģ˜ 언얓넼 ģ§€ģ›ķ•©ė‹ˆź¹Œ?

ź·øė ‡ģŠµė‹ˆė‹¤. ėŖØė“  다국얓 Whisper ėŖØėø(base, small, medium, large-v3)ģ€ 99개 언얓넼 ģ§€ģ›ķ•©ė‹ˆė‹¤. CLI에 `-l [ģ–øģ–“ ģ½”ė“œ]넼 ģ¶”ź°€ķ•˜ģ‹­ģ‹œģ˜¤: ķ•œźµ­ģ–“ėŠ” -l ko, ė…ģ¼ģ–“ėŠ” -l de, ģ¼ė³øģ–“ėŠ” -l ja` 등. tiny.en ė° base.en ėŖØėøģ€ ģ˜ģ–“ ģ „ģš©ģ“ė©° 다국얓 ėŒ€ģ‘ė¬¼ė³“ė‹¤ ģ˜ģ–“ģ—ģ„œ 약간 ė” ģ •ķ™•ķ•©ė‹ˆė‹¤.

CUDA ģ§€ģ›ģ„ ķ¬ķ•Øķ•˜ģ—¬ faster-whisper넼 ģ–“ė–»ź²Œ ģ„¤ģ¹˜ķ•©ė‹ˆź¹Œ?

pip install faster-whisper딜 ģ„¤ģ¹˜ķ•©ė‹ˆė‹¤. CUDA ģ§€ģ›ģ€ ģ‹œģŠ¤ķ…œģ— CUDA 11.8 ģ“ģƒź³¼ cuDNN 8.xź°€ ģ„¤ģ¹˜ė˜ģ–“ ģžˆģ–“ģ•¼ ķ•©ė‹ˆė‹¤. nvcc --version으딜 CUDA ė²„ģ „ģ„ ķ™•ģøķ•˜ģ‹­ģ‹œģ˜¤. 그런 ė‹¤ģŒ ėŖØėø ė”œė”© ģ‹œ device="cuda"넼 ģ§€ģ •ķ•©ė‹ˆė‹¤: WhisperModel("large-v3", device="cuda", compute_type="int8"). CUDAź°€ ź°ģ§€ė˜ģ§€ ģ•Šģœ¼ė©“ faster-whisperėŠ” ģžė™ģœ¼ė”œ CPU딜 ķ“ė°±ķ•©ė‹ˆė‹¤.

whisper.cpp와 faster-whisper 중 ģ–“ėŠ ź²ƒģ“ ė” ģ •ķ™•ķ•©ė‹ˆź¹Œ?

ė™ģ¼ķ•©ė‹ˆė‹¤. 두 ė„źµ¬ 모두 ė™ģ¼ķ•œ OpenAI Whisper ėŖØėø ź°€ģ¤‘ģ¹˜ė„¼ ģ‚¬ģš©ķ•˜ė©° ė™ģ¼ķ•œ ģ˜¤ė””ģ˜¤ ķŒŒģ¼ģ— ėŒ€ķ•“ ė™ģ¼ķ•œ WERģ„ ģƒģ„±ķ•©ė‹ˆė‹¤. whisper.cpp와 faster-whisperģ˜ ģ°Øģ“ģ ģ€ ģ†ė„ģ™€ ķ”Œėž«ķ¼ ģ§€ģ›ģ“ģ§€ 전사 ģ •ķ™•ė„ź°€ ģ•„ė‹™ė‹ˆė‹¤. 실행 간에 ģø”ģ •ė˜ėŠ” WER ģ°Øģ“ėŠ” ėŸ°ķƒ€ģž„ ģžģ²“ģ—ģ„œ ė¹„ė”Æėœ ź²ƒģ“ ģ•„ė‹ˆė¼ beam searchģ˜ ģ •ģƒģ ģø ė³€ė™ ė²”ģœ„ 낓에 ģžˆģŠµė‹ˆė‹¤.

8GB RAM으딜 Whisper large-v3넼 실행할 수 ģžˆģŠµė‹ˆź¹Œ?

GPUģ—ģ„œėŠ” ź°€ėŠ„ķ•©ė‹ˆė‹¤ — faster-whisperģ˜ large-v3 int8ģ€ ~2.5GB VRAMģ„ ģ‚¬ģš©ķ•˜ė©° 8GB GPUģ—ģ„œ ė™ģž‘ķ•©ė‹ˆė‹¤. CPU ģ „ģš© ķ•˜ė“œģ›Øģ–“ģ—ģ„œ 8GB RAMģ€ large-v3(float32ėŠ” ~10GB ģ‚¬ģš©)에 ė¹ ė“Æķ•©ė‹ˆė‹¤. CPU ģ „ģš© ģ‹œģŠ¤ķ…œģ—ģ„œėŠ” medium(5GB RAM) ė˜ėŠ” small(2GB RAM)ģ„ ģ‚¬ģš©ķ•˜ģ‹­ģ‹œģ˜¤. whisper.cppėŠ” ėŸ°ķƒ€ģž„ ģ˜¤ė²„ķ—¤ė“œź°€ 적얓 CPUģ—ģ„œ faster-whisper볓다 메모리 ķšØģœØģ“ ė†’ģŠµė‹ˆė‹¤.

딜컬 Whisper vs ķ“ė¼ģš°ė“œ STTģ˜ ė¹„ģš©ģ€ ģ–¼ė§ˆģž…ė‹ˆź¹Œ?

ģ§€ģ†ģ ģø ė¹„ģš©ģ€ ģ—†ģŠµė‹ˆė‹¤. ķ“ė¼ģš°ė“œ STT ģ„œė¹„ģŠ¤ėŠ” ģ˜¤ė””ģ˜¤ 분당 $0.006–$0.024넼 ė¶€ź³¼ķ•©ė‹ˆė‹¤ — 주당 8ģ‹œź°„ ķšŒģ˜ė„¼ ģ „ģ‚¬ķ•˜ėŠ” ź°œė°œģžģ—ź²ŒėŠ” ģ›” $120–480ģž…ė‹ˆė‹¤. 딜컬 WhisperėŠ” ģ“ėÆø ģ†Œģœ ķ•œ ķ•˜ė“œģ›Øģ–“ģ—ģ„œ ė™ģž‘ķ•˜ė©°, 분당 ģš”źøˆ 없고, API 키 ꓀리 없고, ģ˜¤ė””ģ˜¤ ė°ģ“ķ„°ź°€ 기기넼 ė– ė‚˜ģ§€ ģ•ŠģŠµė‹ˆė‹¤.

ģ°øź³  ģžė£Œ

← ź³ źø‰ 딜컬 LLM으딜 ėŒģ•„ź°€źø°

Whisper.cpp vs faster-whisper 2026: 딜컬 STT ė° 벤치마크