Key Takeaways
- RTX 5090μ λ‘컬 LLM μΆλ‘ (tokens/sec κΈ°μ€)μμ RTX 4090λ³΄λ€ μ½ 20~25% λΉ λ¦ λλ€.
- λ μΉ΄λ λͺ¨λ 24GB VRAMμΌλ‘ LLM μμ μ μ©λμ λμΌν©λλ€. 5090μ μλ μ°μλ λ λμ λ©λͺ¨λ¦¬ λμνκ³Ό μ °μ΄λ ν¨μ¨μμ λΉλ‘―λ©λλ€.
- RTX 5090μ $1,000 λ λΉμλλ€($1,999 vs. μ€κ³ 4090 $999). μ΄λ―Έ 4090μ 보μ μ€μ΄λΌλ©΄ κ°κ²© λλΉ μ±λ₯ ν₯μμ΄ μ κ·Έλ μ΄λλ₯Ό μ λΉννμ§ μμ΅λλ€.
- 7B~13B λͺ¨λΈμ κ²½μ°: 4090λ κ³Όμ€νμ λλ€. GPUλ₯Ό μ΅λλ‘ νμ©νκΈ° μ μ CPUΒ·λκ° νκ³μ λ¨Όμ λΆλͺνλλ€.
- 70B λͺ¨λΈμ κ²½μ°: 5090μ΄ λΉμ λ°ν©λλ€. μν 70B λͺ¨λΈ 2~3κ°λ₯Ό λ³λ ¬ μ€ννκ±°λ λ¨μΌ 70B λͺ¨λΈμ λ ν° λ°°μΉ ν¬κΈ°λ‘ μ€νν μ μμ΅λλ€.
- RTX 5080($999)μ λμΌ GPU μ μ μ΄ νμν κ²½μ°κ° μλλΌλ©΄ λ‘컬 LLM κΈ°μ€μΌλ‘ 5090λ³΄λ€ κ°μ±λΉκ° λ μ’μ΅λλ€.
μ€μ μλ μ°¨μ΄λ?
RTX 5090: 14,080 CUDA μ½μ΄, 568 TFLOPS, λ©λͺ¨λ¦¬ λμν μ½ 1,500 GB/sec.
RTX 4090: 16,384 CUDA μ½μ΄, 410 TFLOPS, λ©λͺ¨λ¦¬ λμν μ½ 936 GB/sec.
μ€μ LLM μΆλ‘ (Llama 3 70B, Q4, batch=1): RTX 5090μ μ½ 45 tokens/sec, RTX 4090μ μ½ 36 tokens/sec. 25% λΉ λ¦ λλ€.
7B λͺ¨λΈμ κ²½μ°(μ»΄ν¨ν λ°μ΄λκ° μλ λ©λͺ¨λ¦¬ λ°μ΄λ): RTX 5090μ μ½ 80 tokens/sec, RTX 4090μ μ½ 75 tokens/sec. 6.5%λ°μ μ°¨μ΄ λμ§ μμ΅λλ€. μ°¨μ΄κ° κ±°μ μμ΄μ§λλ€.
4090κ³Ό 5090μ VRAM μ°¨μ΄κ° μ€μνκ°?
λ μΉ΄λ λͺ¨λ GDDR7(5090) / GDDR6X(4090) 24GBμ λλ€. VRAM μ©λμ λμΌνλ―λ‘ μ΄μ μ΄ μμ΅λλ€.
5090μ GDDR7μ λ°μ΄νΈλΉ μλκ° λ λΉ λ¦ λλ€. μ΄κ²μ΄ 5090μ΄ 20~25% λΉ λ₯Έ μ΄μ μ€ νλμ λλ€. νμ§λ§ μ°λ¦¬κ° μ€ννλ LLM μν¬λ‘λμμλ GDDR6X(4090)λ‘λ μΆ©λΆν©λλ€.
ν ν°λΉ λΉμ©: μ€μ λ‘ μ΄λ μͺ½μ΄ μ λ ΄νκ°?
- μ€κ³ RTX 4090: μ½ $999~1,299. Llama 70Bμμ 36 tokens/sec λ¬μ±. ν ν°λΉ λΉμ©: 100λ§ ν ν°λΉ $27~36.
- RTX 5090 μ ν: $1,999. Llama 70Bμμ 45 tokens/sec λ¬μ±. ν ν°λΉ λΉμ©: 100λ§ ν ν°λΉ $44.
- κ²°λ‘ : 4090μ΄ μμ± ν ν°λΉ λΉμ©μ΄ λ μ λ ΄ν©λλ€. μλκ° λΉ λ₯΄κΈ° λλ¬Έμ΄ μλλΌ κ΅¬λ§€ κ°κ²©μ΄ μ λ ΄νκΈ° λλ¬Έμ λλ€.
4090μμ 5090μΌλ‘ μ€μ λ‘ μΈμ μ κ·Έλ μ΄λν΄μΌ νλκ°?
7B~13B μΆλ‘ μ μν μ κ·Έλ μ΄λλ νμ§ λ§μμμ€. μ΄ ν¬κΈ°μμλ 4090λ μ΄λ―Έ κ³Όμ€νμ λλ€. μ΄μ°¨νΌ CPU λ°μ΄λ λλ λκ° νκ³μ λ¨Όμ λλ¬νκ² λ©λλ€.
μ κ·Έλ μ΄λλ₯Ό κ³ λ €ν κ²½μ°: λμΌ GPUλ‘ 70B μΆλ‘ μ μ€ννλ κ²½μ°(2Γ 4090 = $2,500 vs. 2Γ 5090 = $4,000), 70B λͺ¨λΈμμ 45+ tokens/secκ° νμν κ²½μ°, λλ λ©ν° λ°°μΉ μν¬λ‘λμμ λ©λͺ¨λ¦¬ λμν λ³λͺ©μ΄ λ°μνλ κ²½μ°.
λ λμ λμ: 5090μΌλ‘ κ΅μ²΄νλ λμ λ λ²μ§Έ RTX 4090μ $1,200μ μΆκ°νμμμ€. 4090 λ μ₯μ λ³λ ¬λ‘ μ¬μ©νλ©΄ μ½ 72 tokens/secλ₯Ό λ¬μ±ν μ μμ΅λλ€(90μ μλμ§λ§, μ λ° λΉμ©μ κ·Όμ ν μ±λ₯μ λλ€).
5090μ λν νν μ€ν΄
- 5090μ΄ 4090λ³΄λ€ 2λ°° λΉ λ₯΄λ€κ³ μκ°νλ κ² β μ€μ λ‘λ 20~25%λ°μ λΉ λ₯΄μ§ μμΌλ©°, 7B λͺ¨λΈμμλ μ°¨μ΄κ° λ μ€μ΄λλλ€.
- VRAM μ°¨μ΄κ° μλ€κ³ κ°μ νλ κ² β λ μΉ΄λ λͺ¨λ 24GBμ λλ€. μ©λμ λμΌνλ©° LLM μ±λ₯λ μ μ¬ν©λλ€.
- 70B λͺ¨λΈμ μ€ννλ €λ©΄ 5090μ΄ νμνλ€κ³ λ―Ώλ κ² β 4090μ 36 tokens/secλ‘ 70B λͺ¨λΈμ μΆ©λΆν μ€νν©λλ€. λλΆλΆμ μ¬μ©μμκ² "μΆ©λΆν" μ±λ₯μ λλ€.
FAQ
Llama 3 70B μ€νμ μν΄ RTX 5090μ΄ κ°μΉ μλμ?
45+ tokens/secκ° νμν κ²½μ°μλ§ κ°μΉκ° μμ΅λλ€. 4090μ 36 tokens/secλ₯Ό μ 곡νλ©°, μ΄λ λλΆλΆμ μ¬μ©μμκ² "μΆ©λΆν©λλ€". μΆκ°μ μΈ 9 tokens/secλ₯Ό μν΄ $1,000μ λ μ§λΆν΄μΌ ν©λλ€.
RTX 5090 νλμ RTX 4090 λ μ₯ μ€ μ΄λ κ²μ΄ λ λμκ°μ?
μ€κ³ 4090 λ μ₯(μ½ $2,500)μ μλμ μ μ°μ± λ©΄μμ 5090($1,999)μ μμλλ€. μ¬λ¬ λͺ¨λΈμ λ³λ ¬λ‘ μ€νν μ μμ΅λλ€. 5090μ μ€μ μ΄ λ κ°λ¨νμ§λ§ λΉμ©μ΄ λ λμ΅λλ€.
RTX 5090μ΄ 4090λ³΄λ€ VRAMμ΄ λ λ§μκ°μ?
μλμ. λ λ€ 24GBμ λλ€. GDDR7μ΄ λ°μ΄νΈλΉ μλλ λ λΉ λ₯΄μ§λ§ LLMμμλ GDDR6X(4090)λ‘λ μΆ©λΆν©λλ€.
5090 κ°κ²©μ΄ 4090μ²λΌ νλ½ν κΉμ?
κ²°κ΅ κ·Έλ κ² λ κ²μ λλ€. 4090μ 2022λ μΆμ λΉμ $1,499μκ³ 2026λ νμ¬ μ€κ³ κ° $999μ λλ€. 5090μ 2~3λ ν μ€κ³ κ° $1,200~1,500μ λλ¬ν κ²μΌλ‘ μμλ©λλ€.
RTX 5090μ 750W νμ μνλΌμ΄μ ν¨κ» μ¬μ©ν μ μλμ?
κ°μ ν κ°λ₯ν©λλ€. RTX 5090 λ¨λ μΌλ‘ 575Wλ₯Ό μλͺ¨ν©λλ€. λΆν μ μ μ κ°νλ₯Ό λ°©μ§νλ €λ©΄ 850W λλ 1000W PSUλ₯Ό μ¬μ©νμμμ€.
RTX 5080μ΄ 5090λ³΄λ€ κ°μ±λΉκ° λ μ’μκ°μ?
λλΆλΆμ κ²½μ° κ·Έλ μ΅λλ€. 5080($999)μ μ λ° λΉμ©μ 5090 μλμ 80%λ₯Ό μ 곡ν©λλ€. λ‘컬 LLM κΈ°μ€μΌλ‘ 5080μ΄ μ΅μ μ μ νμ λλ€.
Qwen-VL 70B κ°μ λ©ν°λͺ¨λ¬ λͺ¨λΈμμ 5090μ μΌλ§λ λ λΉ λ₯Έκ°μ?
μ μ¬νκ² 20~25% ν₯μλ©λλ€. λ©ν°λͺ¨λ¬ μ°μ°λ μ¬μ ν λ©λͺ¨λ¦¬ λ°μ΄λμ΄λ―λ‘ 5090μ λμν μ°μκ° λμμ΄ λμ§λ§, κ·Ήμ μΈ μ°¨μ΄λ μλλλ€.
μΆμ²
- NVIDIA RTX 5090 λ° 4090 곡μ μ¬μ: CUDA μ½μ΄, TFLOPS, λ©λͺ¨λ¦¬ λμν
- MLCommons MLPerf μΆλ‘ λ²€μΉλ§ν¬: LLaMA 70B λ° Mistral λͺ¨λΈμ ν ν° μμ± μλ
- TechPowerUp GPU λ°μ΄ν°λ² μ΄μ€: RTX 5090 vs. 4090 μ λ ₯ μλΉ λ° λ©λͺ¨λ¦¬ λμν λΉκ΅