λΉ λ₯Έ μ¬μ€ μ 리
- μΆλ‘ μ΅κ°: Llama 3.3 7B β MATH λ²€μΉλ§ν¬ 82%, HumanEval 73%
- μ§μ μν μ΅κ°: Mistral Small β μ§μ μν λ²€μΉλ§ν¬ 92%
- λ€κ΅μ΄ μ΅κ°: Qwen3 7B β μ€κ΅μ΄, μΌλ³Έμ΄, μλμ΄λ₯Ό ν¬ν¨ν 27κ° μΈμ΄
- νμ VRAM: μΈ κ°μ§ μ΅μμ λͺ¨λΈ λͺ¨λ 8GB(Q4 μμν)
- μλ: RTX 3060 12GBμμ μΈ λͺ¨λΈ λͺ¨λ μ΄λΉ μ½ 15 ν ν°
- μμ°ν μ ν: Phi 2.7B β 4GB VRAM, μ΄λΉ 20 ν ν°, μμ΄ μ μ©
Key Takeaways
- Llama 3.3 7B: μΆλ‘ μ΅κ°. MATH 82%, HumanEval 73%. Meta 곡μ λͺ¨λΈ, κ΄λ²μν μ§μ.
- Mistral Small: μ§μ μν μ΅κ°(92%). μ΄λΉ 16 ν ν°. μ°½μ κΈμ°κΈ°μ νμ.
- Qwen3 7B: λ€κ΅μ΄ μ΅κ° β μ€κ΅μ΄, μλμ΄, λ¬μμμ΄λ₯Ό ν¬ν¨ν 27κ° μΈμ΄ μ§μ.
- μΈ λͺ¨λΈ λͺ¨λ RTX 3060 12GBμμ μ΄λΉ μ½ 15 ν ν°. μλλ κ±°μ λμΌνλ―λ‘ κΈ°λ₯μ λ°λΌ μ ννμμμ€.
- μΆλ‘ (μν, λ Όλ¦¬): Llama 3.3(82%) > Qwen3(79%) > Mistral(75%).
- μ°½μ κΈμ°κΈ°: Mistral > Llama 3.3 > Qwen3.
- μ½λ©: Llama 3.3 > Qwen3 > Mistral.
μ΄λ€ 7B λͺ¨λΈμ΄ κ°μ₯ λ°μ΄λ μ±λ₯ μ¬μμ κ°μΆκ³ μμ΅λκΉ?
| μ§ν | Llama 3.3 7B | Mistral Small | Qwen3 7B | Phi 2.7B |
|---|---|---|---|---|
| νμ VRAM | 8GB | 8GB | 8GB | 4GB |
| ν ν°/μ΄ (RTX 3060) | 15 | 16 | 15 | 20 |
| μΆλ‘ (MATH) | 82% | 75% | 79% | 45% |
| μ½λ (HumanEval) | 73% | 60% | 64% | 48% |
| μ§μ μν | 85% | 92% | 84% | 55% |
| λ€κ΅μ΄ μ§μ | μνΈ | μ νμ | μ°μ | μμ΄ μ μ© |
| λΌμ΄μ μ€ | μ€ν(Meta) | Apache 2.0 | μ€ν(Alibaba) | MIT |
Llama 3.3, Mistral, Qwen3λ₯Ό μ§μ λΉκ΅νλ©΄ μ΄λ»μ΅λκΉ?
Llama 3.3 7Bλ ꡬ쑰νλ μΆλ‘ μμ, Mistral Smallμ μ°½μμ μμ μΆλ ₯μμ, Qwen3 7Bλ κ°κ²°ν λ€κ΅μ΄ μλ΅μμ κ°κ° μ λλ₯Ό λ¬λ¦½λλ€.
μμ: μν λ¬Έμ "κΈ°μ°¨κ° 2μκ° λμ 100kmλ₯Ό μ΄λνλ€λ©΄ μλλ μΌλ§μ λκΉ?"
- Llama 3.3: "μλ = 거리 / μκ° = 100km / 2μκ° = 50km/h." νμ΄ κ³Όμ νμ β λλ²κΉ μ μ μ©ν©λλ€.
- Mistral: "2μκ°μ 100kmμ΄λ©΄ 50km/hμ λλ€." κ°κ²°νκ³ μ νν©λλ€.
- Qwen3: "κΈ°μ°¨λ 2μκ°μ 100kmλ₯Ό μ΄λνλ―λ‘ μλ = 50km/hμ λλ€." ꡬ쑰νλμ΄ μκ³ μ νν©λλ€.
μΈ λͺ¨λΈ λͺ¨λ μ νν λ΅μ μ 곡ν©λλ€. Llama 3.3μ μΆλ‘ λ¨κ³λ₯Ό 보μ¬μ£Όμ΄ μ½λ© λ° λΆμ μμ μ μ μ©ν©λλ€.
μμ: μ°½μ ν둬ννΈ "AIμ κ΄ν μ§§μ SF μμ€μ μμ±νμμμ€."
- Mistral: νλΆνκ³ λ§€λ ₯μ μΈ μμ¬, 300λ¨μ΄ μ΄μ. μ°½μ μμ μ κ°μ₯ κ°ν©λλ€.
- Llama 3.3: μ’μ μ΄μΌκΈ°, μ½κ° λ νμμ μΈ μ΄μ‘°. ꡬ쑰νλ λ¬Έμμ λ μ ν©ν©λλ€.
- Qwen3: μ’μ μ΄μΌκΈ°, μ½κ° λ μ§§μ. μΈμ΄ κ° μΌκ΄λ νμ§μ 보μ λλ€.
μΆλ‘ λ° μ½λ©μ κ°μ₯ μ ν©ν 7B λͺ¨λΈμ 무μμ λκΉ?
Llama 3.3 7Bκ° MATH 82%λ‘ 7B μΆλ‘ μ μ λν©λλ€. Qwen3 7Bλ 79%, Mistral Smallμ 75%λ₯Ό κΈ°λ‘ν©λλ€. Llama 3.3κ³Ό Mistral κ°μ 9μ μ°¨μ΄λ μ½λ© λ° μν μμ μμ μλ―Έ μλ μ°¨μ΄μ λλ€.
μΈ κ°μ§ 7B λͺ¨λΈ λͺ¨λ 13B μ΄μ λͺ¨λΈμ λΉν΄ λ€λ¨κ³ μΆλ‘ μμ μ΄λ €μμ κ²ͺμ΅λλ€. λν λͺ¨λΈ λΉκ΅λ μ½λ©μ μν μ΅κ³ μ λ‘컬 LLM κ°μ΄λλ₯Ό μ°Έκ³ νμμμ€.
Mistral Smallμ μν(75%)μμ μ½νμ§λ§ 볡μ‘ν λ€λ¨κ³ μ§μ μνμλ νμν©λλ€.
Qwen3 7Bλ λ μμ λͺ¨λ κ· ν μ‘ν μ±λ₯μ 보μ λλ€(μν μ½ 79%, μ§μ μν 84%). λ€μν μν¬λ‘λμ μ ν©ν λ§λ₯ λͺ¨λΈμ λλ€.
μ½λ© μΈν°λ·° λ° μ½λ μμ±: Llama 3.3 7B > Qwen3 > Mistral.
μ±λ΄ λ° μ΄μμ€ν΄νΈ μ ν리μΌμ΄μ : Mistral > Llama 3.3 > Qwen3.
κ°μ₯ λ§μ μΈμ΄λ₯Ό μ§μνλ 7B λͺ¨λΈμ 무μμ λκΉ?
Qwen3 7Bλ 27κ° μΈμ΄λ₯Ό μ§μν©λλ€ β 7B ν΄λμ€μμ λͺ νν λ€κ΅μ΄ μ λ λͺ¨λΈμ λλ€. Llama 3.3 7Bλ ννν λ€κ΅μ΄ λ₯λ ₯μ κ°μΆκ³ μμ΅λλ€. Mistral Smallμ μ£Όλ‘ μμ΄μ μ΅μ νλμ΄ μμ΅λλ€.
- Qwen3 7B (Alibaba): μ€κ΅μ΄(νμ€μ΄/κ΄λ₯μ΄), μΌλ³Έμ΄, νκ΅μ΄, μλμ΄, λ¬μμμ΄λ₯Ό ν¬ν¨ν 27κ° μΈμ΄. λ€κ΅μ΄μ μ€μ μ λκ³ 7μ‘° ν ν°μΌλ‘ νμ΅λμμ΅λλ€.
- Llama 3.3 7B (Meta): μμ λ½ μΈμ΄μ μ ν©ν©λλ€. Qwen3μ λΉν΄ CJK(μ€κ΅μ΄/μΌλ³Έμ΄/νκ΅μ΄)λ μλμ μΌλ‘ μ½ν©λλ€.
- Mistral Small: μ£Όλ‘ μμ΄. νλμ€μ΄/λ μΌμ΄/μ€νμΈμ΄λ μμ© κ°λ₯νμ§λ§, μμμμ΄ λλ μλμ΄ μμ μλ κΆμ₯νμ§ μμ΅λλ€.
- μμ΄ μ μ©(λ€κ΅μ΄ μ©λμ λΆμ ν©): Phi 2.7B, Stablelm 3B.
- μ½λ μ μ© λ³ν: Qwen3-Coder 7Bλ μ½λ μμ±μμ μΌλ° 7B λͺ¨λΈμ λ₯κ°ν©λλ€. μ½λ©μ μν μ΅κ³ μ λ‘컬 LLMμ μ°Έκ³ νμμμ€.
- λλ©μΈ νμΈνλ: μλ£ λΆμΌλΌλ©΄ BioLlamaλ₯Ό μ¬μ©νμμμ€. λ²λ₯ λΆμΌλΌλ©΄ Legalbench κΈ°λ° νμΈνλ λ³νμ μ¬μ©νμμμ€.
4GB VRAM λ―Έλ§μ μ΅κ³ μμ°ν λμμ 무μμ λκΉ?
8GB VRAMμ΄ μλ€λ©΄ 7B λͺ¨λΈμ μ¬μ©νμμμ€ β 4GBκ° μ λμ μΈ νκ³κ° μλ μ΄μ Phi 2.7Bλ TinyLlamaλ‘ λ€μ΄κ·Έλ μ΄λνμ§ λ§μμμ€.
Phi 2.7B (Microsoft): 4GB VRAM, μ΄λΉ 20 ν ν°. 2.7B κ·λͺ¨μΉκ³ λλΌμΈ λ§νΌ μ λ₯ν©λλ€ β MATH 45%, μ§μ μν 55%. λ¨μ : μμ΄ μ μ©, μΆλ‘ μ½ν¨. μμν μ μΆ©μ λν΄μλ Q4 vs Q8 λΉκ΅λ₯Ό μ°Έκ³ νμμμ€.
Stablelm 3B: κΆμ₯νμ§ μμ΅λλ€. μΆλ‘ λ° μ§μ μνμ΄ μ½ν©λλ€(μ½ 50%). Phi 2.7B λλΉ μ₯μ μ΄ μμ΅λλ€.
TinyLlama 1.1B: μ΄μν κ³ μ λͺ¨λΈ. λ¨μ λΆλ₯ λλ ν€μλ μΆμΆ μ©λμλ§ μ ν©ν©λλ€.
κ²°λ‘ : 8GB VRAMμ μ¬μ©ν μ μλ€λ©΄ 2.7B λͺ¨λΈλ³΄λ€ νμ 7B λͺ¨λΈ(Llama 3.3, Mistral λλ Qwen3)μ μ ννμμμ€. νμ§ μ°¨μ΄λ μλΉν©λλ€.
μ§μλ³ κ³ λ € μ¬ν
μ λ½ μ¬μ©μ(GDPR): Llama 3.3 7B λλ Mistral Smallμ λ‘μ»¬λ‘ μ€ννλ©΄ λ°μ΄ν° μΈλΆ μ μ‘μ΄ μ ν λ°μνμ§ μμ΅λλ€ β μΆλ‘ μ΄ μμ μ κΈ°κΈ° λ΄μμ μκ²°λ©λλ€. μ΄λ GDPR μ 5μ‘° μ 1ν (f)μ λ°μ΄ν° λ¬΄κ²°μ± μ건μ 곡κΈμ 체μ λ°μ΄ν° μ²λ¦¬ κ³μ½ μμ΄ μΆ©μ‘±ν©λλ€.
μμμ μΈμ΄ μ¬μ©μ: Qwen3 7Bκ° λͺ νν μ νμ λλ€. Alibabaλ 27κ° μΈμ΄μ κ±Έμ³ 7μ‘° ν ν°μΌλ‘ μ΄ λͺ¨λΈμ νμ΅μμΌ°μΌλ©°, μ€κ΅μ΄, μΌλ³Έμ΄, νκ΅μ΄μμ λ°μ΄λ μ±λ₯μ λ°νν©λλ€.
κΈ°μ λΌμ΄μ μ€: Mistral Smallμ Apache 2.0μ μ¬μ©ν©λλ€ β μ ν μλ μμ μ μ΄μ©μ΄ κ°λ₯ν©λλ€. Llama 3.3 7Bλ Metaμ μμ λΌμ΄μ μ€λ₯Ό μ¬μ©νλ©°, μκ° νμ± μ¬μ©μ 7μ΅ λͺ μ μ΄κ³Όνλ λ°°ν¬μλ λ³λ κ³μ½μ΄ νμν©λλ€.
7B λͺ¨λΈ μ ν μ νν μ€μ
- 1λͺ¨λ 7B λͺ¨λΈμ΄ λμΌνλ€κ³ κ°μ νλ κ² β Llama 3.3 7Bλ MATHμμ 82%λ₯Ό κΈ°λ‘νλ λ°λ©΄ Mistralμ 75%μ λλ€. 9μ μ°¨μ΄λ μ½λ© λ° μΆλ‘ μμ μμ μ μλ―Έν©λλ€.
- 2Phi 2.7Bλ₯Ό 7Bμ λλ±νκ² μ·¨κΈνλ κ² β Phi 2.7Bλ λλΆλΆμ λ²€μΉλ§ν¬μμ 7B μ νλμ μ½ 60%λ₯Ό κΈ°λ‘ν©λλ€. 4GB VRAMμ λ§μΆ μ μμ§λ§ νμ§ μ μΆ©μ μ€μ λ‘ μ‘΄μ¬ν©λλ€.
- 3μ¬λ¬ 7B λͺ¨λΈμ λμμ μ€ννκΈ° μν΄ Q2 μμνλ₯Ό μ¬μ©νλ κ² β Q2λ νμ§μ μ½ 30% μ νμν΅λλ€. Q2λ‘ λ κ°λ₯Ό μ€ννλ κ²λ³΄λ€ Q4λ‘ 7B λͺ¨λΈ νλλ₯Ό μ€ννλ κ²μ΄ λ«μ΅λλ€.
FAQ
μ΄λ€ 7B λͺ¨λΈμ μ νν΄μΌ ν©λκΉ?
μ½λ©, μν, λΆμ μμ μλ Llama 3.3 7Bλ₯Ό μ¬μ©νμμμ€(MATH 82%, HumanEval 73%). μ°½μ κΈμ°κΈ°, μ±ν , μ§μ μνμλ Mistral Smallμ μ¬μ©νμμμ€(μ§μ μν λ²€μΉλ§ν¬ 92%). μ€κ΅μ΄, μΌλ³Έμ΄, λ μΌμ΄, μλμ΄μ κ±Έμ³ λ€κ΅μ΄ μ§μμ΄ νμν κ²½μ°μλ Qwen3 7Bλ₯Ό μ ννμμμ€.
Llama 3.3 7Bλ μ΄μ λ²μ λ³΄λ€ μ°μν©λκΉ?
μ. Llama 3.3 7Bλ μ΄μ λ²μ λλΉ μΆλ‘ λ° μ½λ λ²€μΉλ§ν¬μμ μ½ 15% λμ μ μλ₯Ό κΈ°λ‘ν©λλ€. Llama 3.3μ 128K μ΄ν ν ν¬λμ΄μ , 8K 컨ν μ€νΈ μλμ°, κ°μ λ νμ΅ λ°μ΄ν°λ₯Ό μ¬μ©ν©λλ€. μ΄μ λ²μ μ μ κ· νλ‘μ νΈμμ λ μ΄μ μ¬μ©νμ§ λ§μμμ€.
16GB VRAMμΌλ‘ 7B λͺ¨λΈ λ κ°λ₯Ό μ€νν μ μμ΅λκΉ?
μ. Ollamaλ μ¬λ¬ λͺ¨λΈμ μμ°¨μ λ‘λλ₯Ό μ§μν©λλ€. 16GB VRAMμμλ κ° μ½ 4.5GBκ° νμνλ―λ‘ Q4 μμν 7B λͺ¨λΈ λ κ°λ₯Ό μ€νν μ μμ΅λλ€. κ° λͺ¨λΈμ λ 립μ μΌλ‘ μ΄λΉ μ½ 15 ν ν°μΌλ‘ λμνλ©° λ³λ ¬ μ€νμ μ§μνμ§ μμ΅λλ€.
Llama 3.3 7Bλ₯Ό μ¬μ©ν΄μΌ ν©λκΉ, μλλ©΄ 13B λͺ¨λΈλ‘ μ κ·Έλ μ΄λν΄μΌ ν©λκΉ?
μ½λ© λ° μΆλ‘ μ κ²½μ° Llama 3.3 13B(λλ Qwen3-Coder 14B)λ‘ μ κ·Έλ μ΄λνλ©΄ μ νλκ° 10β15% ν₯μλλ©° 16GB VRAMμ΄ νμν©λλ€. μ±ν λ° μ°½μ κΈμ°κΈ°μ κ²½μ° 8GBμ Llama 3.3 7B λλ Mistral Smallλ‘ μΆ©λΆν©λλ€. λνν μμ μμμ νμ§ μ°¨μ΄λ λ―Έλ―Έν©λλ€.
컨ν μ€νΈ μλμ°κ° κ°μ₯ κΈ΄ 7B λͺ¨λΈμ 무μμ λκΉ?
2026λ 4μ κΈ°μ€, Llama 3.3 7B, Mistral Small, Qwen3 7B λͺ¨λ νμ€ Q4 λΉλμμ 8K ν ν° μ»¨ν μ€νΈ μλμ°λ₯Ό μ§μν©λλ€. λ κΈ΄ 컨ν μ€νΈ(32K+)μλ λν λͺ¨λΈμ΄ νμν©λλ€. Qwen3 72Bλ 128K ν ν°μ μ§μνμ§λ§ 40GB μ΄μμ VRAMμ΄ νμν©λλ€.
Llama 3.3, Mistral, Qwen3λ³΄λ€ μ°μν 7B λͺ¨λΈμ΄ μμ΅λκΉ?
2026λ 4μ κΈ°μ€, μ΄ μΈ λͺ¨λΈμ΄ 7B ν΄λμ€μ μ΅μ μ μ λλ€. κ° λͺ¨λΈμ μλ‘ λ€λ₯Έ μΉ΄ν κ³ λ¦¬μμ μ λλ₯Ό λ¬λ¦¬κ³ μμ΅λλ€: Llama 3.3μ μΆλ‘ (MATH 82%), Mistralμ μ§μ μν(92%), Qwen3λ λ€κ΅μ΄ μ§μ(27κ° μΈμ΄). Qwen3-Coder 7B λ± μ λ¬Ένλ λ³ν λͺ¨λΈμ μ½λ© λ²€μΉλ§ν¬μμ μΌλ° λͺ¨λΈμ λ₯κ°ν©λλ€.
μΆμ²
- Llama 3.3 Model Card β MATH, HumanEval, MTBench λ²€μΉλ§ν¬ (Meta AI, 2024)
- Mistral Small Technical Report β μ§μ μν λ° μΆλ‘ νκ° (Mistral AI, 2023)
- Qwen3 λ¬Έμ β λ€κ΅μ΄ μ§μ λ° λ²€μΉλ§ν¬ κ²°κ³Ό (Alibaba Cloud, 2024)
- Open LLM Leaderboard β MATH, HumanEval, μ§μ μμ μ κ±ΈμΉ 7B λͺ¨λΈ μ€μκ° μμ (HuggingFace)