Skip to main content
PromptQuorumPromptQuorum
Home/Local LLMs/2026๋…„ Qwen2-VL ๋กœ์ปฌ ์‹คํ–‰ ๋ฐฉ๋ฒ•: ๋ฌธ์„œ OCR ๋ฐ ๋น„์ „ ๊ฐ€์ด๋“œ
Advanced Techniques

2026๋…„ Qwen2-VL ๋กœ์ปฌ ์‹คํ–‰ ๋ฐฉ๋ฒ•: ๋ฌธ์„œ OCR ๋ฐ ๋น„์ „ ๊ฐ€์ด๋“œ

ยท11๋ถ„ ์ฝ๊ธฐยทBy Hans Kuepper ยท Founder of PromptQuorum, multi-model AI dispatch tool ยท PromptQuorum

VRAM์ด 8 GB์ธ ๋ชจ๋“  ๊ธฐ๊ธฐ์—์„œ `ollama pull qwen2-vl:7b`๋ฅผ ์‹คํ–‰ํ•˜๋ฉด ์ค‘๊ตญ์–ด, ์ผ๋ณธ์–ด, ํ˜ผํ•ฉ ์–ธ์–ด ๋ฌธ์„œ๋ฅผ ๋กœ์ปฌ์—์„œ ์ฝ์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. Qwen2-VL์€ ๋‹ค๊ตญ์–ด OCR์— ๊ฐ€์žฅ ๊ฐ•๋ ฅํ•œ ์˜คํ”ˆ ๋น„์ „ ๋ชจ๋ธ๋กœ, ๋ชจ๋“  ์ด๋ฏธ์ง€๊ฐ€ ํด๋ผ์šฐ๋“œ์— ์—…๋กœ๋“œ๋˜์ง€ ์•Š๊ณ  ์‚ฌ์šฉ์ž ๊ธฐ๊ธฐ์—์„œ ์ฒ˜๋ฆฌ๋ฉ๋‹ˆ๋‹ค.

Qwen2-VL์€ Alibaba์˜ ์˜คํ”ˆ ๋น„์ „-์–ธ์–ด ๋ชจ๋ธ๋กœ, 7B ๋ณ€ํ˜•์€ Ollama ๋˜๋Š” LM Studio๋ฅผ ํ†ตํ•ด ์•ฝ 6 GB์˜ VRAM์œผ๋กœ ๋กœ์ปฌ์—์„œ ์‹คํ–‰๋ฉ๋‹ˆ๋‹ค. ๋ฌธ์„œ, ์Šคํฌ๋ฆฐ์ƒท, ์ฐจํŠธ, ์‚ฌ์ง„์„ ์ฝ์„ ์ˆ˜ ์žˆ์œผ๋ฉฐ, ์ค‘๊ตญ์–ดยท์ผ๋ณธ์–ดยทํ•œ๊ตญ์–ด OCR์—์„œ ๋‹ค๋ฅธ ๋ชจ๋“  ๋กœ์ปฌ ๋น„์ „ ๋ชจ๋ธ์„ ์•ž์„ญ๋‹ˆ๋‹ค. ์ด ๊ฐ€์ด๋“œ๋Š” ๋ชจ๋ธ ์„ ํƒ, ํ•˜๋“œ์›จ์–ด, Ollama ๋ฐ LM Studio ์„ค์ •, ๋‹ค๊ตญ์–ด ๋ฌธ์„œ ์ถ”์ถœ, ๊ทธ๋ฆฌ๊ณ  Qwen2-VL๊ณผ LLaVA ๋ฐ Llama 3.2 Vision์˜ ๋น„๊ต๋ฅผ ๋‹ค๋ฃน๋‹ˆ๋‹ค.

Key Takeaways

  • Qwen2-VL 7B๋Š” Ollama๋ฅผ ํ†ตํ•ด ์•ฝ 6 GB์˜ VRAM (Q4)์œผ๋กœ ๋กœ์ปฌ ์‹คํ–‰ ๊ฐ€๋Šฅ โ€” `ollama pull qwen2-vl:7b` ๋ช…๋ น ํ•˜๋‚˜๋กœ ์‹คํ–‰๋˜๋ฉฐ ๋ชจ๋ธ ๋ณ€ํ™˜์ด ํ•„์š” ์—†์Šต๋‹ˆ๋‹ค.
  • ๋‹ค๊ตญ์–ด OCR์— ์ตœ์ ์ธ ๋กœ์ปฌ ๋ชจ๋ธ: Qwen2-VL์€ MiniCPM-V 2.6๊ณผ ๋™๋“ฑํ•˜๋ฉฐ, ์ค‘๊ตญ์–ดยท์ผ๋ณธ์–ดยทํ•œ๊ตญ์–ด ํ…์ŠคํŠธ์—์„œ LLaVA 1.6 ๋ฐ Llama 3.2 Vision 11B๋ฅผ ๋Šฅ๊ฐ€ํ•ฉ๋‹ˆ๋‹ค.
  • 4096ร—4096๊นŒ์ง€ ๋„ค์ดํ‹ฐ๋ธŒ ํ•ด์ƒ๋„ ์ง€์› โ€” LLaVA 1.6 (672ร—672) ๋˜๋Š” Llama 3.2 Vision (1120ร—1120)๊ณผ ๋‹ฌ๋ฆฌ ๋‹ค์šด์ƒ˜ํ”Œ๋ง ์—†์ด ๊ณ ํ•ด์ƒ๋„ ์Šค์บ”์„ ์ฝ์Šต๋‹ˆ๋‹ค.
  • ์„ธ ๊ฐ€์ง€ ํฌ๊ธฐ: 2B (~3 GB VRAM, ๋น ๋ฅด๊ณ  ๊ธฐ๋ณธ์ ), 7B (~6 GB, ๋Œ€๋ถ€๋ถ„์˜ ์‚ฌ์šฉ์ž์—๊ฒŒ ๊ถŒ์žฅ), 72B (~48 GB, ์˜คํ”ˆ ์†Œ์Šค ๋ฒค์น˜๋งˆํฌ ์ตœ์ƒ์œ„).
  • ์š”์ฒญ๋‹น ์ตœ๋Œ€ 8๊ฐœ์˜ ์ด๋ฏธ์ง€ ์ฒ˜๋ฆฌ โ€” ๋กœ์ปฌ ๋น„์ „ ๋ชจ๋ธ ์ค‘ ๊ฐ€์žฅ ๋†’์€ ๋‹ค์ค‘ ์ด๋ฏธ์ง€ ์ฒ˜๋ฆฌ ์šฉ๋Ÿ‰.
  • ์ง์ ‘ PDF ์ž…๋ ฅ ๋ถˆ๊ฐ€: PDF ํŽ˜์ด์ง€๋ฅผ PNG ๋˜๋Š” JPEG๋กœ ๋จผ์ € ๋ณ€ํ™˜ํ•œ ํ›„ ๊ฐ ํŽ˜์ด์ง€๋ฅผ ๋ณ„๋„ ์ด๋ฏธ์ง€๋กœ ์ „์†กํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.
  • ๋‹ค์šด๋กœ๋“œ ํ›„ 100% ์˜คํ”„๋ผ์ธ: API ํ‚ค ๋ถˆํ•„์š”, ํด๋ผ์šฐ๋“œ ์—…๋กœ๋“œ ์—†์Œ โ€” ๋ชจ๋“  ๋ฌธ์„œ๊ฐ€ ์‚ฌ์šฉ์ž ๊ธฐ๊ธฐ์— ๋ณด๊ด€๋˜์–ด GDPR ๋ฐ์ดํ„ฐ ์ „์†ก ๋ฒ”์œ„์—์„œ AI ๋ ˆ์ด์–ด๊ฐ€ ์ œ์™ธ๋ฉ๋‹ˆ๋‹ค.

Qwen2-VL์ด ๋‹ค๊ตญ์–ด OCR์—์„œ ๋กœ์ปฌ ๋น„์ „ ๋ชจ๋ธ์„ ์„ ๋„ํ•˜๋Š” ์ด์œ 

Qwen2-VL์€ ๋‹ค๊ตญ์–ด ๋ฌธ์„œ OCR์„ ์œ„ํ•œ ๊ฐ€์žฅ ๊ฐ•๋ ฅํ•œ ๋กœ์ปฌ ๋น„์ „ ๋ชจ๋ธ๋กœ, ์†Œ๋น„์ž ํ•˜๋“œ์›จ์–ด์—์„œ ์‹คํ–‰๋˜๋Š” ๋‹ค๋ฅธ ๋ชจ๋“  ๋ชจ๋ธ๊ณผ ๋™๋“ฑํ•˜๊ฑฐ๋‚˜ ๋Šฅ๊ฐ€ํ•˜์—ฌ ์ค‘๊ตญ์–ด, ์ผ๋ณธ์–ด, ํ•œ๊ตญ์–ด, ์˜์–ด ํ…์ŠคํŠธ๋ฅผ ์ฝ์Šต๋‹ˆ๋‹ค. Alibaba๋Š” ๋Œ€๊ทœ๋ชจ ๋‹ค๊ตญ์–ด ๋ฌธ์„œ ์ฝ”ํผ์Šค๋กœ ์ด ๋ชจ๋ธ์„ ํ›ˆ๋ จํ–ˆ๊ธฐ ๋•Œ๋ฌธ์— ๋น„์˜์–ด ํ…์ŠคํŠธ ์ถ”์ถœ์—์„œ LLaVA 1.6 ๋ฐ Llama 3.2 Vision 11B๋ฅผ ๋Šฅ๊ฐ€ํ•ฉ๋‹ˆ๋‹ค.

Qwen2-VL์€ ์ตœ๋Œ€ 4096ร—4096 ํ”ฝ์…€์˜ ๋™์  ์ž…๋ ฅ ํ•ด์ƒ๋„๋ฅผ ์ง€์›ํ•ฉ๋‹ˆ๋‹ค. LLaVA 1.6์€ 672ร—672, Llama 3.2 Vision์€ 1120ร—1120์œผ๋กœ ์ œํ•œ๋˜์–ด ๊ณ ํ•ด์ƒ๋„ ์Šค์บ”์„ ์ฝ๊ธฐ ์ „์— ๋‹ค์šด์ƒ˜ํ”Œ๋งํ•ฉ๋‹ˆ๋‹ค. Qwen2-VL์€ 300 DPI A4 ์Šค์บ”์„ ๋„ค์ดํ‹ฐ๋ธŒ ํ•ด์ƒ๋„๋กœ ์ฝ์–ด๋ƒ…๋‹ˆ๋‹ค โ€” ์ด๊ฒƒ์ด ๊ณ ๋ฐ€๋„ ๋ฌธ์„œ์™€ ์ž‘์€ CJK ๋ฌธ์ž์—์„œ OCR ์ •ํ™•๋„๊ฐ€ ๋” ๋†’์€ ์ฃผ๋œ ์ด์œ ์ž…๋‹ˆ๋‹ค.

Qwen2-VL์„ ๋กœ์ปฌ๋กœ ์‹คํ–‰ํ•˜๋Š” ๋น„์šฉ์€ ํ•˜๋“œ์›จ์–ด ์ดํ›„ ์ด๋ฏธ์ง€๋‹น โ‚ฌ0์ž…๋‹ˆ๋‹ค. ํด๋ผ์šฐ๋“œ ๋น„์ „ API๋Š” ์ด๋ฏธ์ง€๋‹น ์•ฝ $0.01โ€“0.03์„ ์ฒญ๊ตฌํ•˜๋ฉฐ, ์›” 10,000๊ฐœ์˜ ์ด๋ฏธ์ง€ ์ฒ˜๋ฆฌ ์‹œ $100โ€“300์„ ์ ˆ์•ฝํ•  ์ˆ˜ ์žˆ๊ณ , ์–ด๋–ค ๋ฌธ์„œ๋„ ๊ธฐ๊ธฐ๋ฅผ ๋ฒ—์–ด๋‚˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค.

CJK ํ…์ŠคํŠธ, ์ž‘์€ ํฐํŠธ, ๋˜๋Š” ๊ณ ํ•ด์ƒ๋„ ์Šค์บ”์ด ํฌํ•จ๋œ ๋ฌธ์„œ๊ฐ€ ์žˆ๋‹ค๋ฉด Qwen2-VL์„ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค. ์˜์–ด ์ „์šฉ ์‚ฌ์ง„ Q&A๋ผ๋ฉด Llama 3.2 Vision 11B๋„ ๋™๋“ฑํ•˜๊ฒŒ ์ข‹์€ ์„ ํƒ์ž…๋‹ˆ๋‹ค.

Qwen2-VL์€ Ollama๋ฅผ ํ†ตํ•ด ์•ฝ 6 GB์˜ VRAM์œผ๋กœ ์‹คํ–‰๋˜๋Š” ์ค‘๊ตญ์–ด, ์ผ๋ณธ์–ด, ํ•œ๊ตญ์–ด ๋ฌธ์„œ OCR์— ๊ฐ€์žฅ ์ •ํ™•ํ•œ ๋กœ์ปฌ ๋น„์ „ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค.

๋น„์ „-์–ธ์–ด ๋ชจ๋ธ์€ ์ด๋ฏธ์ง€๋ฅผ ์ƒ์„ฑํ•˜๋Š” ๋Œ€์‹  ์ด๋ฏธ์ง€๋ฅผ ์ฝ์Šต๋‹ˆ๋‹ค. Qwen2-VL์— ์‚ฌ์ง„์ด๋‚˜ ์Šค์บ”๋œ ํŽ˜์ด์ง€๋ฅผ ์ œ๊ณตํ•˜๋ฉด ํ…์ŠคํŠธ๋ฅผ ๋ฐ˜ํ™˜ํ•ฉ๋‹ˆ๋‹ค โ€” ์„ค๋ช…, ๋‹ต๋ณ€, ๋˜๋Š” ์ถ”์ถœ๋œ ๋‚ด์šฉ์„.

Qwen2-VL ๋ชจ๋ธ ํฌ๊ธฐ ์„ ํƒ

Qwen2-VL์€ ์„ธ ๊ฐ€์ง€ ํฌ๊ธฐ๋กœ ์ œ๊ณต๋ฉ๋‹ˆ๋‹ค. VRAM๊ณผ ํ•„์š”ํ•œ ์ •ํ™•๋„์— ๋”ฐ๋ผ ์„ ํƒํ•˜์‹ญ์‹œ์˜ค. ๋ชจ๋“  ํฌ๊ธฐ๋Š” Hugging Face (Qwen)๊ณผ ๋ช…์‹œ์  ํƒœ๊ทธ๊ฐ€ ์žˆ๋Š” Ollama ๋ชจ๋ธ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์—์„œ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

ModelVRAM (Q4)Ollama tagBest For
Qwen2-VL 2B Q4~3 GBqwen2-vl:2b๋น ๋ฅธ ์บก์…˜, ๊ฐ„๋‹จํ•œ OCR, ์ € VRAM ๋…ธํŠธ๋ถ
Qwen2-VL 7B Q4~6 GBqwen2-vl:7b๊ถŒ์žฅ โ€” ๋ฌธ์„œ OCR, ์ด๋ฏธ์ง€ Q&A, ์ฐจํŠธ
Qwen2-VL 72B Q4~48 GBqwen2-vl:72b์ตœ๊ณ  ํ’ˆ์งˆ, Apple Silicon 64 GB ์ด์ƒ ๋˜๋Š” ๋ฉ€ํ‹ฐ GPU

Q4_K_M์€ ๊ถŒ์žฅ ์–‘์žํ™”๋กœ ์ตœ๊ณ ์˜ ํ’ˆ์งˆ ๋Œ€ ํฌ๊ธฐ ๋น„์œจ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ๋Œ€๋ถ€๋ถ„์˜ ์‚ฌ์šฉ์ž๋Š” Qwen2-VL 7B๋กœ ์‹œ์ž‘ํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค: 8 GB GPU์— ๋งž์œผ๋ฉฐ ์ด ๊ฐ€์ด๋“œ์˜ ๋ชจ๋“  ์‚ฌ์šฉ ์‚ฌ๋ก€๋ฅผ ์ฒ˜๋ฆฌํ•ฉ๋‹ˆ๋‹ค. VRAM์ด 6 GB ๋ฏธ๋งŒ์ธ ๊ฒฝ์šฐ์—๋งŒ 2B ๋ชจ๋ธ๋กœ ๋‚ด๋ ค๊ฐ€์‹ญ์‹œ์˜ค. Q4๊ฐ€ ํ’ˆ์งˆ์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ์— ๋Œ€ํ•ด์„œ๋Š” LLM ์–‘์žํ™” ์„ค๋ช…์„ ์ฐธ์กฐํ•˜์‹ญ์‹œ์˜ค.

Qwen2-VL ํ•˜๋“œ์›จ์–ด ์š”๊ตฌ ์‚ฌํ•ญ

  • ์ตœ์†Œ ์‚ฌ์–‘ (Qwen2-VL 7B Q4): 8 GB VRAM GPU โ€” NVIDIA RTX 4060, RTX 3060 12 GB, ๋˜๋Š” RTX 2080.
  • ์ € VRAM ์˜ต์…˜ (Qwen2-VL 2B Q4): 4 GB VRAM โ€” ๋Œ€๋ถ€๋ถ„์˜ ๋…ธํŠธ๋ถ GPU ๋ฐ ํ†ตํ•ฉ Apple Silicon์—์„œ ์‹คํ–‰ ๊ฐ€๋Šฅ.
  • ์ตœ๊ณ  ํ’ˆ์งˆ (Qwen2-VL 72B Q4): ~48 GB โ€” 64 GB ์ด์ƒ ํ†ตํ•ฉ ๋ฉ”๋ชจ๋ฆฌ์˜ Apple Silicon, ๋˜๋Š” 24 GB GPU ๋‘ ๊ฐœ.
  • Apple Silicon: 16 GB ์ด์ƒ ํ†ตํ•ฉ ๋ฉ”๋ชจ๋ฆฌ์˜ M ์‹œ๋ฆฌ์ฆˆ ์นฉ์€ 7B ๋ชจ๋ธ์„ ์›ํ™œํžˆ ์‹คํ–‰; 72B์—๋Š” 64 GB ์ด์ƒ ํ•„์š”.
  • ์‹œ์Šคํ…œ RAM: GPU ์ถ”๋ก ๊ณผ ํ•จ๊ป˜ ์ตœ์†Œ 16 GB; ์ „์ฒด ๊ฐœ๋ฐœ ํ™˜๊ฒฝ์ด ์—ด๋ ค ์žˆ์„ ๋•Œ 32 GB ๊ถŒ์žฅ.
  • ์ €์žฅ ๊ณต๊ฐ„: Qwen2-VL 7B Q4 (GGUF)์šฉ ์•ฝ 6 GB, 72B์šฉ ์•ฝ 30 GB์˜ ์—ฌ์œ  ๋””์Šคํฌ ๊ณต๊ฐ„.

๐Ÿ“ŒNote: ๋น„์ „ ๋ชจ๋ธ์€ ๋™์ผํ•œ ํŒŒ๋ผ๋ฏธํ„ฐ ์ˆ˜์˜ ํ…์ŠคํŠธ ์ „์šฉ ๋ชจ๋ธ๋ณด๋‹ค ์•ฝ 30โ€“60% ๋А๋ฆฌ๊ฒŒ ์‹คํ–‰๋ฉ๋‹ˆ๋‹ค. ๋น„์ „ ์ธ์ฝ”๋”๋Š” ์ฒซ ๋ฒˆ์งธ ํ† ํฐ์—์„œ ์ „์ฒด ์ด๋ฏธ์ง€๋ฅผ ์ฒ˜๋ฆฌํ•˜๋ฉฐ, ์ดํ›„ ํ…์ŠคํŠธ๋Š” ๊ฑฐ์˜ ์ •์ƒ ์†๋„๋กœ ์ƒ์„ฑ๋ฉ๋‹ˆ๋‹ค. ์ธ์ฝ”๋”์™€ ์–ธ์–ด ๋ชจ๋ธ ๋ชจ๋‘๋ฅผ ์œ„ํ•œ VRAM์„ ํ™•๋ณดํ•˜์‹ญ์‹œ์˜ค.

Ollama๋กœ Qwen2-VL ์„ค์ •

Ollama๋Š” Qwen2-VL์„ ๋กœ์ปฌ๋กœ ์‹คํ–‰ํ•˜๋Š” ๊ฐ€์žฅ ๋น ๋ฅธ ๋ฐฉ๋ฒ•์ž…๋‹ˆ๋‹ค. ๋ชจ๋ธ์„ ๋‹ค์šด๋กœ๋“œํ•˜๊ณ , ์–‘์žํ™”๋ฅผ ๊ด€๋ฆฌํ•˜๋ฉฐ, localhost:11434์— API๋ฅผ ๋…ธ์ถœํ•ฉ๋‹ˆ๋‹ค. ollama.com์—์„œ ์„ค์น˜ํ•˜๊ฑฐ๋‚˜, ์ฒ˜์Œ ์‚ฌ์šฉํ•˜์‹œ๋Š” ๊ฒฝ์šฐ Ollama ์„ค์น˜ ๋ฐฉ๋ฒ•์—์„œ ์‹œ์ž‘ํ•˜์‹ญ์‹œ์˜ค.

  1. 1
    Ollama ์„ค์น˜
    Why it matters: Ollama๋Š” ๋ชจ๋ธ ๋‹ค์šด๋กœ๋“œ, GGUF ํ˜•์‹, ๋กœ์ปฌ API๋ฅผ ์ฒ˜๋ฆฌํ•ฉ๋‹ˆ๋‹ค. macOS, Linux, Windows์—์„œ ์‚ฌ์šฉ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.
  2. 2
    ๋ช…์‹œ์  ํฌ๊ธฐ ํƒœ๊ทธ๋กœ Qwen2-VL ๋‹ค์šด๋กœ๋“œ
    Why it matters: qwen2-vl:7b๋ฅผ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค. ํƒœ๊ทธ ์—†๋Š” qwen2-vl์€ ๋‹ค๋ฅธ ํฌ๊ธฐ๋กœ ํ•ด์„๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค โ€” ํ•ญ์ƒ 2b, 7b, ๋˜๋Š” 72b๋ฅผ ์ง€์ •ํ•˜์—ฌ ์ด ๊ฐ€์ด๋“œ์—์„œ ๋Œ€์ƒ์œผ๋กœ ํ•˜๋Š” ๋ชจ๋ธ์„ ๋ฐ›์œผ์‹ญ์‹œ์˜ค.
  3. 3
    ๋ชจ๋ธ ์‹คํ–‰ ๋ฐ ์ด๋ฏธ์ง€ ์ฒจ๋ถ€
    Why it matters: ๋Œ€ํ™”ํ˜• ๋ชจ๋“œ์—์„œ ํ”„๋กฌํ”„ํŠธ์— ์ด๋ฏธ์ง€ ํŒŒ์ผ ๊ฒฝ๋กœ๋ฅผ ์ž…๋ ฅํ•˜์‹ญ์‹œ์˜ค. Ollama๊ฐ€ ๊ฒฝ๋กœ๋ฅผ ๊ฐ์ง€ํ•˜์—ฌ ์ด๋ฏธ์ง€๋ฅผ ๋น„์ „ ์ธ์ฝ”๋”์— ๋กœ๋“œํ•ฉ๋‹ˆ๋‹ค.
  4. 4
    API๋ฅผ ํ†ตํ•œ ์ด๋ฏธ์ง€ ์ „์†ก
    Why it matters: /api/generate ์—”๋“œํฌ์ธํŠธ๋Š” base64๋กœ ์ธ์ฝ”๋”ฉ๋œ images ๋ฐฐ์—ด์„ ์ˆ˜์‹ ํ•ฉ๋‹ˆ๋‹ค. ์ด๊ฒƒ์ด ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜ โ€” ๋ฐ PromptQuorum โ€” ์ด ์ด๋ฏธ์ง€๋ฅผ ํ”„๋กœ๊ทธ๋ž˜๋ฐ ๋ฐฉ์‹์œผ๋กœ ์ „์†กํ•˜๋Š” ๋ฐฉ๋ฒ•์ž…๋‹ˆ๋‹ค.
  5. 5
    ๋‹ค๊ตญ์–ด OCR ํ™•์ธ
    Why it matters: ์ค‘๊ตญ์–ด ๋˜๋Š” ์ผ๋ณธ์–ด ๋ฌธ์„œ ์Šค์บ”์„ ์ „์†กํ•˜๊ณ  ์ถ”์ถœ๋œ ํ…์ŠคํŠธ๊ฐ€ ์ผ์น˜ํ•˜๋Š”์ง€ ํ™•์ธํ•˜์‹ญ์‹œ์˜ค. ์ด๋ฅผ ํ†ตํ•ด ๋น„์ „ ์ธ์ฝ”๋”์™€ ํ† ํฌ๋‚˜์ด์ €๊ฐ€ CJK ์Šคํฌ๋ฆฝํŠธ๋ฅผ ์˜ฌ๋ฐ”๋ฅด๊ฒŒ ์ฒ˜๋ฆฌํ•˜๋Š”์ง€ ํ™•์ธํ•œ ํ›„ ๊ตฌ์ถ•์„ ์ง„ํ–‰ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
bash
# Step 1 โ€” Install Ollama
# macOS
brew install ollama

# Linux
curl -fsSL https://ollama.com/install.sh | sh

# Windows โ€” download from https://ollama.com/download

# Step 2 โ€” Pull Qwen2-VL 7B (explicit size tag)
ollama pull qwen2-vl:7b
# Downloads Qwen2-VL 7B Q4_K_M (~6 GB)

# Step 3 โ€” Run and attach an image (interactive)
ollama run qwen2-vl:7b
>>> Extract every line of text from ./invoice-jp.png

# Step 4 โ€” Send an image through the API
# Encode the image first:  base64 -i scan.png   (macOS)
curl http://localhost:11434/api/generate -d '{
  "model": "qwen2-vl:7b",
  "prompt": "Extract every line of text from this document. Preserve line breaks.",
  "images": ["<base64-encoded-image>"],
  "stream": false
}'

# Step 5 โ€” Verify multilingual OCR
ollama run qwen2-vl:7b
>>> Extract all text from this image: ./contract-zh.png

โš ๏ธWarning: ๋ฌธ์„œ ์ด๋ฏธ์ง€๋ฅผ 150 DPI ์ด์ƒ์œผ๋กœ ์ „์†กํ•˜์‹ญ์‹œ์˜ค. Qwen2-VL์€ 4096ร—4096๊นŒ์ง€ ๋„ค์ดํ‹ฐ๋ธŒ๋กœ ์ฝ์œผ๋ฏ€๋กœ ๊ณ ํ•ด์ƒ๋„ ์Šค์บ”์€ ์ง์ ‘์ ์œผ๋กœ ์ •ํ™•๋„๋ฅผ ํ–ฅ์ƒ์‹œํ‚ต๋‹ˆ๋‹ค. ํ…์ŠคํŠธ ํ”„๋กฌํ”„ํŠธ์™€ ๋‹ฌ๋ฆฌ ์ด๋ฏธ์ง€ ํ’ˆ์งˆ์ด OCR ๊ฒฐ๊ณผ์—์„œ ๊ฐ€์žฅ ์ค‘์š”ํ•œ ๋‹จ์ผ ์š”์†Œ์ž…๋‹ˆ๋‹ค โ€” ํ๋ฆฟํ•œ ์Šค์บ”์€ ๋ชจ๋ธ์ด ์•„๋ฌด๋ฆฌ ์ข‹์•„๋„ ์ž˜๋ชป๋œ ๋ฌธ์ž๋ฅผ ์ถœ๋ ฅํ•ฉ๋‹ˆ๋‹ค.

LM Studio๋กœ Qwen2-VL ์„ค์ •

LM Studio๋Š” CLI ๋ช…๋ น ์—†์ด ๊ทธ๋ž˜ํ”ฝ ์ธํ„ฐํŽ˜์ด์Šค๋ฅผ ํ†ตํ•ด Qwen2-VL์„ ์‹คํ–‰ํ•ฉ๋‹ˆ๋‹ค. Windows ์‚ฌ์šฉ์ž ๋ฐ GUI๋ฅผ ์„ ํ˜ธํ•˜๋Š” ๋ถ„๋“ค์—๊ฒŒ ๊ถŒ์žฅ๋˜๋Š” ๊ฒฝ๋กœ์ž…๋‹ˆ๋‹ค. lmstudio.ai์—์„œ ๋‹ค์šด๋กœ๋“œํ•˜๊ฑฐ๋‚˜, LM Studio ์„ค์น˜ ๋ฐฉ๋ฒ•์„ ์ฐธ์กฐํ•˜์‹ญ์‹œ์˜ค.

  1. 1
    LM Studio ๋‹ค์šด๋กœ๋“œ ๋ฐ ์„ค์น˜
    Why it matters: ๋กœ์ปฌ ๋ชจ๋ธ ์ถ”๋ก ์„ ์œ„ํ•œ ๋ฌด๋ฃŒ ํฌ๋กœ์Šค ํ”Œ๋žซํผ GUI. ํ„ฐ๋ฏธ๋„์ด ํ•„์š” ์—†์Šต๋‹ˆ๋‹ค.
  2. 2
    ๋ชจ๋ธ ๋ธŒ๋ผ์šฐ์ €์—์„œ Qwen2-VL ๊ฒ€์ƒ‰
    Why it matters: "Qwen2-VL 7B"๋ฅผ ๊ฒ€์ƒ‰ํ•˜๊ณ  Q4_K_M GGUF ๋นŒ๋“œ๋ฅผ ์„ ํƒํ•˜์‹ญ์‹œ์˜ค. LM Studio๋Š” ๋น„์ „ ์ง€์› ๋ชจ๋ธ์— ์ด๋ฏธ์ง€ ์•„์ด์ฝ˜์„ ํ‘œ์‹œํ•ฉ๋‹ˆ๋‹ค.
  3. 3
    ๋ชจ๋ธ ๋กœ๋“œ ๋ฐ ์ด๋ฏธ์ง€ ์ฒจ๋ถ€
    Why it matters: ์ฑ„ํŒ… ์ž…๋ ฅ์˜ ์ด๋ฏธ์ง€ ์•„์ด์ฝ˜์„ ํด๋ฆญํ•˜์—ฌ ์‚ฌ์ง„์ด๋‚˜ ์Šค์บ”์„ ์—…๋กœ๋“œํ•˜์‹ญ์‹œ์˜ค. LM Studio๊ฐ€ ์ด๋ฅผ ๋น„์ „ ์ธ์ฝ”๋”์— ์ „๋‹ฌํ•ฉ๋‹ˆ๋‹ค.
  4. 4
    ๋กœ์ปฌ ์„œ๋ฒ„ ์‹œ์ž‘
    Why it matters: "Start Server" ๋ฒ„ํŠผ์„ ๋ˆ„๋ฅด๋ฉด localhost:1234์— OpenAI ํ˜ธํ™˜ API๊ฐ€ ๋…ธ์ถœ๋ฉ๋‹ˆ๋‹ค. ๋น„์ „ ์š”์ฒญ์€ ํ‘œ์ค€ image_url ์ฝ˜ํ…์ธ  ํ˜•์‹์„ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค.
json
// LM Studio โ€” OpenAI-compatible vision request (localhost:1234)
{
  "model": "qwen2-vl-7b",
  "messages": [
    {
      "role": "user",
      "content": [
        { "type": "text", "text": "Extract all text from this document." },
        {
          "type": "image_url",
          "image_url": { "url": "data:image/png;base64,<base64-encoded-image>" }
        }
      ]
    }
  ]
}

์ค‘๊ตญ์–ด, ์ผ๋ณธ์–ด, ํ˜ผํ•ฉ ์–ธ์–ด ํŒŒ์ผ ๋ฌธ์„œ OCR

Qwen2-VL์€ ๋‹ค๋ฅธ ์–ด๋–ค ๋กœ์ปฌ ๋น„์ „ ๋ชจ๋ธ๋ณด๋‹ค ์ •ํ™•ํ•˜๊ฒŒ ์ค‘๊ตญ์–ด, ์ผ๋ณธ์–ด, ํ•œ๊ตญ์–ด, ํ˜ผํ•ฉ ์–ธ์–ด ๋ฌธ์„œ์—์„œ ํ…์ŠคํŠธ๋ฅผ ์ถ”์ถœํ•ฉ๋‹ˆ๋‹ค. ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์— ๋Œ€๊ทœ๋ชจ ๋‹ค๊ตญ์–ด ๋ฌธ์„œ ์ฝ”ํผ์Šค๊ฐ€ ํฌํ•จ๋˜์—ˆ์œผ๋ฉฐ, 4096ร—4096 ๋„ค์ดํ‹ฐ๋ธŒ ํ•ด์ƒ๋„๋Š” LLaVA 1.6๊ณผ Llama 3.2 Vision์ด ๋‹ค์šด์ƒ˜ํ”Œ๋ง์œผ๋กœ ๋†“์น˜๋Š” ์ž‘์€ CJK ๋ฌธ์ž๋ฅผ ์ฝ์–ด๋ƒ…๋‹ˆ๋‹ค.

๊ฐ€์žฅ ์‹ ๋ขฐํ•  ์ˆ˜ ์žˆ๋Š” ํŒจํ„ด์€ ๊ตฌ์ฒด์ ์ธ ์ถ”์ถœ ํ”„๋กฌํ”„ํŠธ์ž…๋‹ˆ๋‹ค. "์ด๊ฒƒ์„ ์ฝ์–ด๋ผ"์™€ ๊ฐ™์€ ๋ชจํ˜ธํ•œ ์š”์ฒญ ๋Œ€์‹  ๊ตฌ์กฐ๋ฅผ ์š”์ฒญํ•˜์‹ญ์‹œ์˜ค โ€” "ํ…Œ์ด๋ธ” ๋ ˆ์ด์•„์›ƒ ์œ ์ง€", "๊ฐ ํ•„๋“œ๋ฅผ key: value๋กœ ๋ฐ˜ํ™˜". Qwen2-VL์€ ์„œ์‹ ์ง€์‹œ๋ฅผ ๋ฉด๋ฐ€ํžˆ ๋”ฐ๋ฅด๋ฏ€๋กœ ํ›„์ฒ˜๋ฆฌ ์—†์ด๋„ ์ถœ๋ ฅ์„ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

Qwen2-VL๋กœ CJK ๋ฌธ์„œ์—์„œ ํ…์ŠคํŠธ๋ฅผ ์ถ”์ถœํ•˜๋ ค๋ฉด 150 DPI ์ด์ƒ์˜ ์ด๋ฏธ์ง€๋ฅผ "๊ฐ ํ•„๋“œ๋ฅผ key: value๋กœ ๋ฐ˜ํ™˜"๊ณผ ๊ฐ™์€ ๊ตฌ์กฐ๋ฅผ ์š”์ฒญํ•˜๋Š” ๊ตฌ์ฒด์ ์ธ ํ”„๋กฌํ”„ํŠธ์™€ ํ•จ๊ป˜ ์ „์†กํ•˜์‹ญ์‹œ์˜ค.

OCR์€ ํ…์ŠคํŠธ ์‚ฌ์ง„์„ ํŽธ์ง‘ ๊ฐ€๋Šฅํ•œ ํ…์ŠคํŠธ๋กœ ๋ณ€ํ™˜ํ•˜๋Š” ๊ฒƒ์„ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค. Qwen2-VL์€ ์Šค์บ”๋œ ํŽ˜์ด์ง€๋ฅผ ๋ณด๊ณ  ๋ณด์ด๋Š” ๊ฒƒ์„ ํƒ€์ดํ•‘ํ•˜๋ฉฐ, ์˜์–ด๋งŒํผ ์ค‘๊ตญ์–ด์™€ ์ผ๋ณธ์–ด ๋ฌธ์ž๋„ ์ž˜ ์ฒ˜๋ฆฌํ•ฉ๋‹ˆ๋‹ค.

  • ์ผ๋ฐ˜ ํ…์ŠคํŠธ ์ถ”์ถœ: "์ด ์ด๋ฏธ์ง€์˜ ๋ชจ๋“  ํ…์ŠคํŠธ ์ค„์„ ์ถ”์ถœํ•˜์‹ญ์‹œ์˜ค. ์ค„ ๋ฐ”๊ฟˆ๊ณผ ์ฝ๊ธฐ ์ˆœ์„œ๋ฅผ ์œ ์ง€ํ•˜์‹ญ์‹œ์˜ค."
  • ๊ตฌ์กฐํ™”๋œ ํ•„๋“œ: "์ด๊ฒƒ์€ ์ผ๋ณธ์–ด ์ฒญ๊ตฌ์„œ์ž…๋‹ˆ๋‹ค. ๊ณต๊ธ‰์—…์ฒด, ๋‚ ์งœ, ์†Œ๊ณ„, ์„ธ๊ธˆ, ํ•ฉ๊ณ„๋ฅผ key: value ์Œ์œผ๋กœ ๋ฐ˜ํ™˜ํ•˜์‹ญ์‹œ์˜ค."
  • ํ…Œ์ด๋ธ” ์ถ”์ถœ: "์ด ํ…Œ์ด๋ธ”์„ CSV๋กœ ์ถ”์ถœํ•˜์‹ญ์‹œ์˜ค. ์ฒซ ๋ฒˆ์งธ ํ–‰์„ ํ—ค๋”๋กœ ์ฒ˜๋ฆฌํ•˜์‹ญ์‹œ์˜ค."
  • ํ•œ ๋ฒˆ์— ์ถ”์ถœ ๋ฐ ๋ฒˆ์—ญ: "์ด ์ด๋ฏธ์ง€์—์„œ ์ค‘๊ตญ์–ด ํ…์ŠคํŠธ๋ฅผ ์ถ”์ถœํ•œ ํ›„ ์˜์–ด๋กœ ๋ฒˆ์—ญํ•˜์‹ญ์‹œ์˜ค. ๋‘˜ ๋‹ค ํ‘œ์‹œํ•˜์‹ญ์‹œ์˜ค."
bash
# Japanese invoice -> structured fields
ollama run qwen2-vl:7b
>>> This is a Japanese invoice. Extract vendor name, invoice date,
    subtotal, consumption tax, and total. Return as key: value pairs.
    ./invoice-jp.png

# Example output:
# vendor: Sample Trading Co., Ltd.
# date: 2026-04-30
# subtotal: 84,000 JPY
# tax: 8,400 JPY
# total: 92,400 JPY

โ€ขImportant: ํ•ญ์ƒ ์ถ”์ถœ๋œ ์ˆซ์ž๋ฅผ ์›๋ณธ ๋ฌธ์„œ์™€ ๋Œ€์กฐํ•˜์—ฌ ํ™•์ธํ•˜์‹ญ์‹œ์˜ค. Qwen2-VL์„ ํฌํ•จํ•œ ๋กœ์ปฌ ๋น„์ „ ๋ชจ๋ธ์€ ์ €ํ’ˆ์งˆ ์Šค์บ”์—์„œ ์ˆซ์ž๋ฅผ ์ž˜๋ชป ์ฝ์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. OCR ์ถœ๋ ฅ์„ ์ตœ์ข… ๊ฐ’์ด ์•„๋‹Œ ํ™•์ธ์ด ํ•„์š”ํ•œ ์ดˆ์•ˆ์œผ๋กœ ์ทจ๊ธ‰ํ•˜์‹ญ์‹œ์˜ค โ€” ํŠนํžˆ ์ฒญ๊ตฌ์„œ ๋ฐ ์žฌ๋ฌด ๋ฌธ์„œ์˜ ๊ฒฝ์šฐ.

์ด๋ฏธ์ง€ Q&A, ์Šคํฌ๋ฆฐ์ƒท ๋ถ„์„, ์ฐจํŠธ ์ฝ๊ธฐ

OCR ์™ธ์—๋„ Qwen2-VL์€ ์‚ฌ์ง„ ์„ค๋ช…, ์Šคํฌ๋ฆฐ์ƒท ์งˆ๋ฌธ ์‘๋‹ต, ์ฐจํŠธ ์ฝ๊ธฐ ๋“ฑ ์ผ๋ฐ˜์ ์ธ ์ด๋ฏธ์ง€ ์ดํ•ด๋ฅผ ์ฒ˜๋ฆฌํ•ฉ๋‹ˆ๋‹ค. ๋ช…ํ™•ํ•œ ์ž…๋ ฅ์—์„œ๋Š” ์ •ํ™•ํ•˜๋ฉฐ, ๋ณต์žกํ•˜๊ฑฐ๋‚˜ ๋ชจํ˜ธํ•œ ์žฅ๋ฉด์—์„œ๋Š” ๋‹ค์†Œ ์•ฝํ•ฉ๋‹ˆ๋‹ค.

  • ์ด๋ฏธ์ง€ Q&A: ์‚ฌ์ง„์— ๋Œ€ํ•œ ๊ฐœ๋ฐฉํ˜• ์งˆ๋ฌธ โ€” "์ด ์ด๋ฏธ์ง€์— ๋ฌด์—‡์ด ์žˆ์Šต๋‹ˆ๊นŒ?", "๋นจ๊ฐ„์ƒ‰์„ ์ž…์€ ์‚ฌ๋žŒ์€ ๋ช‡ ๋ช…์ž…๋‹ˆ๊นŒ?". Qwen2-VL 7B๋Š” ๋ช…ํ™•ํ•œ ์‚ฌ์ง„์—์„œ ์ •ํ™•ํ•˜๋ฉฐ, ๋ณต์žกํ•˜๊ฑฐ๋‚˜ ๋ชจํ˜ธํ•œ ์žฅ๋ฉด์—์„œ๋Š” ๋‹ค์†Œ ์•ฝํ•ฉ๋‹ˆ๋‹ค.
  • ์Šคํฌ๋ฆฐ์ƒท ๋ฐ UI ๋ถ„์„: Qwen2-VL์€ UI ์Šคํฌ๋ฆฐ์ƒท, ์˜ค๋ฅ˜ ๋Œ€ํ™” ์ƒ์ž, ์•ฑ ์ƒํƒœ๋ฅผ ์ฝ์Šต๋‹ˆ๋‹ค. ๊ณ ๋ฐ€๋„ ์ฝ”๋“œ ์Šคํฌ๋ฆฐ์ƒท์˜ ๊ฒฝ์šฐ InternVL 2.5๊ฐ€ ํ•ด๋‹น ๋ฐ์ดํ„ฐ์— ๋” ์ง‘์ค‘์ ์œผ๋กœ ํ›ˆ๋ จ๋˜์—ˆ์œผ๋ฏ€๋กœ, UI ๋ฐ ์ฝ”๋“œ๊ฐ€ ์ฃผ์š” ์ž‘์—…์ธ ๊ฒฝ์šฐ ์ด๋ฅผ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค.
  • ์ฐจํŠธ ๋ฐ ๊ทธ๋ž˜ํ”„ ์ฝ๊ธฐ: Qwen2-VL์€ ์ฐจํŠธ ๊ตฌ์กฐ์™€ ์ถ”์„ธ๋ฅผ ์ž˜ ์„ค๋ช…ํ•˜์ง€๋งŒ, ์ฐจํŠธ์—์„œ ์ •ํ™•ํ•œ ์ˆ˜์น˜๋ฅผ ์ถ”์ถœํ•˜๋Š” ๊ฒƒ์€ ๋ชจ๋“  ๋กœ์ปฌ ๋น„์ „ ๋ชจ๋ธ์—์„œ ์‹ ๋ขฐํ•  ์ˆ˜ ์—†์Šต๋‹ˆ๋‹ค. ์ •ํ™•ํ•œ ์ˆ˜์น˜๋Š” ๊ธฐ์ € ๋ฐ์ดํ„ฐ์™€ ๋Œ€์กฐํ•˜์—ฌ ํ™•์ธํ•˜์‹ญ์‹œ์˜ค.
  • ๋น„๋””์˜ค ํ”„๋ ˆ์ž„: Qwen2-VL์€ ์—ฌ๋Ÿฌ ํ”„๋ ˆ์ž„์„ ์‹œํ€€์Šค๋กœ ์ˆ˜์‹ ํ•ฉ๋‹ˆ๋‹ค โ€” ์ดˆ๋‹น ์•ฝ 1 ํ”„๋ ˆ์ž„์„ ์ƒ˜ํ”Œ๋งํ•˜์—ฌ ์งง์€ ํด๋ฆฝ์„ ์š”์•ฝํ•˜๊ธฐ ์œ„ํ•ด ์ตœ๋Œ€ 8๊ฐœ๋ฅผ ์ „์†กํ•˜์‹ญ์‹œ์˜ค.
  • ๋‹ค์ค‘ ์ด๋ฏธ์ง€ ๋น„๊ต: ํ•œ ๋ฒˆ์˜ ์š”์ฒญ์— ์ตœ๋Œ€ 8๊ฐœ์˜ ์ด๋ฏธ์ง€๋ฅผ ์ „์†กํ•˜์—ฌ ๋ฒ„์ „์„ ๋น„๊ตํ•˜๊ฑฐ๋‚˜, ์ฐจ์ด๋ฅผ ์ฐพ๊ฑฐ๋‚˜, ์„ธํŠธ๋ฅผ ์ผ๊ด„ ์„ค๋ช…ํ•˜์‹ญ์‹œ์˜ค.

๐Ÿ’กTip: OCR, ๋‹ค๊ตญ์–ด ๋ฌธ์„œ, ์ผ๋ฐ˜ ์ด๋ฏธ์ง€ Q&A์—๋Š” Qwen2-VL์„ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค. ์ฝ”๋“œ๋‚˜ UI ์Šคํฌ๋ฆฐ์ƒท์ด ์ฃผ์š” ์ž‘์—…์ธ ๊ฒฝ์šฐ InternVL 2.5๋กœ ์ „ํ™˜ํ•˜๊ฑฐ๋‚˜, VRAM์ด 4 GB ๋ฏธ๋งŒ์ธ ๊ฒฝ์šฐ Moondream 2๋กœ ์ „ํ™˜ํ•˜์‹ญ์‹œ์˜ค.

๋ชจ๋ธ ๋น„๊ต: Qwen2-VL vs LLaVA vs Llama 3.2 Vision

๋‹ค๊ตญ์–ด OCR์˜ ๊ฒฝ์šฐ Qwen2-VL์€ ๋” ๋‚ฎ์€ VRAM์—์„œ LLaVA 1.6์„ ๋Šฅ๊ฐ€ํ•˜๊ณ  Llama 3.2 Vision 11B์™€ ๋™๋“ฑํ•˜๊ฑฐ๋‚˜ ๋Šฅ๊ฐ€ํ•ฉ๋‹ˆ๋‹ค. ์˜์–ด ์ „์šฉ ์‚ฌ์ง„ Q&A์˜ ๊ฒฝ์šฐ Llama 3.2 Vision 11B๊ฐ€ ๋™๋“ฑํ•˜๊ฒŒ ๊ฐ•๋ ฅํ•œ ์„ ํƒ์ž…๋‹ˆ๋‹ค. LLaVA 1.6์€ ์ปค๋ฎค๋‹ˆํ‹ฐ ๋ฌธ์ œ ํ•ด๊ฒฐ ๋ฆฌ์†Œ์Šค๊ฐ€ ๊ฐ€์žฅ ๋งŽ์ด ๋ฌธ์„œํ™”๋œ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค.

ModelVRAM (Q4)OCR / CJKMax ResolutionBest For
Qwen2-VL 7B~6 GB์šฐ์ˆ˜4096ร—4096๋‹ค๊ตญ์–ด OCR, ๊ณ ํ•ด์ƒ๋„ ์Šค์บ”
Llama 3.2 Vision 11B~8 GB์–‘ํ˜ธ1120ร—1120์˜์–ด ์‚ฌ์ง„ Q&A, ์ผ๋ฐ˜ ๋ฌธ์„œ
LLaVA 1.6 7B~6 GB๋ณดํ†ต672ร—672์ผ๋ฐ˜ Q&A, ์ปค๋ฎค๋‹ˆํ‹ฐ ์ง€์›
MiniCPM-V 2.6 8B~6 GB์šฐ์ˆ˜1792ร—1792๋ฌธ์„œ OCR (์˜์–ด ์ค‘์‹ฌ)
InternVL 2.5 8B~8 GB์–‘ํ˜ธHigh์ฝ”๋“œ ๋ฐ UI ์Šคํฌ๋ฆฐ์ƒท

๋‹ค์„ฏ ๋ชจ๋ธ ๋ชจ๋‘ Ollama๋ฅผ ํ†ตํ•ด ์‹คํ–‰๋ฉ๋‹ˆ๋‹ค (InternVL 2.5๋Š” ์ปค๋ฎค๋‹ˆํ‹ฐ ๋นŒ๋“œ๋ฅผ ํ†ตํ•ด). Moondream 2 ๋ฐ ์ฒญ๊ตฌ์„œ ์ถ”์ถœ ๋ฒค์น˜๋งˆํฌ๋ฅผ ํฌํ•จํ•œ ์ „์ฒด ๋กœ์ปฌ ๋น„์ „ ๋ชจ๋ธ ์กฐ์‚ฌ๋Š” ๋กœ์ปฌ ๋น„์ „ ๋ชจ๋ธ ๋น„๊ต๋ฅผ ์ฐธ์กฐํ•˜์‹ญ์‹œ์˜ค. ํ™•์‹ ์ด ์—†๋‹ค๋ฉด Qwen2-VL 7B๋ถ€ํ„ฐ ์‹œ์ž‘ํ•˜์‹ญ์‹œ์˜ค: 6 GB์˜ VRAM์œผ๋กœ OCR, ๋ฌธ์„œ, ์ผ๋ฐ˜ Q&A๋ฅผ ๋ชจ๋‘ ์ฒ˜๋ฆฌํ•ฉ๋‹ˆ๋‹ค.

PromptQuorum์— ๋กœ์ปฌ Qwen2-VL ์—ฐ๊ฒฐ

PromptQuorum์€ ์—ฌ๋Ÿฌ ๋ชจ๋ธ์— ๊ฑธ์ณ ํ”„๋กฌํ”„ํŠธ๋ฅผ ๋ผ์šฐํŒ…ํ•ฉ๋‹ˆ๋‹ค. ๋กœ์ปฌ Qwen2-VL์„ ๋น„์ „ ๋””์ŠคํŒจ์น˜ ๋Œ€์ƒ์œผ๋กœ ์‚ฌ์šฉํ•˜๋ ค๋ฉด PromptQuorum์˜ ๋กœ์ปฌ LLM ์—”๋“œํฌ์ธํŠธ๋ฅผ Ollama ์„œ๋ฒ„๋กœ ์ง€์ •ํ•˜์‹ญ์‹œ์˜ค. ์ด๋ ‡๊ฒŒ ํ•˜๋ฉด ์ด๋ฏธ์ง€ ์ฒ˜๋ฆฌ๊ฐ€ ์‚ฌ์šฉ์ž ํ•˜๋“œ์›จ์–ด์— ์œ ์ง€๋˜๋ฉฐ, ํ…์ŠคํŠธ ์ž‘์—…์—๋Š” ํด๋ผ์šฐ๋“œ ๋ชจ๋ธ์„ ๊ณ„์† ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์ด๊ฒƒ์€ Claude์— ์‚ฌ์šฉ๋˜๋Š” Anthropic API ๊ตฌ์„ฑ๊ณผ๋Š” ๋ณ„๊ฐœ์ธ Ollama (OpenAI ํ˜ธํ™˜) ์—”๋“œํฌ์ธํŠธ์ž…๋‹ˆ๋‹ค. ๋‘ ๊ฐ€์ง€๋ฅผ ๋™์‹œ์— ํ™œ์„ฑํ™”ํ•˜์—ฌ PromptQuorum์ด ์ž‘์—… ์œ ํ˜• ๋ฐ ๋ฐ์ดํ„ฐ ๋ฏผ๊ฐ๋„์— ๋”ฐ๋ผ ๋ผ์šฐํŒ…ํ•˜๋„๋ก ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

OLLAMA_BASE_URL์„ http://localhost:11434/v1๋กœ ์„ค์ •ํ•˜๊ณ  ๋กœ์ปฌ ๋น„์ „ ๋ชจ๋ธ์„ qwen2-vl:7b๋กœ ์ง€์ •ํ•˜์—ฌ PromptQuorum์„ ๋กœ์ปฌ Qwen2-VL์— ์—ฐ๊ฒฐํ•˜์‹ญ์‹œ์˜ค.

bash
# PromptQuorum dispatch config โ€” local Qwen2-VL via Ollama
# Set in your .env or the PromptQuorum settings panel

OLLAMA_BASE_URL=http://localhost:11434/v1
LOCAL_VISION_MODEL=qwen2-vl:7b

# Example routing rules:
# - task_type: ocr / image  -> qwen2-vl:7b        (local Ollama, no cloud upload)
# - task_type: text         -> claude-sonnet-4-6  (Anthropic API, separate config)

Qwen2-VL ๋ฌธ์ œ ํ•ด๊ฒฐ

  • "unknown model" ์˜ค๋ฅ˜ ๋˜๋Š” ๋‹ค์šด๋กœ๋“œ ์‹คํŒจ: ๋ช…์‹œ์  ํฌ๊ธฐ ํƒœ๊ทธ๋ฅผ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค โ€” `qwen2-vl`์ด ์•„๋‹Œ `ollama pull qwen2-vl:7b`. ์„ค์น˜๋œ ์ด๋ฆ„์„ ํ™•์ธํ•˜๋ ค๋ฉด `ollama list`๋ฅผ ์‹คํ–‰ํ•˜์‹ญ์‹œ์˜ค.
  • ์ด๋ฏธ์ง€๊ฐ€ ๋ฌด์‹œ๋˜๊ณ  ์ด๋ฏธ์ง€ ์—†์ด ๋‹ต๋ณ€ํ•˜๋Š” ๊ฒฝ์šฐ: ํŒŒ์ผ ๊ฒฝ๋กœ๊ฐ€ ์˜ฌ๋ฐ”๋ฅด๊ณ  ์ฝ๊ธฐ ๊ฐ€๋Šฅํ•œ์ง€ ํ™•์ธํ•˜์‹ญ์‹œ์˜ค. Ollama API์—์„œ `images` ๋ฐฐ์—ด์€ `data:` ์ ‘๋‘์‚ฌ ์—†์ด ์›์‹œ base64๋ฅผ ํฌํ•จํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค โ€” `data:` ์ ‘๋‘์‚ฌ๋Š” LM Studio ๋ฐ OpenAI ํ˜•์‹์—๋งŒ ํ•ด๋‹นํ•ฉ๋‹ˆ๋‹ค.
  • ๊นจ์ง€๊ฑฐ๋‚˜ ๋ˆ„๋ฝ๋œ CJK ๋ฌธ์ž: ์Šค์บ” ํ•ด์ƒ๋„๊ฐ€ ๋„ˆ๋ฌด ๋‚ฎ์Šต๋‹ˆ๋‹ค. 150โ€“300 DPI๋กœ ์žฌ์Šค์บ”ํ•˜์‹ญ์‹œ์˜ค. Qwen2-VL์€ 4096ร—4096๊นŒ์ง€ ์ฝ์œผ๋ฏ€๋กœ ๋†’์€ ์ž…๋ ฅ ํ•ด์ƒ๋„๊ฐ€ ์ค‘๊ตญ์–ด ๋ฐ ์ผ๋ณธ์–ด ์ •ํ™•๋„๋ฅผ ์ง์ ‘์ ์œผ๋กœ ํ–ฅ์ƒ์‹œํ‚ต๋‹ˆ๋‹ค.
  • CUDA out of memory: ๋ชจ๋ธ์ด VRAM์— ๋งž์ง€ ์•Š์Šต๋‹ˆ๋‹ค. Qwen2-VL 2B (~3 GB)๋กœ ๋‚ด๋ ค๊ฐ€๊ฑฐ๋‚˜, CPU์™€ GPU ๊ฐ„์— ํ†ตํ•ฉ ๋ฉ”๋ชจ๋ฆฌ๋ฅผ ๊ณต์œ ํ•˜๋Š” Apple Silicon์—์„œ ์‹คํ–‰ํ•˜์‹ญ์‹œ์˜ค.
  • ์ฒซ ๋ฒˆ์งธ ์‘๋‹ต์€ ๋А๋ฆฌ๊ณ  ์ดํ›„๋Š” ๋น ๋ฅธ ๊ฒฝ์šฐ: ์ •์ƒ์ž…๋‹ˆ๋‹ค. ๋น„์ „ ์ธ์ฝ”๋”๊ฐ€ ์ฒซ ๋ฒˆ์งธ ํ† ํฐ์—์„œ ์ „์ฒด ์ด๋ฏธ์ง€๋ฅผ ์ฒ˜๋ฆฌํ•˜๋ฉฐ, ์ดํ›„ ํ…์ŠคํŠธ๋Š” ๊ฑฐ์˜ ์ •์ƒ ์†๋„๋กœ ์ƒ์„ฑ๋ฉ๋‹ˆ๋‹ค.
  • ์ฒญ๊ตฌ์„œ๋‚˜ ์ฐจํŠธ์—์„œ ์ž˜๋ชป๋œ ์ˆซ์ž ์ถ”์ถœ: ๋กœ์ปฌ ๋น„์ „ ๋ชจ๋ธ์€ ๋…ธ์ด์ฆˆ๊ฐ€ ๋งŽ์€ ์ž…๋ ฅ์—์„œ ์ˆซ์ž๋ฅผ ์ž˜๋ชป ์ฝ์Šต๋‹ˆ๋‹ค. ์Šค์บ” ํ’ˆ์งˆ์„ ๋†’์ด๊ณ  ํ•ญ์ƒ ์ˆ˜์น˜ ์ถœ๋ ฅ์„ ์›๋ณธ๊ณผ ๋Œ€์กฐํ•˜์—ฌ ํ™•์ธํ•˜์‹ญ์‹œ์˜ค.
  • PDF๊ฐ€ ๋กœ๋“œ๋˜์ง€ ์•Š๋Š” ๊ฒฝ์šฐ: ์–ด๋–ค ๋กœ์ปฌ ๋น„์ „ ๋ชจ๋ธ๋„ PDF๋ฅผ ์ง์ ‘ ์ˆ˜์‹ ํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. pdf2image ๋˜๋Š” pypdfium2๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ํŽ˜์ด์ง€๋ฅผ PNG ๋˜๋Š” JPEG๋กœ ๋ณ€ํ™˜ํ•œ ํ›„ ๊ฐ ํŽ˜์ด์ง€๋ฅผ ๋ณ„๋„์˜ ์ด๋ฏธ์ง€๋กœ ์ „์†กํ•˜์‹ญ์‹œ์˜ค.
  • LM Studio์—์„œ "failed to load model" ํ‘œ์‹œ: VRAM ๋ถ€์กฑ์ด๊ฑฐ๋‚˜ ๋น„์ „์ด ์•„๋‹Œ GGUF๋ฅผ ๋‹ค์šด๋กœ๋“œํ–ˆ์Šต๋‹ˆ๋‹ค. ๋ชจ๋ธ ์นด๋“œ์— ๋น„์ „ ์ง€์›์ด ๋ช…์‹œ๋˜์–ด ์žˆ๋Š”์ง€ ํ™•์ธํ•˜๊ณ  Q4_K_M ๋นŒ๋“œ๋ฅผ ์„ ํƒํ•˜์‹ญ์‹œ์˜ค.

๐Ÿ’กTip: `ollama ps`๋ฅผ ์‹คํ–‰ํ•˜๋ฉด VRAM์— ๋กœ๋“œ๋œ ๋ชจ๋ธ๊ณผ ๊ฐ ๋ชจ๋ธ์ด ์‚ฌ์šฉํ•˜๋Š” ๋ฉ”๋ชจ๋ฆฌ๋ฅผ ํ™•์ธํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. 72B๋กœ ์ „ํ™˜ํ•˜๊ธฐ ์ „์— `ollama stop qwen2-vl:7b`๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๋ชจ๋ธ์„ ์–ธ๋กœ๋“œํ•˜์‹ญ์‹œ์˜ค.

FAQ

Qwen2-VL์„ ๋กœ์ปฌ๋กœ ์‹คํ–‰ํ•˜๊ธฐ ์œ„ํ•œ ์ตœ์†Œ ํ•˜๋“œ์›จ์–ด๋Š” ๋ฌด์—‡์ž…๋‹ˆ๊นŒ?

Q4_K_M ์–‘์žํ™”์˜ Qwen2-VL 7B๋Š” 8 GB VRAM (RTX 4060, RTX 3060 12 GB, ๋˜๋Š” RTX 2080)์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ๋” ์ž‘์€ Qwen2-VL 2B๋Š” 4 GB์—์„œ ์‹คํ–‰๋ฉ๋‹ˆ๋‹ค. 72B ๋ชจ๋ธ์€ ์•ฝ 48 GB๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค โ€” 64 GB ์ด์ƒ ํ†ตํ•ฉ ๋ฉ”๋ชจ๋ฆฌ์˜ Apple Silicon ๋˜๋Š” 24 GB GPU ๋‘ ๊ฐœ. 16 GB ์ด์ƒ ํ†ตํ•ฉ ๋ฉ”๋ชจ๋ฆฌ์˜ Apple Silicon์€ 7B ๋ชจ๋ธ์„ ์›ํ™œํžˆ ์‹คํ–‰ํ•ฉ๋‹ˆ๋‹ค.

Qwen2-VL์ด OCR์—์„œ LLaVA๋ณด๋‹ค ๋‚ซ์Šต๋‹ˆ๊นŒ?

์˜ˆ, ํŠนํžˆ ๋น„์˜์–ด ํ…์ŠคํŠธ์—์„œ ๊ทธ๋ ‡์Šต๋‹ˆ๋‹ค. Qwen2-VL์€ MiniCPM-V 2.6๊ณผ ๋™๋“ฑํ•˜๋ฉฐ, ์ค‘๊ตญ์–ดยท์ผ๋ณธ์–ดยทํ•œ๊ตญ์–ด OCR์—์„œ LLaVA 1.6 ๋ฐ Llama 3.2 Vision 11B๋ฅผ ๋Šฅ๊ฐ€ํ•ฉ๋‹ˆ๋‹ค. ๋„ค์ดํ‹ฐ๋ธŒ 4096ร—4096 ํ•ด์ƒ๋„๋Š” LLaVA 1.6์ด 672ร—672๋กœ ์ œํ•œ๋˜๋Š” ๋™์•ˆ ๋‹ค์šด์ƒ˜ํ”Œ๋ง ์—†์ด ๊ณ ํ•ด์ƒ๋„ ์Šค์บ”์„ ์ฝ์Šต๋‹ˆ๋‹ค. LLaVA๋Š” ์—ฌ์ „ํžˆ ๊ฐ€์žฅ ํฐ ์ปค๋ฎค๋‹ˆํ‹ฐ์™€ ๊ฐ€์žฅ ๋งŽ์€ ํŠœํ† ๋ฆฌ์–ผ์„ ๋ณด์œ ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

Qwen2-VL์ด PDF๋ฅผ ์ง์ ‘ ์ฝ์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๊นŒ?

์•„๋‹ˆ์š”. ์–ด๋–ค ๋กœ์ปฌ ๋น„์ „ ๋ชจ๋ธ๋„ PDF ์ž…๋ ฅ์„ ์ง์ ‘ ์ˆ˜์‹ ํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. pdf2image ๋˜๋Š” pypdfium2๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๊ฐ PDF ํŽ˜์ด์ง€๋ฅผ PNG ๋˜๋Š” JPEG ์ด๋ฏธ์ง€๋กœ ๋จผ์ € ๋ณ€ํ™˜ํ•œ ํ›„, ๊ฐ ํŽ˜์ด์ง€๋ฅผ ๋ณ„๋„์˜ ์ด๋ฏธ์ง€ ์š”์ฒญ์œผ๋กœ ์ „์†กํ•˜์‹ญ์‹œ์˜ค. 10ํŽ˜์ด์ง€ PDF์˜ ๊ฒฝ์šฐ 10๊ฐœ์˜ ์ด๋ฏธ์ง€ ์ฟผ๋ฆฌ๋ฅผ ์ „์†กํ•˜๊ณ  ๊ฒฐ๊ณผ๋ฅผ ํ•ฉ์นฉ๋‹ˆ๋‹ค.

Ollama๋ฅผ ํ†ตํ•ด Qwen2-VL์— ์ด๋ฏธ์ง€๋ฅผ ์–ด๋–ป๊ฒŒ ์ „์†กํ•ฉ๋‹ˆ๊นŒ?

๋‘ ๊ฐ€์ง€ ๋ฐฉ๋ฒ•์ด ์žˆ์Šต๋‹ˆ๋‹ค. ๋Œ€ํ™”ํ˜• ๋ชจ๋“œ (`ollama run qwen2-vl:7b`)์—์„œ๋Š” ํ”„๋กฌํ”„ํŠธ์— ์ด๋ฏธ์ง€ ํŒŒ์ผ ๊ฒฝ๋กœ๋ฅผ ์ž…๋ ฅํ•˜๋ฉด Ollama๊ฐ€ ์ด๋ฅผ ๊ฐ์ง€ํ•˜์—ฌ ์ด๋ฏธ์ง€๋ฅผ ๋กœ๋“œํ•ฉ๋‹ˆ๋‹ค. API๋ฅผ ํ†ตํ•ด์„œ๋Š” base64๋กœ ์ธ์ฝ”๋”ฉ๋œ `images` ๋ฐฐ์—ด๊ณผ ํ•จ๊ป˜ /api/generate์— POST ์š”์ฒญ์„ ๋ณด๋‚ด์‹ญ์‹œ์˜ค. base64 ๋ฌธ์ž์—ด์—๋Š” `data:` ์ ‘๋‘์‚ฌ๊ฐ€ ํฌํ•จ๋˜์ง€ ์•Š์•„์•ผ ํ•ฉ๋‹ˆ๋‹ค.

Qwen2-VL์ด ์™„์ „ํžˆ ์˜คํ”„๋ผ์ธ์œผ๋กœ ์‹คํ–‰๋ฉ๋‹ˆ๊นŒ?

์˜ˆ. ์ผํšŒ์„ฑ ๋ชจ๋ธ ๋‹ค์šด๋กœ๋“œ ํ›„ Qwen2-VL์€ ์‚ฌ์šฉ์ž ๊ธฐ๊ธฐ์—์„œ ์™„์ „ํžˆ ์‹คํ–‰๋ฉ๋‹ˆ๋‹ค โ€” API ํ‚ค์™€ ํด๋ผ์šฐ๋“œ ๊ณ„์ •์ด ํ•„์š” ์—†์Šต๋‹ˆ๋‹ค. ์–ด๋–ค ์ด๋ฏธ์ง€๋„ ์–ด๋””์—๋„ ์—…๋กœ๋“œ๋˜์ง€ ์•Š์•„ ๋ฌธ์„œ ์ฒ˜๋ฆฌ๊ฐ€ ์‚ฌ์šฉ์ž ์ธํ”„๋ผ ๋‚ด์— ์œ ์ง€๋ฉ๋‹ˆ๋‹ค. ๊ทœ์ • ์ค€์ˆ˜ ์˜๋ฏธ์— ๋Œ€ํ•ด์„œ๋Š” Qwen ๋กœ์ปฌ GDPR ์„ค์ • ๊ฐ€์ด๋“œ๋ฅผ ์ฐธ์กฐํ•˜์‹ญ์‹œ์˜ค.

Qwen2-VL์ด ํ•œ ๋ฒˆ์— ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ๋Š” ์ด๋ฏธ์ง€๋Š” ๋ช‡ ๊ฐœ์ž…๋‹ˆ๊นŒ?

์š”์ฒญ๋‹น ์ตœ๋Œ€ 8๊ฐœ์˜ ์ด๋ฏธ์ง€ โ€” ๋กœ์ปฌ ๋น„์ „ ๋ชจ๋ธ ์ค‘ ๊ฐ€์žฅ ๋†’์€ ๋‹ค์ค‘ ์ด๋ฏธ์ง€ ์ฒ˜๋ฆฌ ์šฉ๋Ÿ‰์ž…๋‹ˆ๋‹ค. ์ด๋กœ ์ธํ•ด ๋ฌธ์„œ ๋ฒ„์ „ ๋น„๊ต, ์ฐจ์ด ๋ฐœ๊ฒฌ, ๋˜๋Š” ์ดˆ๋‹น 1 ํ”„๋ ˆ์ž„์œผ๋กœ ์ƒ˜ํ”Œ๋ง๋œ ์งง์€ ๋น„๋””์˜ค ์š”์•ฝ์— ์ ํ•ฉํ•ฉ๋‹ˆ๋‹ค.

Qwen2-VL ๋˜๋Š” Llama 3.2 Vision โ€” ์–ด๋А ๊ฒƒ์„ ์„ ํƒํ•ด์•ผ ํ•ฉ๋‹ˆ๊นŒ?

์ค‘๊ตญ์–ด, ์ผ๋ณธ์–ด, ํ•œ๊ตญ์–ด ๋ฌธ์„œ, ๊ณ ํ•ด์ƒ๋„ ์Šค์บ”, ๋˜๋Š” ์ž‘์€ ๊ธ€๊ผด์˜ ๊ฒฝ์šฐ Qwen2-VL์„ ์„ ํƒํ•˜์‹ญ์‹œ์˜ค โ€” Llama 3.2 Vision 11B์˜ 8 GB ๋Œ€๋น„ 7B๊ฐ€ 6 GB์˜ VRAM์— ๋งž๊ธฐ ๋•Œ๋ฌธ์ด๊ธฐ๋„ ํ•ฉ๋‹ˆ๋‹ค. ๋‘ ๋ชจ๋ธ์ด ๋น„์Šทํ•œ ์˜์–ด ์ „์šฉ ์ผ๋ฐ˜ ์‚ฌ์ง„ Q&A์—๋Š” Llama 3.2 Vision 11B๋ฅผ ์„ ํƒํ•˜์‹ญ์‹œ์˜ค.

OCR ์ถœ๋ ฅ์—์„œ ๋ฌธ์ž๊ฐ€ ๊นจ์ง€๋Š” ์ด์œ ๋Š” ๋ฌด์—‡์ž…๋‹ˆ๊นŒ?

๊ฑฐ์˜ ํ•ญ์ƒ ์ €ํ•ด์ƒ๋„ ์Šค์บ” ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค. Qwen2-VL์€ 4096ร—4096๊นŒ์ง€ ๋„ค์ดํ‹ฐ๋ธŒ๋กœ ์ฝ์œผ๋ฏ€๋กœ, 150โ€“300 DPI๋กœ ๋ฌธ์„œ๋ฅผ ์žฌ์Šค์บ”ํ•˜๋ฉด ๋ณดํ†ต ๊นจ์ง€๊ฑฐ๋‚˜ ๋ˆ„๋ฝ๋œ ๋ฌธ์ž๊ฐ€ ์ˆ˜์ •๋ฉ๋‹ˆ๋‹ค. ์ €ํ’ˆ์งˆ ์ž…๋ ฅ์€ ๋ชจ๋“  ๋กœ์ปฌ ๋น„์ „ ๋ชจ๋ธ์—์„œ OCR ์˜ค๋ฅ˜์˜ ๊ฐ€์žฅ ํฐ ๋‹จ์ผ ์›์ธ์ž…๋‹ˆ๋‹ค.

A Note on Third-Party Facts

This article references third-party AI models, benchmarks, prices, and licenses. The AI landscape changes rapidly. Benchmark scores, license terms, model names, and API prices can shift between the time of writing and the time you read this. Before making deployment or compliance decisions based on this article, verify current figures on each providerโ€™s official source: Hugging Face model cards for licenses and benchmarks, provider websites for API pricing, and EUR-Lex for current GDPR and EU AI Act text. This article reflects publicly available information as of May 2026.

PromptQuorum ๋Œ€๊ธฐ์ž ๋ช…๋‹จ ๋“ฑ๋ก โ†’

Join the PromptQuorum Waitlist โ†’

โ† Back to Local LLMs

Qwen2-VL ๋กœ์ปฌ ์‹คํ–‰ 2026: OCR ๋ฐ ๋น„์ „ ์„ค์ • ๊ฐ€์ด๋“œ | PromptQuorum