Llama 2.0 + TesseractOCR도 결국 성능이 좋지 않았다.
이유를 생각해보면, TesseractOCR에서 부정확한 텍스트를 Llama 2.0에 보내서 정규화된 단어로 바꾸기엔 한국어 특성상 어려움이 존재하는 것 같다.
최근에 나온 Llama 4.0이 한글 친화적이라고 해서 써보려고 했지만, 내 PC 환경에서 사용하기엔 너무 큰 스펙이 필요하였다.
OCR.Space 도 사용해보았는데, 아예 텍스트 분리를 하지 못하였다.
docTR은 오히려 TesseractOCR 보다 성능이 더 안 좋았다.
Qwen2.5 모델이 한글에 친화적이라고 해서 써보았지만, Llama 4.0과 같은 이유로 내 PC 환경에서는 안 돌아갔다.
Qwen/Qwen2.5-VL-7B-Instrcut, Qwen/Qwen2.5-VL-3B-Instrcut 둘 다 바꿔서 사용해봤지만 30분 넘게 안 돌아가고 컴퓨터가 버벅 거렸다.

진짜 API 끌어다가 써야하나...
| 린 고객 개발의 핵심 고객인터뷰 (0) | 2025.05.05 |
|---|---|
| 문제 가설 세우기 및 고객시장 탐색하기 (0) | 2025.05.02 |
| OCR + LLM (0) | 2025.04.24 |
| 네트워킹을 통한 피드백 및 페르소나 정의 (0) | 2025.04.20 |
| OCR 문제 (0) | 2025.04.18 |