OCR

출장 자동화 시스템

by myeongjaechoi 2025. 4. 30. 19:37

Llama 2.0 + TesseractOCR도 결국 성능이 좋지 않았다.

이유를 생각해보면, TesseractOCR에서 부정확한 텍스트를 Llama 2.0에 보내서 정규화된 단어로 바꾸기엔 한국어 특성상 어려움이 존재하는 것 같다.

최근에 나온 Llama 4.0이 한글 친화적이라고 해서 써보려고 했지만, 내 PC 환경에서 사용하기엔 너무 큰 스펙이 필요하였다.

OCR.Space 도 사용해보았는데, 아예 텍스트 분리를 하지 못하였다.

docTR은 오히려 TesseractOCR 보다 성능이 더 안 좋았다.

Qwen2.5 모델이 한글에 친화적이라고 해서 써보았지만, Llama 4.0과 같은 이유로 내 PC 환경에서는 안 돌아갔다.

Qwen/Qwen2.5-VL-7B-Instrcut, Qwen/Qwen2.5-VL-3B-Instrcut 둘 다 바꿔서 사용해봤지만 30분 넘게 안 돌아가고 컴퓨터가 버벅 거렸다.

진짜 API 끌어다가 써야하나...

MJK