OCR + LLM

출장 자동화 시스템

by myeongjaechoi 2025. 4. 24. 15:20

여러 논문들을 찾아 본 결과, OCR -> LLM 과정으로 오탈자들을 수정하는 방식을 채택을 한다.

현재 PaddleOCR + llama3.2-korean으로 진행하고 있다.

만족스러운 결과값이 안 나와서, github에 push 할 수도 없고, 블로그에 쓸 것도 없다..

Tesseract, easyOCR보다 PaddleOCR이 웹 스크린샷 분석에 효율이 더 좋다는 것도 알았다.

이미지 전처리로만은 정확한 Grounding을 구현할 수 없을 것 같다.

MJK