Research Achievements

Others

[2025.05] [기술이전] 문서 레이아웃 분석 및 OCR 기반 지능형 문서처리 기술 - ㈜망고클라우드

작성자 관리자 날짜 2026-01-29 07:00:12 조회수 9

기술명
문서 레이아웃 분석 및 OCR 기반 지능형 문서처리 기술


기술이전 정보

이전 기관
㈜망고클라우드

이전자
김민호 (국립한국해양대학교 인공지능공학부 조교수)

계약 체결일
2025년 5월


기술 내용

PDF, 스캔 이미지 등 다양한 형식의 문서에서 표, 단락 등의 레이아웃을 자동 분석하고 OCR로 텍스트를 추출하여 LLM 기반 RAG 시스템에서 활용 가능한 정형 데이터로 변환하는 기술입니다.

주요 기술 특징

✅ 다양한 문서 형식 지원 (PDF, 스캔 이미지 등)
✅ 자동 레이아웃 분석 (표, 단락, 제목 등)
✅ OCR 기반 텍스트 추출
✅ RAG 시스템 연계를 위한 정형 데이터 변환


기술 분야
자연어처리(NLP), 문서처리, AI 기반 데이터 정형화

기술료
20,000,000원


기술 키워드
#문서처리 #OCR #레이아웃분석 #RAG #NLP #문서AI