논문명: 한국 공공행정문서 레이아웃 분석을 위한 데이터셋 구축 및 모델 검증 (Dataset Construction and Model Evaluation for Document Layout Analysis of Korean Public Administration Documents)
저자 소속:
여지민: 국립한국해양대학교 컴퓨터공학과
김민호: 국립한국해양대학교 인공지능공학부
게재지: 2025 한국컴퓨터종합학술대회 논문집 (KCC2025)
ISSN: 2635-5868
본 연구는 한국 공공행정문서의 복잡한 레이아웃을 정확하게 분석하기 위해 데이터셋을 구축하고, 이를 기반으로 AI 모델을 학습 및 평가하는 방법을 제안합니다. 900장의 한국 공공행정문서를 라벨링하여 데이터셋을 구축하였으며, Doclayout-Yolo 및 Yolov10 모델을 활용하여 레이아웃 분석 성능을 검증하였습니다. 이 연구는 공공행정문서의 자동화 및 정보 추출 정확도를 향상시키는데 기여합니다.
고성능 레이아웃 분석 모델 검증
Yolov10-s 모델이 mAP@50 기준 0.961의 최고 성능 달성
Doclayout-Yolo 모델과 Yolov10 모델 비교를 통해 한국 공공행정문서에 적합한 모델 성능 확인
공공행정문서 특화 데이터셋 구축
900장의 한국 공공행정문서 라벨링을 통한 데이터셋 구축
Title, Plain Text, Figure, Table 등 9가지 레이아웃 클래스 정의 및 가이드라인 마련
전이 학습(SFT)을 통한 인식 성능 향상
Doclayout-Yolo 모델의 전이 학습을 통해 Title 및 Plain Text 클래스의 인식 성능 크게 향상
"수신자 아래 '제목' 키워드와 특정 패턴" 학습으로 Title 클래스 인식 성능 비약적 향상
실용적 적용 가능성 제시
구축된 데이터셋과 분석 결과가 공공행정문서의 자동화 및 정보 추출에 활용될 가능성 제시
향후 OCR 모듈과의 결합을 통한 정교한 문서 분석 기술 확장 및 멀티모달 모델 도입 계획 제시