Research Achievements

Conferences

[2025.07.02] [KCC2025] 한국 공공행정문서 레이아웃 분석을 위한 데이터셋 구축 및 모델 검증

작성자 관리자 날짜 2025-07-21 12:42:57 조회수 38

논문 정보

  • 논문명: 한국 공공행정문서 레이아웃 분석을 위한 데이터셋 구축 및 모델 검증 (Dataset Construction and Model Evaluation for Document Layout Analysis of Korean Public Administration Documents) 

  • 저자 소속:

    • 여지민: 국립한국해양대학교 컴퓨터공학과

    • 김민호: 국립한국해양대학교 인공지능공학부

  • 게재지: 2025 한국컴퓨터종합학술대회 논문집 (KCC2025)

  • ISSN: 2635-5868


 

연구 내용

본 연구는 한국 공공행정문서의 복잡한 레이아웃을 정확하게 분석하기 위해 데이터셋을 구축하고, 이를 기반으로 AI 모델을 학습 및 평가하는 방법을 제안합니다. 900장의 한국 공공행정문서를 라벨링하여 데이터셋을 구축하였으며, Doclayout-Yolo 및 Yolov10 모델을 활용하여 레이아웃 분석 성능을 검증하였습니다. 이 연구는 공공행정문서의 자동화 및 정보 추출 정확도를 향상시키는데 기여합니다.

 


 

주요 성과

 

  1. 고성능 레이아웃 분석 모델 검증

    • Yolov10-s 모델이 mAP@50 기준 0.961의 최고 성능 달성 

    • Doclayout-Yolo 모델과 Yolov10 모델 비교를 통해 한국 공공행정문서에 적합한 모델 성능 확인 

  2. 공공행정문서 특화 데이터셋 구축

    • 900장의 한국 공공행정문서 라벨링을 통한 데이터셋 구축 

    • Title, Plain Text, Figure, Table 등 9가지 레이아웃 클래스 정의 및 가이드라인 마련

  3. 전이 학습(SFT)을 통한 인식 성능 향상

    • Doclayout-Yolo 모델의 전이 학습을 통해 Title 및 Plain Text 클래스의 인식 성능 크게 향상

    • "수신자 아래 '제목' 키워드와 특정 패턴" 학습으로 Title 클래스 인식 성능 비약적 향상

  4. 실용적 적용 가능성 제시

    • 구축된 데이터셋과 분석 결과가 공공행정문서의 자동화 및 정보 추출에 활용될 가능성 제시

    • 향후 OCR 모듈과의 결합을 통한 정교한 문서 분석 기술 확장 및 멀티모달 모델 도입 계획 제시