논문 정보
- 논문명: Exploring the potential of large language models for author profiling tasks in digital text forensics
- 저자: Sang-Hyun Cho, Dohyun Kim, Hyuk-Chul Kwon, Minho Kim
- 게재지: Forensic Science International: Digital Investigation (SCIE)
- 게재일: 2024년 10월 18일
- DOI: https://doi.org/10.1016/j.fsidi.2024.301814
연구 내용
본 연구는 디지털 포렌식 분야에서 저자 프로파일링을 위한 대규모 언어 모델(LLMs)의 활용 가능성을 탐구했습니다. Polyglot, EEVE, Bllossom 등 최신 언어 모델들을 비교 분석하고, 다양한 파인튜닝 전략(full fine-tuning, LoRA, QLoRA)의 효과성을 평가하였습니다.
주요 성과
- 디지털 포렌식 분야에서 대규모 언어 모델의 저자 프로파일링 성능 검증
- 효율적인 파인튜닝 전략 비교 분석 및 최적 방법론 제시
- 계산 비용과 메모리 요구사항 최적화 방안 도출
연구비 지원
- 지원기관: 중소벤처기업부
- 과제명: 기술개발사업
- 과제번호: RS-2023-00223129