Teaching

Lab Seminars

 

[2026.02.09] Neuro-Symbolic Artificial Intelligence : A Task-Directed Survey in the Black-Box Models Era 논문 리뷰

작성자 최민혁 날짜 2026-02-24 13:36:10 조회수 28

논문 제목

  • Neuro-Symbolic Artificial Intelligence: A Task-Directed Survey in the Black-Box Models Era
  • 저자 : Giovanni Pio Delvecchio, Lorenzo Molfetta, Gianluca Moro
  • 링크 : https://doi.org/10.24963/ijcai.2025/1157

 

Overview

  • 배경 : 딥러닝은 뇌와 부분적으로 유사하지만, 인간 수준의 계층적 계획과 논리적 추론 능력이 근본적으로 결여되어 있습니다. 따라서 단순 패턴 인식을 넘어 규칙 기반 사고와 상징적 조작을 결합하여 고신뢰 과업에서 투명성과 일관성을 확보해야 할 필요성이 대두되었습니다
  • 기존 한계 : 기존 블랙박스 딥러닝은 방대한 학습 데이터가 필요한 '데이터 비효율성', 결과에 대한 이유를 제시하지 못하는 '설명 가능성 부족', 그리고 사실이 아닌 정보에 대해 확신을 가지고 생성하는 'Hallucination(환각)'이라는 명확한 핵심 문제가 존재합니다.
  • 연구 가설 : 신경망과 기호를 결합한 NeSy(Neuro-Symbolic AI)가 기호적 요소를 통한 '정규화', 논리 규칙을 바탕으로 한 '데이터 효율성(차원의 저주 해결)', 그리고 데이터 인식 능력과 기호적 표현력을 결합한 '일반화' 성능 향상을 통해 기존 딥러닝의 세 가지 간극을 메꿀 수 있을 것입니다.
  • 목표 : 기존의 신경망 아키텍처 중심이 아닌, 해결하고자 하는 과업과 기호적 통합 방식에 따라 NeSy를 3가지 방법(규칙 마이닝, 규칙 집행, 프로그램 합성)으로 새롭게 분류하여 제안하고, 이를 통해 블랙박스 모델의 근본적인 불투명성과 데이터 비효율성을 해결하는 실용적 프레임워크를 제공하는 것입니다.

 

핵심 방법론 및 기여

1) 규칙 마이닝 (Rule Mining)

  • 정의 : 신경망이 학습한 데이터 표현이나 모델의 행동에서 인간이 해석 가능한 규칙을 자동으로 추출하는 기술입니다.
  • 주요 기법 : 조건문 형태의 논리 규칙을 학습하여 복잡한 인과관계를 추론하는 'Horn Clauses' (예: JMLR 모델), 강화학습의 상태 전이를 유한 상태 기계로 추출하여 정책의 논리 구조를 파악하는 'Deterministic Finite Automate (DFA)' 등이 있습니다.
  • 효과 : 블랙박스 모델의 결정에 대한 설명 가능한 근거를 제공하며, 오류 원인 분석 및 디버깅을 용이하게 합니다

 

2) 규칙 집행 (Rule Enforcement)

  • 정의 : 논리적 제약을 손실 함수나 모델 구조에 주입하여, 출력 결과가 반드시 지켜야 할 규칙을 준수하도록 강제하는 기술입니다.
  • 주요 기법 : 객체들이 논리적 관계를 만족하도록 제약하는 'First-Order Logic (1차 논리)', 불확실성을 고려하여 팩트를 검증하고 안전한 강화학습을 수행하는 'Probabilistic Logic (확률 논리)'이 있습니다.
  • 효과 : 모델의 Hallucination 현상을 억제하고, 결과의 안전성과 논리적 정합성을 보장합니다.

 

3) 프로그램 합성 (Program Synthesis)

  • 정의 : 입력 문제를 해결하기 위해 모델이 스스로 실행 가능한 프로그램이나 쿼리를 자동 생성하여 답을 도출하는 기술입니다.
  • 주요 기법 : 사람의 자연어 질문을 SQL이나 Python 등의 실행 가능한 논리적 코드로 변환하는 'Semantic Parsing (의미론적 구문 분석)'을 활용합니다. 대표적으로 NS-CL 모델은 모듈식 신경-기호 파이프라인을 통해 CLEVR 벤치마크에서 단 10%의 데이터만으로도 높은 성능을 달성했습니다.
  • 효과 : 생성된 코드의 실행 과정을 통해 오류 추적이 가능하며, 모듈 교체가 용이하고 데이터 효율성이 매우 뛰어납니다.

 

4) 실험적 성능 입증 및 실용적 의의

  • 성능 우위 : 문서 관계 추출 과업(DWIE 데이터셋)에서 규칙 기반 모델인 JMLR은 기존 블랙박스 모델(67.1%) 대비 월등한 정확도(77.9%)를 달성하며 10.9%의 성능 차이를 입증했습니다. 또한, LECTER 모델을 통한 시간적 추론에서도 우수한 성능을 보였습니다.
  • 기술적 함의 : 제안된 세 가지 접근법(설명 추출, 출력 통제, 조합적 추론)은 상호 보완적이며, 딥러닝의 직관과 기호의 논리를 결합하여 모델의 신뢰성을 크게 확보합니다. 향후 의료, 법률, 금융 등 고위험 도메인에서 안전성 규제와 함께 NeSy의 도입이 가속화될 전망입니다.

 

발표 자료 : 하단 첨부

댓글 (0)

등록된 댓글이 없습니다.
보안 문자 이미지