논문제목:
- (v1.0) Obtaining Reliable Human Ratings of Valence, Arousal, and Dominance for 20,000 English Words
- (v2.0) NRC VAD Lexicon v2: Norms for Valence, Arousal, and Dominance for over 55k English Terms
- 링크 : https://www.saifmohammad.com/WebPages/nrc-vad.html
Overview
단어의 핵심 차원(VAD)을 측정하는 것은 중요하지만, 기존 어휘집들은 평가척도(Rating Scale) 방식의 한계로 데이터 신뢰도 문제
기존 어휘집은 단어 수가 부족하고 구문을 포함하지 않아 적용 범위가 제한적
이를 해결하기 위해 두 편의 논문에 걸쳐 다음과 같은 핵심 방법론과 기여를 제시
1) v1.0 : 신뢰도 문제를 해결하기 위해, BWS(Best - Worst Scaling) 기법을 제안
- 기존 평가 척도의 불일치 및 편향 문제를 극복하기 위해 BWS 방법론 도입
- 기존 연구(Warriner et al.)보다 모든 차원에서 월등히 높은 신뢰도를 달성, Arousal과 Dominance에서 그 차이가 두드러짐
- 성별과 나이 등 인구통계학적 특성에 따라 VAD를 이해하는 방식에 유의미한 차이가 있음을 최초로 규명
2) v2.0 : 규모 확장을 위해 기존 연구들과의 호환성이 높은 7점 척도 평가 방식을 사용
- 어휘집을 대규모 확장 진행
- 확장성과 기존 연구들과의 호환성을 고려해 7점 척도 평가 방식 사용
발표 자료 : 하단 첨부