NL-295, ARR Review

Advancing Emotion Recognition and Intensity Modeling for Ethiopian Languages ◼ Comment 감정인식에서 단순 single label 형식으로는 제대로 감정을 표현 못하기 때문에, multi class, multi label 데이터를 만든다고 한다. 여기서는 EthioEmo 데이터 기반으로 감정강도에 대한 어노테이션을 통해 데이터 확장했다 에티오피아는 4 종류의 언어가 있다고 하는데 언어에 따라 annotation이 5명인 경우가 있고 3명인 경우가 있는데 5명인 경우, annotation 하는 식이 뭔가 불완전한거 같아보임 anno<2 인 경우는 어떻게 되는거지? 학습에 대해서 너무 생략되어 있다 각 multi label의 intenstiy가 0,1,2,3 형태로 있는데 bert 기반 모델에서 이거를 어떻게 학습하는거지? 각 레이블에 대한 head가 있고 regression? classification 형태로 학습이 되는것인가? 표 1은, 각 에티오피아 언어에 대해 학습/테스트가 이뤄지고 표 2는, 3개의 에티오피아 언어에 대해 학습되고 나머지 1개에 대하 테스트되는 cross-lingual 세팅이라고 한다 평가에 대해서도 정보가 부족하다 멀티레이블에서 Macro-F1으로의 성능측정은 얼마나 믿을만한가? Macro-F1은 어떻게 측정되는것인가? 각 감정에 대해 accuracy을 측정하고 이를 평균내는것인가? intensity가 1이상이면 일단 그 감정을 가지고 있다고 보는 것인가? Abstract 감정 이해는 고객 피드백 분석, 마케팅 인사이트, 소셜 미디어 모니터링 등 다양한 인간-컴퓨터 상호작용 작업의 핵심입니다. 실제 환경에서는 사람들이 동시에 여러 감정을 표현하는 경우가 많아, 감정의 복합성을 포착하기 위해 다중 레이블 주석이 필수적입니다. EthioEmo 데이터셋( Belay et al., 2025 )은 에티오피아 언어에 대한 다중 레이블 감정 주석을 제공하지만, 각 감정...