MemeScouts@LT-EDI 2026: 올바른 질문을 묻기 — 혐오 표현 탐지 위한 프롬프트 기반 약한 감시 (Prompted Weak Supervision) - Insights | Molayo

밈 (meme) 의 다중 모달 (multimodal) 성질과 아이러니, 문맥 등 세련되고 문화적 맥락에 기반한 단서로 인해 혐오 표현을 탐지하는 것은 어렵습니다. 최근의 비전-언어 모델 (VLMs) 은 텍스트와 이미지를 동시에 추론할 수 있게 하지만, 엔드투엔드 프롬프팅은 단일 예측이 대상, 입장, 암시성, 아이러니를 모두 해결해야 하므로 취약할 수 있습니다. 이러한 어려움은 다국어 환경에서는 더욱 증폭됩니다. 우리는 LT-EDI 2026 공유 과제에서 동성애 혐오와 트랜스젠더 혐오 탐지를 위해 밈 이해를 목표 지향적이고 질문 기반의 라벨링 함수로 분해하는 프롬프트 기반 약한 감시 (PWS) 접근법을 제안합니다. 양자화된 Qwen3-VLM 을 사용하여 목표 지향적인 질문에 답함으로써 특징을 추출하고, 이 방법은 직접적인 VLM 분류보다 우수하며, 중국어와 힌디어에서 상당한 성능 향상을 보였습니다. 영어에서는 1 위, 중국어에서는 2 위, 힌디어에서는 3 위를 차지했습니다. 오류 기반 라벨링 함수 (LF) 확장 및 특징 가지치기를 통한 반복적 개선은 중복성을 줄이고 일반화 성능을 향상시켰습니다. 우리의 결과는 다중 모달 혐오 표현 탐지에 프롬프트 기반 약한 감시가 효과적임을 보여줍니다.

Insights

MemeScouts@LT-EDI 2026: 올바른 질문을 묻기 — 혐오 표현 탐지 위한 프롬프트 기반 약한 감시 (Prompted Weak Supervision)

요약

핵심 포인트

댓글

llama.cpp MTP 투기적 디코딩(speculative decoding) 요약: 2026년 7월 기준 Dense 모델에서는 큰 이득

하나의 에이전트에 3개의 MCP 서버를 연결했더니 무서울 정도로 빨라졌다

당신의 CLAUDE.md는 확장되지 않습니다. AI 표준을 코드로 버전 관리하세요.

플라스틱 전자책 단말기 케이스가 분류(Classifier) 문제로 변할 때

llama.cpp MTP 투기적 디코딩(speculative decoding) 요약: 2026년 7월 기준 Dense 모델에서는 큰 이득

하나의 에이전트에 3개의 MCP 서버를 연결했더니 무서울 정도로 빨라졌다

당신의 CLAUDE.md는 확장되지 않습니다. AI 표준을 코드로 버전 관리하세요.

플라스틱 전자책 단말기 케이스가 분류(Classifier) 문제로 변할 때