LLM은 이분법적 딜레마를 넘어 도덕적 대안을 상상할 수 있는가?

대규모 언어 모델 (LLMs)이 도덕적 조언자 및 에이전트로 점점 더 많이 배치됨에 따라, 이들은 두 가지 상충하는 가치 사이의 딜레마를 해결해야 합니다. 그러나 도덕적 딜레마를 가진 LLM에 대한 기존 연구는 인간의 도덕적 인지(moral cognition)의 핵심적인 측면, 즉 주어진 선택지를 넘어선 대안을 상상하는 능력을 간과하고 있습니다. 우리는 서사적 조언자(Advisor) 딜레마와 AI를 향한 에이전트(Agent) 딜레마를 아우르는 307개의 도덕적 딜레마 데이터셋인 MoralAltDataset을 소개하며, 각 딜레마는 타협안(compromise) 및 재구성된 대안(reframed alternatives)으로 증강되었습니다. 우리는 먼저 이러한 대안이 도입되었을 때 인간과 LLM이 판단을 바꾸는지 조사합니다. 15개의 LLM을 대상으로 조사한 결과, 타협 대안이 원래의 두 선택지 중 어느 하나보다 선호되는 경우가 많으며, 이는 도덕적 선택을 실질적으로 재형성한다는 것을 발견했습니다. 그런 다음 우리는 쌍체 선호도(pairwise preference) 및 전문가 기반 기준을 사용하여 LLM이 생성한 대안의 품질을 인간이 작성한 대안과 비교 평가합니다. 결과에 따르면 LLM이 생성한 대안은 종종 더 선호되며 미세한 구조적 및 윤리적 기준을 더 잘 충족하는 반면, 구조적 품질과 실질적 실행 가능성 사이의 트레이드오프(trade-offs)를 드러냅니다.

Insights

LLM은 이분법적 딜레마를 넘어 도덕적 대안을 상상할 수 있는가?

요약

핵심 포인트

댓글

AI 에이전트가 코드베이스에 매몰되지 않도록 방지하는 "Context OS"를 구축했습니다

AI 파일럿이 프로덕션 단계로 넘어가기 전에 중단되는 이유

Anthropic의 오랫동안 중단되었던 Fable 5 서비스 재개 승인

LLM을 대규모로 배포할 때 아무도 말해주지 않는 것들

AI 파일럿이 프로덕션 단계로 넘어가기 전에 중단되는 이유

Anthropic의 오랫동안 중단되었던 Fable 5 서비스 재개 승인

LLM을 대규모로 배포할 때 아무도 말해주지 않는 것들