arXiv논문2026. 06. 09. 10:44

TimpaTeks: 확산 언어 모델 (Diffusion Language Model) 스티어링을 통한 자동 인플레이스 (In-place) 텍스트

요약

확산 언어 모델(DLM)의 활성화 스티어링을 활용하여 텍스트를 인플레이스(in-place)로 수정하는 TimpaTeks 메커니즘을 제안합니다. 문장 구조를 유지하면서 퍼플렉시티를 낮추고, 추가적인 시퀀스 생성 없이 디노이징을 수행하여 계산 효율성을 높였습니다.

핵심 포인트

확산 언어 모델(DLM)을 위한 활성화 스티어링 확장 연구
문장 구조를 유지하며 텍스트를 인플레이스로 수정하는 TimpaTeks 제안
지시어 튜닝 없이도 효과적인 개념 스티어링 가능
프롬프트 기반 방식 대비 낮은 계산 비용 및 높은 효율성

우리는 활성화 스티어링 (activation steering)을 확산 언어 모델 (Diffusion Language Models, DLMs)로 확장하고, DLM의 추론 메커니즘으로 인해 발생하는 새로운 문제인 '다른 개념을 나타내기 위해 텍스트를 인플레이스 (in-place)로 수정하는 문제'를 연구합니다. 우리는 DLM을 사용하여 자동 인플레이스 텍스트 수정 메커니즘인 TimpaTeks를 제안합니다. IMDB 영화 리뷰 (감성 분석) 및 합성된 개와 고양이 데이터셋 (임의적이고 더 비전형적인 개념 스티어링)에 대한 실험을 통해, TimpaTeks가 확산 언어 모델의 출력을 인플레이스로 스티어링할 수 있는 실행 가능한 새로운 메커니즘을 제공함을 보여줍니다. TimpaTeks는 지시어 튜닝된 (instruction tuned) 모델의 필요 없이, 문장 구조를 유지하면서 문장 퍼플렉시티 (perplexity)를 동시에 낮추는 인플레이스 수정을 가능하게 합니다. 또한 TimpaTeks는 추가적인 프롬프트 조건부 출력 시퀀스를 생성하는 대신 인플레이스에서 디노이징 (denoising)을 수행하므로, 프롬프트 기반의 DLM 스티어링보다 계산 비용이 더 저렴합니다.

AI 자동 생성 콘텐츠

원문 바로가기

TimpaTeks: 확산 언어 모델 (Diffusion Language Model) 스티어링을 통한 자동 인플레이스 (In-place) 텍스트

요약

핵심 포인트

댓글