Qwen 3.6-35B-A3B KV 캐시 Part 2: PPL, KL 발산, 비대칭 K/V, M5 Max에서 64K 테스트

어제 포스트의 후속입니다. 댓글에서 perplexity, KL 발산, 비대칭 K/V 조합, 64K 데이터 포인트를 요청해서 밤새 실행했습니다. 동일 M5 Max, 동일 Qwen 3.6-35B-A3B Q8, 동일 TheTom TurboQuant 포크.

품질(wikitext-2에서 perplexity + KL 발산)
컨텍스트 크기 4096.