Qwen3.6이 WASM에 대해 자신 있게 틀리다

저는 Qwen 27B를 이용해 WASM 바이트코드를 생성하는 제너레이터를 만들려고 시도하고 있습니다. 작동은 하지만, 바이트코드(및 몇 가지 다른 세부 사항)를 계속 잘못 이해하기 때문에 수십만 개의 토큰을 디버깅에 소모해야 합니다. 단순히 틀리게 만드는 것뿐만 아니라, 너무 확신해서 같은 문제를 반복적으로 일으킵니다. 심지어 올바른 바이트코드를 찾아내는 스크립트를 만들었음에도 불구하고 그 결과를 믿지 못하고 발견한 스크립트 자체를 디버깅하려고 합니다. 자신이 옳다고 생각했던 바이트코드가 틀렸다는 것을 깨달아도, WASM이 1.0 이후로 변경된 탓으로 돌릴 뿐입니다 (물론 이것은 잘못된 추측이며, WASM은 바이트코드 자체가 변하지 않습니다).

chat.qwen.ai에서 확인해 봤는데, Qwen3.6-Plus조차도 잘못된 결과를 보여줍니다. Qwen3.7-Plus는 웹 검색을 통해 올바른 답변을 제공했습니다. Qwen3.7-Max는 웹 검색 없이도 올바른 답변을 제공했습니다.

이것이 제가 직접 파인튜닝(finetuning)을 시도하게 만드는 계기가 될 수도 있겠습니다.
제출자: /u/Tagedieb
[link] [comments]

Insights

Qwen3.6이 WASM에 대해 자신 있게 틀리다

요약

핵심 포인트

댓글

Linux 7.3, MCTP-Over-USB v1.1 지원 추가

AI는 추론에 탁월합니다. 워크플로(Workflows)에 사용하는 것은 멈추세요.

AI 에이전트가 대본을 벗어날 때: OpenAI와 Anthropic의 최근 사건이 노출(Exposure)에 대해 우리에게 가르쳐 주는 것

Gamma 무료인가요? 400 크레딧은 갱신되지 않습니다: 첫 생성 전 deck을 확인하세요

Linux 7.3, MCTP-Over-USB v1.1 지원 추가

AI는 추론에 탁월합니다. 워크플로(Workflows)에 사용하는 것은 멈추세요.

AI 에이전트가 대본을 벗어날 때: OpenAI와 Anthropic의 최근 사건이 노출(Exposure)에 대해 우리에게 가르쳐 주는 것

Gamma 무료인가요? 400 크레딧은 갱신되지 않습니다: 첫 생성 전 deck을 확인하세요