Jackrong/Qwopus3.6-27B-Coder-MTP

코딩 전용 모델이 나온 지 꽤 되었네요. 코딩 흐름에서 사용해 보기 전에 최적의 설정을 찾기 위해 표준 파라미터 벤치마킹을 계속하고 있습니다.

초기 벤치마크
벤치마크 결과 — Qwopus3.6-27B-Coder-MTP Q6_K
표준 디코딩 (MTP 미사용) — llama-bench를 통해 | 지표 (Metric) | 속도 (Speed) |
|---------------------------|-----------|
| 프롬프트 처리 (Prompt Processing, pp512) | 2,742 t/s | |
| 토큰 생성 (Token Generation, tg256) | 60.9 t/s |

MTP Speculative Decoding 사용 시 — llama-cli를 통해

지표 (Metric)	속도 (Speed)
프롬프트 처리 (Prompt Processing)	164.5 t/s
토큰 생성 (Token Generation)	119.0 t/s

MTP 가속: ~2.07배 (60.9 → 119.0 t/s). 모델 카드에 명시된 ~1.66x-2x 범위와 일치합니다.
[Qwopus3.6-27B-Coder-MTP-Q6] 모델 = /mnt/storage/models/qwen3.6/Qwopus3.6-27B-Coder-MTP-Q6_K.gguf mmproj = /mnt/storage/models/qwen3.6/mmproj-F32.gguf ctx-size = 32768 ngl = 99 fa = on flash-attn = true draft-mtp = true ctk = q8_0 ctv = q8_0
제출자: /u/giveen
[링크] [댓글]

Insights

Jackrong/Qwopus3.6-27B-Coder-MTP

요약

핵심 포인트

댓글

Claude에게 지속적이고 검색 가능한 뉴스 메모리를 제공하는 MCP 서버를 구축했습니다 (GNews 기반, 월간 다운로드 약 106k)

이란 합의 기대감에 유가 급락, 공동 개입 후 엔화 강세

에이전트의 IP가 변경되어도 연결 상태를 유지하는 방법: 주소가 IP보다 오래 지속되기 위해 필요한 조건

Shein, IPO 앞두고 후기 단계 투자자들을 위한 현금 지급 및 추가 주식 제공 검토

Claude에게 지속적이고 검색 가능한 뉴스 메모리를 제공하는 MCP 서버를 구축했습니다 (GNews 기반, 월간 다운로드 약 106k)

이란 합의 기대감에 유가 급락, 공동 개입 후 엔화 강세

에이전트의 IP가 변경되어도 연결 상태를 유지하는 방법: 주소가 IP보다 오래 지속되기 위해 필요한 조건

Shein, IPO 앞두고 후기 단계 투자자들을 위한 현금 지급 및 추가 주식 제공 검토