Gemma4_31b_fp8, 나의 테스트 환경에서 Sonnet_4.6_medium과 대등한 성능을 보여줌
요약
Gemma4_31b_fp8 모델이 테스트 환경에서 Sonnet_4.6_medium과 대등한 성능을 기록했습니다. 그래프 쿼리, 엔티티 추출, 에이전트 도구 호출 및 코드 작성 등 다양한 벤치마크에서 우수한 결과를 보였습니다.
핵심 포인트
- Gemma4_31b_fp8 모델의 높은 성능 확인
- Sonnet_4.6_medium과 대등한 벤치마크 결과
- Cypher 쿼리 및 엔티티 추출 능력 입증
- 에이전트 도구 호출 및 Python 코드 작성 우수
그래프 순회(graph traversal)를 위한 Cypher 쿼리 (neo4j)
텍스트 청크(text chunks)로부터 엔티티 추출 (web query, graph query, vectors)
에이전트 도구 호출 (Agentic tool calling) (기술 선택 / Pi에서의 성공적인 실행)
코드 작성 (Python)
멀티 벡터 검색(multi-vector-retrieval)의 합성/요약
Gemma/Qwen FP8 버전.
이것이 나에게 기쁨을 주었다.
submitted by /u/knob-0u812 to r/LocalLLaMA
[link] [comments]
AI 자동 생성 콘텐츠
본 콘텐츠는 r/OpenAI Codex (search)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기