본문으로 건너뛰기

© 2026 Molayo

GitHub헤드라인2026. 06. 27. 03:23

다른 탭이나 창에서 로그인했습니다

요약

PS 출력 시 모델의 최대 컨텍스트 대신 스케줄러가 선택한 컨텍스트 크기를 보고합니다. 이를 통해 클라이언트가 VRAM 용량에 맞춰 컨텍스트 크기를 조절함으로써 성능 저하를 방지할 수 있습니다.

핵심 포인트

  • 모델 최대 컨텍스트 대신 스케줄러 선택 크기 노출
  • VRAM 용량이 적은 시스템에서의 페이징 방지
  • 클라이언트가 최적의 컨텍스트 크기를 유지하도록 힌트 제공

다른 탭이나 창에서 로그인했습니다. 세션을 새로고침하려면 페이지를 다시 로드하세요. 다른 탭이나 창에서 로그아웃했습니다. 세션을 새로고침하려면 페이지를 다시 로드하세요. 다른 탭이나 창에서 계정을 전환했습니다. 세션을 새로고침하려면 페이지를 다시 로드하세요. 알림 닫기

PS 출력에서 항상 모델의 최대 컨텍스트(model max context)를 보고하는 대신, 스케줄러가 선택한 크기(모델 컨텍스트 크기에 의해 제한됨)를 노출합니다. 이는 클라이언트가 VRAM 용량이 적은 시스템에서 페이징(paging)과 성능 저하를 피하기 위해 컨텍스트 크기를 이 값보다 낮게 유지할 수 있도록 힌트를 제공하는 데 도움이 됩니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 RSS: GitHub ollama/ollama releases의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0