Lemonade v10.7 출시 및 프로젝트 조직 업데이트
요약
Lemonade v10.7이 출시되어 옴니모달 채팅, 자동 튜닝, 교차 벤더 지원 기능이 추가되었습니다. 다양한 백엔드와 모델을 결합하여 로컬 AI 환경의 성능과 호환성을 대폭 강화했습니다.
핵심 포인트
- LMX-Omni 가상 모델을 통한 옴니모달 채팅 및 멀티미디어 렌더링 지원
- lemonade bench CLI 도구를 통한 LLM 성능 데이터 수집 및 자동 최적화
- CUDA, Vulkan 지원을 통한 AMD, Apple Silicon, Nvidia, Intel GPU 가속 구현
- Open WebUI 및 다양한 OpenAI 클라이언트와의 호환성 확보
오늘의 v10.7 출시는 Lemonade 프로젝트의 흥미로운 새로운 장의 시작이기에, 프로젝트 차원의 업데이트를 공유하고자 합니다. Lemonade의 로드맵과 개발은 현재 6개의 워킹 그룹 (working groups)에 의해 주도되고 있으며, 그중 4개는 AMD 직원이 아닌 이들이 이끌고 있습니다. 19명의 기여자가 참여한 v10.7 출시 버전에서 3개 그룹의 주요 하이라이트는 다음과 같습니다.
Local Omni Models: 여러 백엔드 (backends)와 모델을 원활하게 결합하여 이미지 생성/편집을 포함한 진정한 옴니모달 (omni-modal) 채팅을 제공합니다. v10.7은 이러한 LMX-Omni 가상 모델들이 Open WebUI 및 멀티미디어 렌더링을 지원하는 기타 OpenAI 클라이언트와 호환되도록 만듭니다.
Auto Tuning: 사용자가 최적화 플래그 (optimizing flags)를 걱정할 필요 없이 모든 시스템이 최고의 성능을 낼 수 있어야 합니다. v10.7은 llama.cpp, FastFlowLM, 그리고 vLLM 전반에 걸쳐 동일 선상에서의 LLM 성능 데이터를 수집하는 lemonade bench CLI 도구를 추가함으로써 이를 시작합니다.
Cross-Vendor Support: Lemonade가 모든 플랫폼에서 훌륭한 경험을 제공한다면 로컬 AI를 발전시키려는 사명을 달성할 최고의 기회를 얻을 것입니다. v10.7은 llama.cpp 및 stable-diffusion.cpp를 위한 CUDA 백엔드와 sd-cpp를 위한 Vulkan을 추가하였으며, 앞으로 더 많은 지원이 예정되어 있습니다. v10.7 기준으로 LMX-Omni 가상 모델은 이제 AMD, Apple Silicon, Nvidia, 그리고 Intel 시스템에서 GPU 가속이 가능합니다.
다음 단계: 워킹 그룹 로드맵은 여기서 확인할 수 있습니다. 우리가 진행하고 있는 작업이 마음에 드신다면, 여기서 피드백을 주시고, 리포지토리 (repo)에 스타를 눌러주시며, Lemonade Discord에서 격주로 열리는 공개 회의에 참여해 주세요!
AI 자동 생성 콘텐츠
본 콘텐츠는 r/LocalLLaMA의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기