Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
X @alicankiraz0 (자동 발견) 100건필터 해제
Composer 2.5 vs Opus 4.7 Max 디버깅 및 코드 리뷰 벤치마크 - 종합 점수
Composer 2.5와 Opus 4.7 Max의 디버깅 및 코드 리뷰 성능을 비교한 벤치마크 결과입니다. Opus 4.7 Max는 더 큰 컨텍스트와 높은 비용 및 시간이 소요되지만, Composer 2.5는 상대적으로 저렴하고 빠른 작업 속도를 보여줍니다.
보고서 품질 출력 벤치마크:
Composer 2.5와 Opus 4.7 Max의 디버깅 및 코드 리뷰 성능을 비교한 벤치마크 결과입니다. Opus 4.7 Max는 더 높은 비용과 시간이 소요되지만, Composer 2.5는 상대적으로 저렴하고 빠른 작업 속도를 보여줍니다.
새로운 LLM Sardaukar-Anti-sycophancyLLM 공개 예정 및 학습 방식 안내
새로운 LLM인 Sardaukar-Anti-sycophancyLLM의 출시 예고와 함께 학습 방식이 공개되었습니다. 이 모델은 직접 구축한 데이터셋을 활용하여 SFT 및 GRPO 파인튜닝 과정을 거쳤으며, 이달 말에 실제 답변 예시가 공유될 예정입니다.
우리는 아마도 개구리와 뜨거운 물 실험을 목격하고 있는 것 같아. 그리고 아무도 신경 쓰지 않아. 참고: 개구리가 누구인지 아무도 모르는데…
Accenture가 AI 중심의 구조조정을 통해 11,000명 이상의 직원을 해고하며 8억 6,500만 달러 규모의 인력 감축을 단행했습니다. 이는 AI 기술 도입이 실제 고용 시장에 미치는 영향을 상징하는 '끓는 물 속의 개구리' 실험과 같다는 비판적 시각을 담고 있습니다.
대형 모델 서빙에서는 다음과 같습니다; - 70B FP8: 단일 Blackwell에 맞음 (~70 GB 가중치 + 26 GB KV 캐시).…
대형 모델 서빙 시, 70B FP8 모델을 단일 Blackwell GPU에 배포할 경우 약 70GB의 가중치와 26GB의 KV 캐시가 필요합니다. 반면, 4개의 NVIDIA RTX 3090 카드를 사용할 경우 네이티브 FP8 지원이 어려워 AWQ INT4를 사용해야 하며, 이 과정에서 카드 간 텐서 병렬 처리 및 PCIe 동기화가 발생하여 Blackwell 대비 낮은 처리량과 높은 지연 시간을 보입니다.
친구들 안녕하세요, v0.1 Research Preview에 이어 Qwen3.5-TurboQuant-MLX-LM v0.2
Qwen3.5-TurboQuant-MLX-LM v0.2 Modernization Preview가 Cursor에서 출시되었으며, 이를 통해 52배의 속도 향상과 추가 50%의 압축을 달성했습니다. 이 모델은 Apple M5 Max / 64 GB 환경에서 Qwen3.5-9B-MLX-4bit를 사용하여 성능이 측정되었습니다.
친구들, 여러분이 많이 물어보셨기 때문에 PCIe를 사용한 Multi-GPU 시스템의 단점에 대해 이야기하고 싶습니다. 왜냐하면 1x RTX…
본 글은 PCIe를 사용하여 여러 개의 GPU(Multi-GPU) 시스템을 구축할 때 발생하는 단점에 대해 다루고 있습니다. 특히, 고성능 단일 GPU(예: RTX Pro 6000) 대신 저가형 또는 구형 GPU를 여러 개 연결하는 클러스터 구성이 성능 면에서 잘못된 결정일 수 있음을 경고합니다.
즉, Nvlink 인프라와 이를 지원하는 GPU가 없다면 클러스터 (cluster) 시스템은 항상...
Nvlink 인프라와 이를 지원하는 GPU가 부족할 경우 클러스터 시스템은 항상 병목 현상을 겪게 됩니다. 이는 DGX Spark에서 지적되는 낮은 대역폭 문제와 관련이 있으며, 특히 장치의 200 GbE QSFP 입력과 전송 대역폭 간의 불일치가 원인으로 언급됩니다.
한국의 WIRobotics가 약 6,800만 달러를 유치했습니다. WIM 웨어러블 로봇과...
한국의 WIRobotics가 약 6,800만 달러($68M) 규모의 투자를 유치했습니다. 이 회사는 WIM 웨어러블 로봇과 ALLEX 휴머노이드 플랫폼을 주력으로 하며, 올해 모바일 ALLEX 연구용 플랫폼 공급을 계획하고 있습니다. 궁극적으로는 2027년 말까지 초기 상용화를 목표로 하고 있습니다.
여러분 안녕하세요, Apple Silicon에서 MLX 생태계를 통해 Gemma 4 31B MTP 모델 제품군을 실행하기 위한 오픈 소스 로컬
Apple Silicon 환경에서 MLX 생태계를 활용하여 Gemma 4 31B MTP 모델 제품군을 구동할 수 있는 오픈 소스 로컬 API 게이트웨이 프로젝트가 개발되었습니다. 이 프로젝트는 특히 Gemma4-31B-it 모델의 경우 기존 대비 1.42배의 속도 향상을 달성했습니다. 이는 Google의 Gemma 4 제품군과 연계되어 사용될 수 있습니다.
8시간, 10,313개의 패키지. Figure 03의 첫 번째 실시간 패키지 분류 실행. 언젠가는...
본 기사는 10,313개의 패키지를 분류하는 실시간 패키지 분류(package sorting) 실험의 결과를 다루고 있습니다. 이 과정은 Figure 03에서 처음으로 실행되었으며, 궁극적으로는 휴머노이드 로봇이 배송하는 패키지를 처리할 수 있는 시스템을 목표로 합니다.
Vibecoding이 이제 공식적으로 반자율적인 에이전트 구조 (agentic structure)로 진화했습니다. 복잡한 인터페이스와 세부
Vibecoding이 공식적으로 반자율적인 에이전트 구조(agentic structure)로 진화했습니다. 이전처럼 복잡한 인터페이스와 세부 사항을 다루는 대신, 모든 것을 단일 화면에서 관리할 수 있는 명령 및 제어 센터(command & control center) 형태로 단순화되었습니다.
우리는 @AMD에서 학습된 최초의 확산 언어 모델 (Diffusion Language Model)인
AMD 하드웨어에서 학습된 최초의 확산 언어 모델(Diffusion Language Model)인 ZAYA1-8B-Diffusion-Preview를 공개했습니다. 이 모델은 기존 자기회귀(Autoregressive) 방식과 달리 블록 단위의 병렬 생성을 통해 추론 속도를 획기적으로 개선했습니다.
친구 여러분, 큰 영광과 기쁨을 담아 공유하고자 합니다; 새로운 35B 파라미터 (parameter) MoE
새로운 35B 파라미터 MoE(Mixture-of-Experts) 아키텍처를 기반으로 개발된 Trendyol의 사이버 보안 모델이 뛰어난 성능을 입증했습니다. 이 모델은 권위 있는 사이버 보안 벤치마크인 CS-Eval의 모든 카테고리에서 글로벌 Top 6에 진입하는 성과를 거두었습니다. 특히 오픈 소스 모델들 사이에서도 높은 순위를 기록하며 그 우수성을 인정받았습니다.
Figure AI의 로봇이 YT와 Twitter에서 라이브 스트리밍으로 우체국에서 일하고 있어요.
Figure AI의 로봇이 유튜브와 트위터 라이브 스트리밍을 통해 우체국에서 업무를 수행하는 모습이 공개되었습니다. 이 로봇은 2시간 10분 만에 3,000개의 패키지를 정리하고 스캐너로 통과시키는 등 매우 빠른 처리 속도를 보여주었습니다. 이는 인간의 노동력을 대체할 수 있는 미래 자동화 시스템의 가능성을 시사합니다.
PT 5:05 업데이트: 공격 범위가 @TanStack 및 @Mistral을 훨씬 넘어 확장되었습니다.
PT 5:05 업데이트에 따르면, 공격 범위가 @TanStack 및 @Mistral 같은 기존 범위를 훨씬 넘어 확장되었습니다. 이번 분석에서는 @uipath, @squawk, @tallyui, @beproduct 등을 포함한 169개 npm 패키지 이름에서 총 373개의 악성 패키지 버전 항목을 발견했습니다. 이 악성코드는 사용자의 CI 자격 증명을 탈취하고 이를 이용해 전파되는 것이 특징입니다.
Gemma-4-26B-A4B-NVFP4가 단일 5090에서 65k context로 구동됩니다. 2개의 별도 RTX 5090에서 2개의 모델을
Gemma-4-26B-A4B-NVFP4 모델이 단일 RTX 5090 GPU에서 65k 컨텍스트 길이로 구동되는 것이 확인되었습니다. 또한, 두 개의 별도 RTX 5090을 사용하여 두 개의 모델을 서빙하는 것도 가능함을 보여줍니다. 특히, vLLM을 이용해 64k 컨텍스트 환경에서 단일 RTX 5090으로 구동 시 초당 약 109.89 토큰의 속도를 기록했습니다.
Xynova가 2세대 하이브리드 다재다능한 손(dexterous hand)인 Flex 2를 출시했습니다 — 그리고 Xiaomi가 이미
Xynova가 2세대 하이브리드 다재다능한 손인 Flex 2를 출시했으며, 이 제품은 23 DOF, ±0.1mm의 반복 정밀도 등 뛰어난 사양을 자랑합니다. 또한 Xiaomi는 Xynova의 엔젤 및 Pre-A 라운드에 투자하며 전략적 파트너십을 구축하고 있습니다. 이는 Xiaomi가 휴머노이드 로봇이 실제 일상 과업을 수행하는 데 필수적인 핵심 부품 계층(component layer)에 집중적으로 자금을 투입하고 있음을 시사합니다.
인간의 수행 능력 수준으로 8시간 교대 근무를 수행하는 휴머노이드 로봇 팀을 지켜보세요. 이것은 Helix-02를 사용하여 완전히 자율적으로
Helix-02를 활용하여 인간 수준의 수행 능력을 갖춘 휴머노이드 로봇 팀이 8시간 교대 근무를 자율적으로 수행하는 모습을 보여줍니다. 이 시스템은 소형 패키지 분류라는 특정 사용 사례에 적용되어, 바코드 감지, 패키지 집기, 방향 재설정 등의 작업을 연속적으로 처리합니다.
> 우리는 방금 새로운 이정표를 달성했습니다: Qibo에서 실행되는 단일 AMD Instinct MI355X GPU 상에서 정확히 35-큐비트
AMD는 Qibo 플랫폼에서 단일 AMD Instinct MI355X GPU를 사용하여 35-큐비트 양자 시뮬레이션을 성공적으로 수행했다고 발표했습니다. 이는 현재까지 AMD 하드웨어로 기록된 가장 큰 단일 GPU 기반 양자 컴퓨팅 결과입니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.