Microsoft, Hugging Face에 Lens 공개

Microsoft가 Hugging Face에 Lens를 공개했습니다.

Z-Image에서 사용된 학습 연산량(training compute)의 단 19.3%만으로 SOTA(State-of-the-Art, 최첨단) 품질을 달성하는 3.8B-parameter(38억 파라미터) 텍스트-이미지 생성 모델(text-to-image model)입니다. 1024px 이미지를 3.15초 만에 생성하며, 최대 1440×1440 해상도까지 지원합니다.

논문(Paper):
https://huggingface.co/papers/2605.21573

모델(Models):
https://huggingface.co/microsoft/Lens
https://huggingface.co/microsoft/Lens-Turbo
https://huggingface.co/microsoft/Lens-Base

대규모 오디오 언어 모델(Large Audio Language Models)에 관한 조사

이 연구는 6가지 핵심 축을 통해 오디오 LLM(Large Language Models)의 신뢰성 지형을 매핑합니다.
성숙한 공격(attacks)과 파편화된 방어(defenses) 사이의 격차를 드러내며, 본질적으로 신뢰할 수 있는 청각 AI(auditory AI)를 향한 로드맵을 제시합니다.

Insights

Microsoft, Hugging Face에 Lens 공개

요약

핵심 포인트

댓글

AI 헤지 펀드 — Claude의 분석

하이닉스를 긍정적으로 보는 이유 중 하나는 HBF 때문입니다.

Internet Identity에 MCP 서버가 도입됩니다.

AI 경쟁의 본질은 가장 똑똑한 모델을 만드는 것이 아니다

하이닉스를 긍정적으로 보는 이유 중 하나는 HBF 때문입니다.

Internet Identity에 MCP 서버가 도입됩니다.

AI 경쟁의 본질은 가장 똑똑한 모델을 만드는 것이 아니다