본문으로 건너뛰기

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

arXiv논문

마지막 레이어를 넘어: 시각 토큰화를 위한 다중 레이어 표현 융합

본 논문은 기존의 표현 오토인코더가 마지막 인코더 레이어에서만 특징을 추출하여 발생하는 시각 정보 손실 문제를 해결하기 위해 다중 레이어 특징 융합 모듈 DRoRAE를 제안합니다. DRoRAE는 에너지 제약 라우팅과 증분 보정을 통해 모든 인코더 레이어를 적응적으로 집계하며, 이를 통해 풍부해진 잠재 표현을 생성합니다. 실험 결과, ImageNet-256에서 rFID 및 생성 FID가 크게 개선되었으며, 이는 텍스트-이미지 합성 등 다양한 분야에 전이 가능함을 입증했습니다.

visual-tokenizationautoencodersmulti-layer-fusion
4일 전4
arXiv논문

StereoTales: LLM의 개방형 스테레오타입 발견을 위한 다국어 프레임워크

StereoTales는 개방형 대규모 언어 모델(LLM) 생성 과정에서 발생하는 사회적 편향을 다국어로 체계적으로 연구하기 위해 개발된 프레임워크입니다. 이 프레임워크는 10개 언어와 79가지 사회-인구통학적 속성을 포괄하며, 23개의 최신 LLM이 생성한 65만 개 이상의 이야기를 포함하고 있습니다. 이를 통해 연구자들은 통계적 분석을 수행하여 과도하게 표현된 편향된 연관 관계를 식별하고 평가할 수 있는 도구를 얻게 됩니다.

llm-biasmultilingualfairness
4일 전4
Tom's HW헤드라인

SoftBank, AI 데이터 센터 전력 공급을 위해 수계 기술로 자체 배터리 제조 예정 — 2028년까지 기가와트시급 생산 목표

소프트뱅크는 AI 데이터 센터의 급증하는 전력 수요에 대응하기 위해 오사카 사카이 시설에서 자체 배터리 제조를 시작합니다. 이들은 한국 스타트업과 협력하여 인화성 유기 용매 대신 수계 전해질을 사용하는 아연-할로겐 배터리를 개발합니다. 이 기술은 열 폭주 위험을 제거하고, 리튬/코발트에 대한 공급망 의존도를 낮추는 장점을 가지며, 2028년까지 기가와트시급 생산을 목표로 합니다.

softbankbattery-storageaqueous-electrolyte
4일 전4
r/LocalLLaMA분석

전기 낭비 그만하기

본 글은 RTX 4090과 llama.cpp를 사용하여 LLM을 구동하는 환경에서 전력 효율성을 개선하는 방법을 다룹니다. 사용자는 `nvidia-smi -pl N` 명령어를 통해 GPU의 전력을 제한하여, 성능 저하 없이 실제 소비 전력을 약 40%까지 줄일 수 있음을 관찰했습니다.

gpu-optimizationllmnvidia-smi
4일 전10
The헤드라인

OpenAI가 Claude Mythos에 대한 답변을 공개하다

OpenAI는 공격자가 취약점을 발견하기 전에 선제적으로 탐지하고 패치하는 데 초점을 맞춘 AI 이니셔티브인 Daybreak를 발표했습니다. Daybreak는 기존의 Codex Security AI 에이전트를 활용하여 조직 코드를 기반으로 위협 모델을 생성하고, 잠재적인 공격 경로와 고위험 취약점을 자동으로 검증 및 탐지합니다. 이는 경쟁사인 Anthropic이 보안 중심 모델 Claude Mythos를 공개한 것에 대한 대응이자 업계의 보안 강화 추세를 보여줍니다.

openaidaybreakcybersecurity
4일 전5
llama.cpp헤드라인

b9115: convert : LoraTorchTensor에 split() 메서드 추가 및 LoRA 컨버터 개선 (#22832)

이 기술 기사는 LoRA(Low-Rank Adaptation) 관련 라이브러리의 개선 사항을 다루고 있습니다. 주요 업데이트 내용은 `LoraTorchTensor` 클래스에 `split()` 메서드를 추가하여 텐서 분할 기능을 강화한 것입니다. 또한, Python 타입 검사 수정, `torch.split` 디스패치 로직 개선, 그리고 다양한 버그 및 리팩토링 작업이 포함되어 전반적인 코드 안정성과 사용 편의성을 높였습니다.

lorapytorchtensor-manipulation
4일 전2
arXiv논문

Deep Low-Rank Residual Distillation을 통한 사전 학습 가중치 잠금

본 기술 기사는 오픈 웨이트 언어 모델의 높은 품질과 개방성을 언급하며, 이를 활용한 연구 및 배포의 용이성을 설명합니다. 핵심적으로는 'Deep Low-Rank Residual Distillation'이라는 방어 기법을 소개하여, 이 방법이 완전한 지식을 가진 적응형 공격자(adaptive attackers)에 대한 방어 능력을 입증하는 동시에 원래 모델의 기능을 유지할 수 있음을 주장하고 있습니다.

llmmodel-securitydistillation
4일 전4
arXiv논문

PathISE: 지식 그래프 질문 답변을 위한 정보성 경로 감독 학습

PathISE는 지식 그래프 질문 답변(KGQA) 시스템의 성능 향상을 목표로 하는 새로운 프레임워크입니다. 기존 KGQA 방법들이 LLM을 활용하여 KGs에 접지시키지만, 효과적인 증거 검색을 위해서는 고품질의 중간 감독 신호가 필수적이며 이는 얻기 어렵습니다. PathISE는 답변 수준의 레이블만을 사용하여 질문과 관련된 '정보성 경로(informative paths)'를 자동으로 학습하고 추출함으로써 이 문제를 해결합니다.

knowledge-graphqa-systemllm
4일 전4
arXiv논문

DeepRefine: 강화학습 (RL)을 통한 에이전트 컴파일 지식 정제

본 기술 기사는 대규모 언어 모델(LLM) 에이전트가 생성하는 외부 지식의 품질 문제를 다룹니다. 특히, 이 지식이 불완전성, 부정확성, 중복성 등의 결함으로 인해 검색 충실도와 다운스트림 태스크 성능을 저하시키는 문제를 지적합니다. 이를 해결하기 위해 'DeepRefine'이라는 일반적인 LLM 기반 추론 모델을 제안하여 에이전트가 컴파일한 지식을 정제하는 방법을 제시합니다.

llmknowledge-graphreinforcement-learning
4일 전6
Deep Tech요약

뉴스 소식: 한 사용자가 Claude에게 forgeCAD를 열고 아래 키보드를 3D로 디자인해 달라고 요청한 적이 있음.

사용자가 Claude AI에게 특정 키보드 디자인을 3D 모델링 프로그램인 forgeCAD를 사용하여 구현해 달라고 요청한 사례가 공유되었습니다. 이 사례는 사용자가 직접 제작한 커스텀 키캡 기반의 키보드를 주제로 하며, AI가 전문적인 CAD 작업을 수행할 수 있는 가능성을 보여줍니다.

claude3d-modelingcad
4일 전4
arXiv논문

Few-Step Distillation을 위한 무한 마스크 확산 (Infinite Mask Diffusion)

마스크드 디퓨전 모델(MDMs)은 언어 모델링 분야에서 자기회귀적 모델의 강력한 대안으로 주목받고 있습니다. MDMs는 마스킹된 토큰과 데이터 간의 명확한 구분을 통해 병렬 디코딩 및 양방향 컨텍스트 처리를 가능하게 합니다. 특히, 'Few-Step Distillation'을 위한 무한 마스크 확산(Infinite Mask Diffusion) 기법은 이러한 모델의 효율성을 높이는 데 초점을 맞추고 있습니다.

masked-diffusionlanguage-modelingdiffusion-models
4일 전4
X요약

비디오 버전의 Nano Banana 습격 @GeminiApp 의 새로운 비디오 모델로 추정되는 「Gemini Omni」의 리크 출력이 유포되고

최근 'Gemini Omni'로 추정되는 새로운 비디오 모델의 리크 출력이 유포되면서 큰 주목을 받고 있습니다. 이 모델은 단순히 영상을 생성하는 것을 넘어, 화면에 나타나는 '문자 정보의 의미적 일관성(textual integrity)'을 유지하는 데 강점을 보였습니다. 특히 삼각함수 증명과 같은 복잡한 수식 과정에서 글자가 무너지지 않고 논리적으로 그려지는 모습이 핵심적인 기술 진보로 평가됩니다.

video-aigemini-omnitextual-integrity
4일 전4
AI Automation요약

Claude Cowork를 만든 Anthropic 엔지니어 Boris Cherny가 실제 사용 방법에 대한 마스터클래스를 공개했습니다.

Anthropic의 엔지니어 Boris Cherny가 자신이 개발한 Claude Cowork를 활용하는 방법에 대한 마스터클래스를 공개했습니다. 이 클래스는 사용자들이 워크플로우를 자동화하고 생산성을 극대화할 수 있도록 실질적인 가이드를 제공합니다.

anthropicclaude-coworkai-tools
4일 전4
arXiv논문

ALAM: Vision-Language-Action 모델을 위한 대수적으로 일관된 잠재 전이 (Algebraically Consistent

ALAM은 Vision-Language-Action (VLA) 모델의 성능 한계를 극복하기 위해 개발된 새로운 프레임워크입니다. 이 모델은 행동 레이블이 부족한 상황에서 비디오 데이터가 제공하는 물리적 세계 변화에 대한 사전 지식을 활용합니다. ALAM은 대수적으로 일관된 잠재 전이(algebraically consistent latent transfer)와 공동 흐름 매칭을 결합하여, 기존 VLA 정책 대비 MetaWorld MT50 및 LIBERO 등 다양한 환경에서 현저하게 높은 성공률 향상을 입증했습니다.

vision-language-actionroboticslatent-space
4일 전5
Vercel헤드라인

Node.js 26.x가 Vercel Sandboxes에서 사용 가능해졌습니다

Vercel Sandbox가 Node.js 버전 26을 공식적으로 지원하게 되었습니다. 개발자들은 `@vercel/sandbox` 라이브러리를 사용하여 `runtime: "node26"` 속성을 설정함으로써 이 버전을 활용할 수 있습니다. 이를 통해 Vercel 환경에서 최신 Node.js 기능을 테스트하고 애플리케이션의 호환성을 검증하는 것이 가능해졌습니다.

nodejsvercelsandbox
4일 전5
r/StableDiffusion분석

ZIT I2I '캐릭터 LORA 변환' 워크플로우

본 기술 기사는 입력된 임의의 이미지를 기반으로 캐릭터 LORA를 활용하여 유사한 스타일의 새로운 이미지를 생성할 수 있는 워크플로우를 소개합니다. 이 워크플로우는 ZIT 환경에 최적화되어 빠르며, 다른 모델로도 쉽게 확장 적용이 가능합니다. RTX 4070 Super와 같은 일반적인 하드웨어에서도 매우 빠른 속도로 고품질 이미지 생성이 가능함을 보여줍니다.

loraimage-generationai-workflow
4일 전4
r/StableDiffusion분석

ComfyUI의 HiDream-01-Image 지원이 출시되었습니다

이미지 생성 모델인 HiDream-01-Image가 ComfyUI에 공식적으로 지원되기 시작했습니다. 이 업데이트는 사용자들이 새로운 체크포인트와 기능을 활용하여 이미지 생성 워크플로우를 더욱 확장할 수 있게 합니다.

comfyuihiredreamimage-generation
4일 전4
arXiv논문

MMVIAD: 산업 이상 감지를 위한 다중 시점 다중 작업 비디오 이해

본 기사는 산업 이상 감지(Industrial anomaly detection) 분야의 한계를 극복하기 위해 개발된 새로운 벤치마크 데이터셋 MMVIAD를 소개합니다. MMVIAD는 약 120도의 카메라 움직임을 가진 객체 중심의 연속 다중 시점 비디오 클립으로 구성되어, 실제 산업 검사 과정을 현실적으로 반영했습니다. 이 데이터셋은 이상 감지 및 결함 탐지 등 다양한 작업을 지원하며, 이를 활용한 모델(VISTA)이 기존 최고 성능을 능가하는 결과를 보여주었습니다.

industrial-anomaly-detectionvideo-understandingmulti-view
4일 전3
arXiv논문

통제된 환경에서 야생 환경으로: 실제 세계를 위한 펜테스팅 에이전트 평가

AI 펜테스팅 에이전트의 신뢰도가 높아지고 있지만, 기존의 벤치마크는 제한된 환경과 미리 정의된 목표(예: 플래그 획득)에만 초점을 맞추고 있어 실제 세계에서의 성능을 정확히 측정하는 데 한계가 있습니다. 본 논문은 이러한 문제를 해결하기 위해 평가의 초점을 단순한 과제 완료에서 '검증된 취약점 발견'으로 전환하는 실용적인 새로운 평가 프로토콜을 제시합니다.

ai-pentestingsecurity-assessmentagent-evaluation
4일 전6
arXiv논문

신경망 가중치 노름 = 콜모고로프 복잡도

본 논문은 루프형 신경망의 최소 가중치 노름이 출력 문자열의 콜모고로프 복잡도의 로그 인자 차이에 같다는 것을 증명합니다. 이는 가중치 감쇠(weight decay)가 계산 가능한 함수에 대한 최적 사전 확률인 솔로몬오프 보편 사전 확률과 다항식 인자 차이까지 일치하는 사전을 유도함을 의미하며, 노름의 종류와 무관하게 성립하는 일반적인 경계입니다. 이 결과는 고정 정밀도(fixed precision) 환경에서만 유효하며, 신경망 가중치를 프로그램으로 인코딩하고 로그 주소 지정 오버헤드를 통해 설명할 수 있다는 두 가지 핵심 축소 과정을 활용합니다.

neural-networksweight-decaykolmogorov-complexity
4일 전4

이 피드 구독하기

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.