본문으로 건너뛰기

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

r/StableDiffusion분석

ComfyUI의 HiDream-01-Image 지원이 출시되었습니다

이미지 생성 모델인 HiDream-01-Image가 ComfyUI에 공식적으로 지원되기 시작했습니다. 이 업데이트는 사용자들이 새로운 체크포인트와 기능을 활용하여 이미지 생성 워크플로우를 더욱 확장할 수 있게 합니다.

comfyuihiredreamimage-generation
4일 전4
arXiv논문

MMVIAD: 산업 이상 감지를 위한 다중 시점 다중 작업 비디오 이해

본 기사는 산업 이상 감지(Industrial anomaly detection) 분야의 한계를 극복하기 위해 개발된 새로운 벤치마크 데이터셋 MMVIAD를 소개합니다. MMVIAD는 약 120도의 카메라 움직임을 가진 객체 중심의 연속 다중 시점 비디오 클립으로 구성되어, 실제 산업 검사 과정을 현실적으로 반영했습니다. 이 데이터셋은 이상 감지 및 결함 탐지 등 다양한 작업을 지원하며, 이를 활용한 모델(VISTA)이 기존 최고 성능을 능가하는 결과를 보여주었습니다.

industrial-anomaly-detectionvideo-understandingmulti-view
4일 전3
arXiv논문

통제된 환경에서 야생 환경으로: 실제 세계를 위한 펜테스팅 에이전트 평가

AI 펜테스팅 에이전트의 신뢰도가 높아지고 있지만, 기존의 벤치마크는 제한된 환경과 미리 정의된 목표(예: 플래그 획득)에만 초점을 맞추고 있어 실제 세계에서의 성능을 정확히 측정하는 데 한계가 있습니다. 본 논문은 이러한 문제를 해결하기 위해 평가의 초점을 단순한 과제 완료에서 '검증된 취약점 발견'으로 전환하는 실용적인 새로운 평가 프로토콜을 제시합니다.

ai-pentestingsecurity-assessmentagent-evaluation
4일 전6
arXiv논문

신경망 가중치 노름 = 콜모고로프 복잡도

본 논문은 루프형 신경망의 최소 가중치 노름이 출력 문자열의 콜모고로프 복잡도의 로그 인자 차이에 같다는 것을 증명합니다. 이는 가중치 감쇠(weight decay)가 계산 가능한 함수에 대한 최적 사전 확률인 솔로몬오프 보편 사전 확률과 다항식 인자 차이까지 일치하는 사전을 유도함을 의미하며, 노름의 종류와 무관하게 성립하는 일반적인 경계입니다. 이 결과는 고정 정밀도(fixed precision) 환경에서만 유효하며, 신경망 가중치를 프로그램으로 인코딩하고 로그 주소 지정 오버헤드를 통해 설명할 수 있다는 두 가지 핵심 축소 과정을 활용합니다.

neural-networksweight-decaykolmogorov-complexity
4일 전4
arXiv논문

V4FinBench: 기업 파산 예측을 위한 테이블형 기반 모델, LLM 및 표준 방법론의 벤치마킹

V4FinBench는 기업 파산 예측이라는 고위험 금융 과제를 위한 새로운 벤치마크입니다. 이 데이터셋은 Visegràd Group (V4) 경제의 2006년부터 2021년까지의 데이터를 활용하여, 131개의 재무 및 비재무 특징과 6가지 예측 시점을 포함하는 백만 개 이상의 회사-연도 기록으로 구성되어 있습니다. 이 데이터셋은 기존 공개 데이터셋의 부족함과 한계를 극복하고, TabPFN 같은 모델이 실제 금융적 어려움 구조를 포착할 수 있도록 평가 및 개발을 지원하는 것을 목표로 합니다.

financial-forecastingbankruptcy-predictionllm-benchmarking
4일 전3
arXiv논문

MulTaBench: 텍스트 및 이미지를 활용한 멀티모달 테이블 학습 벤치마킹

본 기사는 기존 테이블 기반 파운데이션 모델이 겪는 한계점, 즉 비정형 모달리티(텍스트 및 이미지)에 대한 네이티브 지원 부족 문제를 지적합니다. 특히 기존 멀티모달 테이블 학습 벤치마크가 단순한 모달리티의 동시 발생에만 초점을 맞추어 태스크별 조정의 이점을 가리는 경향을 비판합니다. 이를 해결하기 위해, 공동 모델링과 타겟 인식 표현을 통합하는 새로운 아키텍처를 제안하며 멀티모달 테이블 파운데이션 모델 개발의 방향성을 제시합니다.

multimodaltabular-datafoundation-models
4일 전4
arXiv논문

RubricEM: 검증 가능한 보상을 넘어선 루브릭 기반 정책 분해를 활용한 Meta-RL

본 연구는 깊이 있는 연구 에이전트(deep research agents)를 훈련시키는 새로운 강화학습 프레임워크인 RubricEM을 제안합니다. 기존의 검증 가능한 보상 방식으로는 복잡한 계획, 검색, 증거 평가 과정을 거치는 에이전트의 행동 경로와 경험 재사용에 한계가 있었습니다. RubricEM은 루브릭(rubric)을 단순한 최종 평가 도구가 아닌, 정책 실행, 심사 피드백, 그리고 에이전트 메모리를 구조화하는 공유 인터페이스로 활용하여 단계별 정책 분해를 가능하게 합니다.

reinforcement-learningdeep-research-agentsrubric-based
4일 전3
arXiv논문

Multi-Marginal Optimal Transport와 Schrödinger Bridges를 이용한 최적 및 확장 가능한 MAPF

본 기사는 익명 다중 에이전트 경로 찾기(MAPF) 문제를 Multi-Marginal Optimal Transport (MMOT) 문제로 재구성하고, 이를 선형 계획법(LP)으로 축소하는 방법을 제시합니다. 특히 익명 환경에 초점을 맞추어, 이 LP가 실현 가능하고 완전 단일 모듈러 조건을 만족함을 증명함으로써 공간 및 시간적으로 충돌이 없는 최소 비용의 정수 수송 경로를 효율적으로 산출할 수 있음을 보여줍니다.

mapfoptimal transportlinear programming
4일 전1
arXiv논문

MDP에서 확률적 안전성을 보장하기 위한 쉴드

본 논문은 자율 에이전트의 안전성을 확보하기 위한 '쉴딩(Shielding)' 기법을 다루며, 특히 확률적 안전성(probabilistic safety)을 보장하는 확장된 프레임워크를 제시합니다. 기존의 쉴딩이 절대적인 안전성을 목표로 했다면, 이 연구는 어느 정도 수용 가능한 확률로 위험이 발생하는 경우에 초점을 맞춥니다. 이를 위해 강력한 보장을 유지하면서도 자연스러운 쉴드를 제공하고, 오프라인 및 온라인 환경에서 작동하는 새로운 쉴드 구성 방식을 제안합니다.

shieldingsafety-guaranteesprobabilistic-safety
4일 전6
X요약

VS코드에서 클로드 오푸스 4.7 업데이트가 안됐을때 사용 법 1. Ctrl + ` = 터미널 열어준다

VS Code 환경에서 Claude Opus 4.7 업데이트가 제대로 적용되지 않을 경우, 터미널을 열어 특정 npm 명령어를 실행하여 라이브러리를 수동으로 업데이트할 수 있습니다. 구체적으로 `npm update -g @anthropic -ai/ claude -code` 명령어를 복사하여 붙여넣고 VS Code를 재시작하는 과정을 거치면 문제를 해결하고 최신 버전을 사용할 수 있습니다.

vscodeclaude-opusanthropic
4일 전2
arXiv논문

AI 워크플로우 스토어(AI Workflow Store)를 활용하여 개인 에이전트에 견고성 엔지니어링하기

본 글은 현재 AI 에이전트의 주류 패러다임인 '즉석(on-the-fly)' 계획 합성 및 실행 방식에 의문을 제기하며, 이 방식이 신뢰성 있고 안전한 소프트웨어 시스템을 구축하는 데 필요한 체계적인 엔지니어링 프로세스를 단축시킨다고 지적합니다. 따라서 AI 에이전트가 사용자에게 효과적으로 제공되기 위해서는 반복적 설계, 엄격한 테스트, 적대적 평가 등 전통적인 소프트웨어 엔지니어링(SE)의 원칙들을 통합해야 함을 주장합니다.

ai-agentssoftware-engineeringrobustness
4일 전4
Qiita헤드라인

【속보】OpenAI가 브라우저를 장악하다! Codex Chrome 확장으로 '로그인 세션'에 AI가 접근하는 시대

OpenAI가 출시한 'Codex Chrome 확장'은 AI 에이전트가 사용자의 로그인된 브라우저 세션(Gmail, Salesforce 등)에 직접 접근하여 정보를 추출하거나 작업을 수행할 수 있게 합니다. 이로 인해 AI를 활용한 업무 자동화의 편의성은 극대화되었으나, 기업 환경에서는 API 키나 사내 인증 정보 유출 및 컴플라이언스 위반 위험이 매우 높습니다. 따라서 사용자는 높은 편리성을 제공하는 Codex 방식과, 보안을 위해 별도 프로세스로 실행되며 세션을 공유하지 않는 Claude Code 방식을 비교하여 신중하게 접근해야 합니다.

openaiai-agentschrome-extension
4일 전4
Dev.to헤드라인

FirstCall v0.1.0: 에이전트를 위한 로컬 우선 API 레시피 워크벤치

FirstCall v0.1.0은 요청 소스를 검증되고 마스킹된 API 레시피 패키지로 변환하는 Rust 기반의 로컬 우선 데스크톱 및 CLI 도구입니다. 이 도구는 curl, OpenAPI, Postman Collections 등 다양한 형식의 입력(Input)을 받아 RequestDraft 후보를 생성하고, 로컬에서 검증하며, 최종적으로 에이전트가 사용할 수 있는 준비된 레시피 패키지로 출력합니다. FirstCall은 GUI와 CLI 두 가지 인터페이스를 제공하여 사용자가 요청 소스를 체계적으로 관리하고 테스트할 수 있도록 돕습니다.

rustapi-testingagent-workflow
4일 전1
r/ClaudeAI분석

Claude Code가 'run until done' 모드를 출시했습니다. /goal로 업그레이드하세요 v2.1.139.

Anthropic의 Claude Code에 중요한 업데이트가 이루어졌습니다. 주요 내용은 비동기(async) 기능 지원과 새로운 `/goal` 명령어 도입입니다. 이 업데이트를 통해 사용자는 코드 실행을 특정 목표 달성 시점까지 지속적으로 제어할 수 있게 되어, 복잡하고 장기적인 작업 흐름을 더욱 효과적으로 관리할 수 있습니다.

claude-codeasyncai-coding
4일 전3
X요약

Vercel Labs가 zero-native로 실험 중: 웹 UI와 Zig를 사용해 데스크톱 및 모바일 네이티브 앱 구축. 가벼운 바이너리

Vercel Labs가 'zero-native'라는 새로운 접근 방식을 실험하며, 웹 UI와 Zig 언어를 활용하여 데스크톱 및 모바일 네이티브 애플리케이션을 구축하는 방법을 제시합니다. 이 방식은 가벼운 바이너리와 낮은 메모리 사용량을 특징으로 하며, Next.js, Vue, Svelte, React 등 다양한 프론트엔드 프레임워크를 지원합니다. macOS, Linux, Windows는 물론 iOS와 Android까지 광범위한 플랫폼을 커버할 수 있습니다.

web-uizig-languagenative-apps
4일 전2
X요약

이메일은 하루에 수십억 개의 메시지가 1970년대의 프로토콜에 의존하며, 이 프로토콜은 제대로 수정된 적이 없고 — 단지 연속적인

이 글은 현대의 이메일 시스템이 1970년대에 개발된 프로토콜(SMTP)에 크게 의존하고 있으며, 시간이 지나면서 여러 보안 레이어(SPF, DKIM, DMARC 등)가 추가되어 복잡해졌음을 지적합니다. 기사는 SMTP 전송부터 수신까지의 전체 과정을 단계별로 상세히 설명하며, 이메일 시스템의 작동 원리를 깊이 있게 다룹니다.

smtpemail-protocolsecurity
4일 전4
Dev.to헤드라인

AI Google Ads Generator: 과거의 나에게 듣는 KOL 위장(Faking KOL)에 대한 질의응답

이 글은 SaaS 제품 광고 크리에이티브 제작 과정에서 겪었던 시행착오와 교훈을 공유하는 사후 분석(postmortem) 글입니다. 저자는 AI 아바타 생성 도구(HeyGen, Synthesia 등)를 사용하여 다양한 방식으로 광고 영상을 만들었지만, 낮은 CTR과 비효율성을 경험했습니다. 핵심은 완벽한 결과물에 집착하기보다, '테이블 속의 행'처럼 취급하며 저렴하게 대량으로 테스트하고, 가장 중요한 것은 개별 오디오 및 B-roll 레이어를 추출하여 전문 편집 툴(DaVinci Resolve)에서 재편집할 수 있는 워크플로우를 구축하는 것입니다.

saas-marketingai-video-generationgoogle-ads
4일 전3
Dev.to헤드라인

AI 데이터베이스 에이전트를 위한 누락된 계층: 스키마 컨텍스트

AI 에이전트를 데이터베이스에 연결하여 유용한 답변을 얻는 것은 기술적으로 가능하지만, 모델에게 필요한 것은 단순히 스키마 덤프가 아닌 '올바른 컨텍스트'입니다. 이 컨텍스트에는 어떤 테이블과 컬럼이 중요한지, 조인 방식, 의미 있는 메트릭 정의, 데이터의 민감도 및 최신성 등의 작업별 경계(boundaries) 정보가 포함되어야 합니다. 효과적인 에이전트는 부서나 사용 목적에 따라 범위가 지정된 컨텍스트를 제공하여 노이즈를 줄이고 정확도를 높일 수 있습니다.

ai-agentsdatabase-contextllm-integration
4일 전7
Dev.to헤드라인

Swarm Orchestrator v8.0.2

Swarm Orchestrator v8.0.2가 출시되어 대규모 토너먼트 및 위조 워크로드의 안정성을 크게 개선했습니다. 주요 업데이트로는 이전에 알려진 네 가지 아키텍처적 제한 사항이 모두 해결되었으며, 토너먼트 모드가 단일 모드와 동일한 파이프라인으로 스트리밍되도록 통합되었습니다. 또한, 실시간 비용 상한 적용 기능이 추가되어 예상 지출액 초과 시 즉시 실행을 중단시키고, 스냅샷 정리 기능도 자동화 및 보존 정책 지원을 받게 되었습니다.

orchestrationworkflowstability
4일 전3
arXiv논문

Step Rejection Fine-Tuning: 실용적인 증류 레시피

본 기사는 LLM 에이전트 훈련의 표준 방법인 Rejection Fine-Tuning (RFT)의 한계를 지적하고, 이를 개선한 Step Rejection Fine-Tuning (SRFT)을 제안합니다. RFT는 실패한 전체 궤적을 폐기하는 반면, SRFT는 크리틱 LLM을 사용하여 궤적의 개별 단계(step)가 정확한지 평가합니다. 이 방법을 통해 모델은 오류를 재현하지 않으면서도 오류로부터 회복하는 능력을 학습하며, SWE-bench Verified 테스트에서 RFT보다 더 높은 해결률 향상(3.7% vs 2.4%)을 보여주었습니다.

llmfine-tuningagent-training
4일 전4

이 피드 구독하기

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.