© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

LoopCoder-v2: 효율적인 테스트 시간 계산 스케일링을 위해 단 한 번만 루프 수행

LoopCoder-v2는 순차적 루핑의 지연 시간과 메모리 문제를 해결하기 위해 Parallel loop Transformers(PLT) 구조를 제안합니다. 연구 결과, 2회의 루프를 수행할 때 코드 생성 및 소프트웨어 엔지니어링 성능이 최적화됨을 확인했습니다.

Flow 기반 시각-언어-행동(Vision-Language-Action) 모델을 위한 불확실성 정량화 (Uncertainty

Flow matching 기반의 시각-언어-행동(VLA) 모델에서 인식론적 불확실성을 정량화하는 새로운 방법을 제안합니다. 속도장 불일치(VFD)를 활용해 모델의 실패를 감지하고, 적은 데이터로도 새로운 작업에 적응할 수 있는 SAVE 프레임워크를 선보입니다.

치명적 망각은 저차원이다: 지속적 적응을 위한 함수 공간 이론

지속적 학습 시 발생하는 치명적 망각 문제를 함수 공간(Function-space) 관점에서 분석한 연구입니다. NTK(Neural Tangent Kernel)를 활용해 망각 벡터를 예측하고, 망각이 특정 NTK 고유 모드에 집중된다는 사실을 밝혀냈습니다.

ConTex: 시계열 예측을 위한 반사실적 생성(Counterfactual Generation)의 재구성

ConTex는 시계열 예측의 의사결정을 돕기 위해 반사실적 생성(Counterfactual Generation)을 전역적으로 일관된 전략으로 재구성한 연구입니다. 기존의 인스턴스별 최적화 방식이 가진 높은 계산 비용과 불일치 문제를 해결하여 실시간 적용이 가능한 모델 불가지론적 아키텍처를 제안합니다.

INI-VPINN: 기하학적 특이점이 있는 다중 재료 도메인을 위한 암시적 Neumann 및 인터페이스 처리를 포함하는 변분 물리 정보 신경망

기하학적 특이점이 있는 다중 재료 도메인을 위해 Neumann 경계 및 인터페이스 조건을 암시적으로 처리하는 새로운 PINN 접근 방식인 INI-VPINN을 제안합니다. 이 방법은 추가적인 손실 항 없이도 물리적 일관성을 보장하며, 기존 방식보다 높은 정확도와 빠른 수렴 성능을 보여줍니다.

NoiseTilt: 확산 보상 정렬을 위한 노이즈 기울임 역 커널 (Noise-Tilted Reverse Kernels)

NTRK은 사전 학습된 확산 모델의 역 커널을 수정하지 않고 노이즈 항에 보상 기울기를 주입하는 새로운 샘플링 기법입니다. 기존 방식의 품질 저하와 탐색 효율성 문제를 해결하여, 샘플 품질을 유지하면서도 계산 효율성을 극대화합니다.

Volterra 생성 모델 (Volterra Generative Models)

Volterra 생성 모델은 기존 확산 모델의 메모리 없는 노이징 한계를 극복하기 위해 분수 커널을 통한 경로 의존적 노이즈를 도입한 새로운 프레임워크입니다. 비-마르코프 역학을 처리하기 위한 수학적 방법론을 제시하며, MNIST 및 CIFAR-10 실험을 통해 생성 성능과 확장성을 입증했습니다.

Qiita헤드라인

Claude Code의 스킬에 "괜찮은 MCP App 만들어줘"라고 통째로 맡겼더니, 괜찮은 조작 가능한 대시보드가 만들어졌다

Claude Code의 'create-mcp-app' 스킬을 사용하여 대화형 인터페이스 내에서 조작 가능한 대시보드를 생성한 사례를 소개합니다. MCP App은 단순한 텍스트 답변을 넘어, 버튼 클릭을 통해 백그라운드 서버를 동작시키고 데이터를 저장하는 등 '사용 가능한 화면'을 제공합니다.

텐서 기반 2차 인과 발견 (Tensor-based second-order causal discovery)

관측 데이터와 개입 데이터의 공분산 텐서를 활용하여 인과 관계를 밝히는 TSCD 알고리즘을 제안합니다. 이 방식은 통계적 효율성이 높고 가우시안 분포 여부와 상관없이 작동하며, 적은 수의 개입만으로도 인과 구조를 식별할 수 있습니다.

Edge Flow: 안정성 경계(Edge of Stability)에서의 경사 하강법을 위한 다루기 쉽고 예측 가능한 연속 시간 모델

경사 하강법이 안정성 경계(EoS)에서 작동하는 역학을 분석하기 위해 제안된 새로운 연속 시간 모델 'Edge Flow'를 소개합니다. 이 모델은 역학을 중심, 진동 방향, 진동 크기로 분해하여 날카로움의 안정화 과정을 효과적으로 설명합니다.

추론 흔적에서 재사용 가능한 모듈로: 언어 모델 추론에서의 구성적 일반화(Compositional Generalization) 이해

LLM의 사후 학습(Post-training) 과정에서 SFT와 RL이 구성적 일반화를 어떻게 유도하는지 이론적으로 분석합니다. SFT는 모듈의 재료를 공급하고, RL은 이를 분해하여 재사용 가능한 원자적 모듈로 식별 및 구성하는 역할을 수행함을 입증합니다.

OmniPlan: 적시성 및 근사 최적 네트워크 계획 최적화를 위한 적응형 프레임워크

OmniPlan은 네트워크 계획 최적화에서 적시성과 근사 최적성을 동시에 달성하기 위한 적응형 프레임워크입니다. LLM을 통해 자연어 의도를 정량화하고, 전문가 혼합(MoE) 아키텍처를 사용하여 최적의 솔루션을 동적으로 선택합니다.

S4oP: 자원 제한적 장치를 위한 구조적 상태 공간 모델(SSM)의 연산자 수준 프루닝 (Operator-level Pruning)

S4 및 S4D와 같은 구조적 상태 공간 모델(SSM)의 추론 비용을 줄이기 위한 새로운 연산자 수준 프루닝 기법을 제안합니다. 구조적 마스킹과 미세 조정을 결합하여 성능 저하를 최소화하면서도 연산 효율성을 극대화하는 방법을 다룹니다.

최소 제로 포싱 집합(Minimum Zero-Forcing Sets)을 위한 심층 강화학습 (Deep Reinforcement Learning)

무방향 그래프에서 최소 제로 포싱 집합(ZFS) 문제를 해결하기 위한 심층 강화학습 프레임워크인 SD-ZFS를 제안합니다. S2V-DQN 아키텍처를 조정하여 NP-hard 문제인 ZFS를 효율적으로 해결하며, 다양한 그래프 구조에서의 일반화 및 확장 성능을 입증했습니다.

다중 목적 강화학습 (MORL)에서의 공정한 파레토 최적 정책 학습

다중 목적 강화학습(MORL)에서 다양한 사용자 선호도에 대응하면서도 공정성을 보장하는 파레토 최적 정책 세트 학습 방법을 제안합니다. GGF와 같은 복지 함수를 활용하여 동적인 환경에서도 형평성을 유지하는 새로운 알고리즘들을 소개합니다.

Ternary Mamba: W1.58A16 상태 공간 모델 (SSM)의 그룹화된 양자화 인식 학습 (QAT)

Mamba-2와 같은 상태 공간 모델(SSM)의 메모리 효율성을 높이기 위해 사전 학습된 체크포인트를 활용한 그룹화된 양자화 인식 학습(QAT) 기법을 제안합니다. 지식 증류를 결합하여 모델을 3.61배 압축하면서도 높은 제로샷 정확도를 유지하며, 데이터 효율적인 압축 방식을 입증했습니다.

Handlebars 템플릿 기반 LLM 프롬프트에서의 구조적 역할 주입: 삼중 중괄호 보간, 구분자 제품군, 그리고 HTML 자동 이스케이프의

Handlebars 템플릿 엔진을 사용하는 LLM 애플리케이션에서 이스케이프 처리가 구조적 역할 주입 공격을 완벽히 방어하지 못함을 규명했습니다. HTML 이스케이프는 특정 구분자만 보호할 뿐, 콜론이나 마크다운 기반의 역할 위조 공격에는 취약함을 실험으로 증명했습니다.

마이크로컨트롤러급 엣지 디바이스를 위한 임베디드 머신러닝: 데이터, 특징, 평가 및 배포 파이프라인

마이크로컨트롤러급 엣지 디바이스를 위한 임베디드 머신러닝 워크플로우를 시스템 관점에서 분석한 논문입니다. 데이터 수집부터 특징 추출, 모델 설계, 스트리밍 배포에 이르는 엔지니어링 결정 사항과 실질적인 설계 규칙을 다룹니다.

소모되는 자산으로서의 메모리: Embodied Agent를 위한 Flash 내구성 가격 책정 및 그 한계

Embodied Agent의 메모리 시스템에서 플래시 메모리의 내구성을 소모되는 자산으로 정의하고, 이를 최적화하기 위한 가격 책정 모델을 제안합니다. RAM, NVM, 클라우드 계층 간의 비용을 최소화하는 마모 인식 배치 전략을 다룹니다.

CTI 보고서의 다중 레이블 ATT&CK 기법 분류를 위한 오픈 소스 LLM 평가

비정형 CTI 보고서에서 다중 레이블 ATT&CK 기법을 분류하기 위한 오픈 소스 LLM의 성능을 평가한 연구입니다. 연구진은 2,076개의 정밀한 데이터셋을 구축하여 8B~236B 규모의 모델들을 테스트했습니다. 실험 결과, 현재의 오픈 소스 LLM은 실제 프로덕션 환경의 복잡한 CTI 분류를 수행하기에는 성능이 부족함을 확인했습니다.

이 피드 구독하기

RSSFeedly, Inoreader 등으로 구독

API/api/search?q=검색어

AIllms.txt로 AI 크롤링 가이드

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.