본문으로 건너뛰기

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

arXiv논문

PipeRTL: IR 레벨에서의 타이밍 감지 파이프라인 최적화를 위한 RTL 생성

PipeRTL은 하드웨어 컴파일러를 위한 IR 레벨 파이프라인 최적화 프레임워크입니다. 기존 RTL 흐름에서는 파이프라인 최적화가 낮은 수준의 네트리스트 표현으로 내려가면서 원래의 연산자 구조가 손실되어 전역적인 최적화 기회가 제한되었습니다. PipeRTL은 IR 레벨에서 레지스터 재배치의 합법성을 명시하고, 타이밍 예측기를 사용하여 지연 동작을 근사하며, 이를 최소 비용 흐름 문제로 공식화하여 파이프라인 최적화를 컴파일러 패스로 통합합니다.

hardware-compilerrtl-optimizationpipelining
2일 전5
arXiv논문

SPEC CPU: 다음 세대

SPEC CPU 2026은 프로세서 성능 측정을 위한 차세대 벤치마크 스위트를 소개하며, 이는 커뮤니티 협력과 원칙적인 개발 과정을 거쳤습니다. 이 새로운 스위트는 현대적이고 오픈 소스 애플리케이션을 기반으로 하며, 작업 부하의 다양성, 포터빌리티, 장기성을 강조합니다. 특히 'Rolling-Round-Robin Rate'와 같은 혁신적인 표준화된 접근법을 도입하여 이질적이고 멀티프로그램 환경에서의 성능 평가를 개선하고, 멀티스레드 벤치마크를 확장하여 최신 소프트웨어 요구사항을 반영했습니다.

spec-cpubenchmarkprocessor-performance
2일 전6
arXiv논문

RV-IM100: RISC-V 마이크로아키텍처에서의 ISA 확장, 데이터패스 폭, 파이프라인 깊이 트레이드오프 정량화

본 논문은 공통 파이프라인 베이스라인을 기반으로 데이터패스 폭(RV32/RV64), ISA 세트(I/IM), 파이프라인 깊이(5~8단계)를 체계적으로 변화시킨 10개의 마이크로아키텍처인 RV-IM100을 제시합니다. 이를 통해 RISC-V 아키텍처 설계 공간에서 성능, 전력, 면적 간의 트레이드오프를 정량적으로 분석했습니다. 주요 결과로는 파이프라인 깊이 증가가 항상 성능 향상을 보장하지 않으며, 데이터패스 폭 확장(RV32 vs RV64) 시 절대 성능은 차이가 있지만 효율성 측면에서는 벤치마크에 따라 우위가 달라짐을 보여줍니다.

risc-vmicroarchitectureisa-extension
2일 전6
arXiv논문

SwiftChannel: 딥러닝 기반 5G 채널 추정용 알고리즘-하드웨어 공동 설계

본 논문은 5G 통신의 핵심 과제인 정확하고 빠른 채널 추정을 위해 알고리즘과 하드웨어를 공동 설계한 프레임워크 'SwiftChannel'을 제안한다. SwiftChannel은 파라미터 없는 어텐션 메커니즘이 강화된 CNN을 사용하여 저해상도 LS 추정치로부터 고해상도 공간 주파수 도메인 채널 행렬을 재구성하며, 지식 증류 및 양자화 인식 학습을 통해 모델을 압축한다. 이를 FPGA 플랫폼(Zynq UltraScale+ RFSoC)에 구현한 하드웨어 가속기는 밀리초 수준의 낮은 지연 시간과 GPU 대비 월등히 높은 속도 및 에너지 효율성을 달성하여 5G MIMO 시스템에 최적화된 솔루션을 제공한다.

5g-communicationchannel-estimationdeep-learning
2일 전4
arXiv논문

Null Convention Logic (NCL) 기반 비동기 회로용 단일 칩 3D 통합

본 연구는 고속·저전력 비동기 회로 설계의 대안으로 떠오르는 Null Convention Logic (NCL)을 단일 칩 3D(M3D) 기술과 통합하는 새로운 설계 방법론을 제안합니다. 이 방법론은 M3D 기반 NCL 표준 셀 구현을 통해 기존 평면 대비 면적 비효율성을 개선하고, 임계 게이트를 활용하여 배열 곱셈기 회로를 성공적으로 설계했습니다. 시뮬레이션 결과, M3D 통합은 약 44%의 면적 감소와 함께 지연 및 전력 소비를 각각 31%, 17% 줄이는 높은 성능 향상을 입증했습니다.

null-convention-logicasynchronous-circuits3d-integration
2일 전4
HuggingFace헤드라인

Hugging Face 와 VirusTotal 이 협력하여 AI 보안 강화

Hugging Face가 세계적인 위협 정보 및 악성코드 분석 플랫폼인 VirusTotal과 협력하여 Hugging Face Hub에 공유되는 모든 파일의 보안을 대폭 강화합니다. 이 협력을 통해 2,200만 개 이상의 공개 모델 및 데이터셋 아티팩트가 지속적으로 스캔되며, 사용자가 파일을 다운로드하거나 통합하기 전에 해당 파일의 해시를 VirusTotal 데이터베이스와 비교하여 안전성 정보를 자동으로 제공받게 됩니다. 이는 AI 커뮤니티가 악성 또는 손상된 자산으로부터 더욱 안전하고 신뢰할 수 있는 환경에서 협업할 수 있도록 돕는 중요한 진전입니다.

huggingfacevirustotalai-security
2일 전3
arXiv논문

프로토콜 독립형 전송 아키텍처

본 기술 기사는 현대 워크로드의 요구를 충족시키기 위해 NIC 하드웨어에 프로토콜 로직이 고정되는 기존 네트워크 전송 아키텍처의 한계를 지적합니다. 이를 해결하기 위해 'PITA(Protocol-Independent Transport Architecture)'라는 새로운 아키텍처를 제안하며, 이는 데이터 경로 전체의 프로그래밍 가능성을 확보하면서도 라인 레이트 성능을 유지하는 것을 목표로 합니다. PITA는 이벤트, 상태, 지시符에 대한 균일한 추상화를 기반으로 핵심 구성 요소를 재설계하여, TCP와 RoCE 같은 다양한 프로토콜 세맨틱스를 단일 데이터 경로에서 지원할 수 있음을 입증했습니다.

network-architecturenictransport-protocol
2일 전5
HuggingFace헤드라인

함께 오픈 에이전트 생태계를 구축합니다: OpenEnv 소개

본 기사는 자율적인 AI 에이전트 개발을 위한 표준화된 '에이전트 환경(Agent Environment)' 개념과 이를 구현한 OpenEnv 생태계를 소개합니다. OpenEnv는 에이전트가 작업을 수행하는 데 필요한 도구, API, 실행 컨텍스트 등을 안전하고 의미론적으로 명확하게 정의하는 샌드박스 역할을 합니다. Meta와 Hugging Face의 파트너십을 통해 구축된 이 환경 허브는 학습과 배포 전 과정에서 일관성을 제공하며, 개발자들이 쉽게 환경을 공유하고 재현할 수 있도록 지원합니다.

agent-frameworkllm-agentsopenenv
2일 전5
arXiv논문

Cerberus: 데이터 보호를 위한 효율적이고 견고한 메모리 보호를 위한 교차 계층 ECC 공동 설계

Cerberus는 DRAM 고밀도 및 고속화에 따른 데이터 정확성 문제를 해결하기 위해 제안된 혁신적인 메모리 보호 아키텍처입니다. 기존의 독립적인 O-ECC, L-ECC, S-ECC 계층 구조가 가진 중복성과 공백 문제를 극복하고자 합니다. Cerberus는 'Encode-Once, Decode-Many (EODM)' 방식을 채택하여 단일 인코딩으로 세 가지 보호 계층(장치, 링크, 시스템)의 기능을 모두 수행하게 함으로써 효율성을 높이고 데이터 정확도를 획기적으로 개선합니다.

eccmemory-protectiondram
2일 전3
arXiv논문

MRDIMMs 의 성능 및 에너지 효율성

MRDIMMs(멀티플렉싱 랭크 DIMMs)는 DRAM 주파수 증가 없이도 더 높은 대역폭을 제공하는 차세대 메모리 장치입니다. 이 기술은 기존 RDIMMs 대비 최대 41%의 대역폭 확장과 수백 나노초에 달하는 지연 시간 개선을 가능하게 합니다. 특히, MRDIMM으로 업그레이드할 경우 성능 향상 폭이 전력 증가를 크게 상회하여 메모리 제한 워크로드에서 서버 에너지 효율성을 최대 30%까지 높일 수 있습니다.

mrdimmsmemory-technologydram
2일 전5
arXiv논문

ViM-Q: FPGA 에 대한 Vision Mamba 모델 추론을 위한 확장 가능한 알고리즘·하드웨어 공동 설계

ViM-Q는 Vision Mamba(ViM) 모델의 추론을 위해 FPGA 하드웨어와 알고리즘을 공동 설계한 확장 가능한 솔루션입니다. 기존 연구에서 직면했던 양자화 및 메모리 접근 패턴 문제를 해결하기 위해, ViM-Q는 동적 토큰당 활성화 양자화와 커스텀 4-bit 중량 양자화를 결합한 하드웨어 감성 양자화 스키마를 도입했습니다. 이 솔루션은 LUT 기반의 선형 엔진과 파이프라인 SSM 엔진을 갖춘 FPGA 가속기로 구현되었으며, 실제 테스트에서 GPU 대비 높은 속도 향상 및 에너지 효율 개선을 입증하여 엣지 장치 배포의 실현 가능성을 제시합니다.

vision-mambafpgaquantization
2일 전7
r/StableDiffusion분석

캐릭터 시트 입력을 사용하는 오픈 웨이트 및 클로즈드 모델 비교 테스트

본 기사는 캐릭터 시트(Character Sheet) 입력을 활용하여 오픈 웨이트 및 클로즈드 모델의 이미지 생성 성능을 비교 테스트한 결과를 다룹니다. 사용된 프롬프트는 매우 상세하며, 특정 애니메이션 스타일과 구도, 조명 설정을 요구하고 있습니다. 이 테스트를 통해 다양한 AI 모델들이 복잡하고 구조화된 캐릭터 묘사(캐릭터 시트)와 영화적 연출 지시사항을 얼마나 정확하게 이해하고 구현하는지 비교 분석할 수 있습니다.

image-generationai-modelsopen-source
2일 전6
YouTube요약

신경망과 역전파에 대한 글로 된 소개: 미크로그래드 구축

이 기술 기사는 '미크로그래드(micrograd)'라는 프레임워크를 사용하여 신경망과 역전파(backpropagation)의 작동 원리를 매우 상세하고 단계적으로 설명합니다. 시청자는 기본적인 Python 지식만으로도 복잡한 딥러닝 개념을 이해할 수 있도록, 단순 함수부터 시작하여 다변수 함수의 미분 및 연쇄 법칙 적용 과정을 직접 구현해봅니다. 궁극적으로는 이 원리들을 활용하여 완전한 멀티레이어 퍼셉트론(MLP)을 구축하고 경사 하강법을 통해 신경망을 훈련하는 전 과정을 수동으로 따라 해보는 것을 목표로 합니다.

neural-networksbackpropagationmicrograd
2일 전4
Tom's HW헤드라인

인텔이 25 년 경력의 퀄컴 전설을 고객 컴퓨팅 및 물리 AI 담당자로 영입

인텔이 AI 중심의 미래 컴퓨팅 전략에 박차를 가하며 고위 경영진 두 명을 영입했습니다. 퀄컴 출신의 베테랑 알렉스 카투지안은 고객 컴퓨팅 및 신규 '물리 AI' 사업 총괄자로 합류하여, 전통적인 PC 시장을 넘어 로봇 공학, 자율 기계 등 엣지 기반의 AI 시스템으로 비즈니스를 확장하는 데 주력할 예정입니다. 또한 푸슈카르 라나데가 최고기술책임자(CTO)로 영구 임명되어 양자 컴퓨팅, 뉴로모픽 컴퓨팅 등 첨단 기술 전략을 이끌게 됩니다.

intelqualcommai-pc
2일 전3
arXiv논문

AI 와 오픈 데이터 기반 확장 가능한 태양광 발전량 프로파일링

본 논문은 오픈 데이터와 Foundation Vision AI 모델을 활용하여 도시 수준의 확장 가능한 태양광 발전량 프로파일링 프레임워크를 제시합니다. 이 프레임워크는 위성 이미지에서 태양광 패널의 기하학적 형태를 자동으로 탐지하고, 이를 지리 참조 인벤토리로 구축합니다. 또한 오픈 날씨 데이터를 통합하여 지역별 태양광 발전량 프로파일을 생성함으로써, 기존의 독점 데이터 및 수동 라벨링 의존도를 낮추고 투명하며 확장 가능한 에너지 분석 접근법을 제공합니다.

solar-pvopen-datafoundation-vision-ai
2일 전9
arXiv논문

구조적 인과 의사결정 과정의 설계 및 구성

본 논문은 컴퓨팅 시스템의 경제학을 모델링하기 위해 두 가지 새로운 종류의 인과 의사결정 에이전트 모델, 즉 구조적 인과 의사결정 모델(SCDMs)과 이를 확장한 구조적 인과 의사결정 과정(SCDPs)을 제안합니다. SCDMs는 변수와 결정 간의 인과 관계를 명시적으로 표현하며, 특히 에이전트 결정이 특정 인과 전제 조건에 의해 제한될 수 있다는 점을 모델링할 수 있습니다. SCDP는 이러한 구조적 인과 의사결정 과정의 구성 가능성을 활용하여, 합리적 믿음 형식을 가정하지 않으면서도 기억 형성 및 변수 할인 같은 복잡한 동적 환경에서의 자원 합리성 에이전트 행동을 효과적으로 모델링할 수 있는 강력하고 표현력이 뛰어난 프레임워크를 제공합니다.

causal-inferencedecision-makingagent-modeling
2일 전6
arXiv논문

SemEval-2026 과제 10: 혼란 이론 탐지용 LLM 파인튜닝 (mdok 스타일)

SemEval-2026 과제 10은 Reddit 댓글의 혼란 이론(conspiracy theory) 믿음 여부를 탐지하는 것을 목표로 합니다. 이 시스템은 Qwen3-32B 모델을 사용하여 데이터 증강 및 자기 학습 기법으로 파인튜닝되었으며, 이진 텍스트 분류 작업에 적용되었습니다. 해당 접근 방식은 경쟁력 있는 성능을 보여주며, 기존의 기계 생성 텍스트 탐지 기술이 혼란 이론 탐지에도 효과적으로 활용될 수 있음을 입증했습니다.

semevalllm-finetuningconspiracy-theory
2일 전5
arXiv논문

주체성을 가진 AI 와 인간

이 논문은 인간의 주체성(agency)과 잠재적인 AI 프로그램의 주체성을 비교 분석합니다. 인간에게 주체성이 발현되는 과정은 전두엽 활성화에 수년이 걸리는 복잡한 과정을 거칩니다. 따라서 초기 LLM에 주체성을 부여하려는 시도는 상당한 어려움에 직면했으며, 진전하기 위해서는 실제 환경에서 행동과 계획을 인간 행위자와 함께 구축하는 새로운 구조가 필요합니다.

agencyartificial-intelligencellm
2일 전6
HuggingFace헤드라인

Gradio MCP 서버에 대한 5 가지 주요 개선 사항

Gradio는 AI 기반 MCP(Model Communication Protocol) 서버 구축 및 호스팅에 있어 여러 가지 주요 개선 사항을 발표했습니다. 이번 업데이트를 통해 원격 파일 업로드 기능이 추가되어 에이전트가 직접 파일을 전송할 수 있게 되었으며, 실시간 진행 상태 알림 스트리밍 기능을 제공하여 사용자 경험을 향상시켰습니다. 또한, OpenAPI 스키마에서 Gradio 앱을 자동으로 생성하고, 백엔드 API를 한 줄의 코드로 MCP 도구에 통합하는 등 개발 편의성이 대폭 강화되었습니다.

gradiomcp-serverllm-agent
2일 전6
arXiv논문

Caliper-in-the-Loop: 하이퍼레저 패브릭 성능 튜닝을 위한 블랙박스 최적화

본 논문은 수많은 구성 매개변수에 의존하여 수동 튜닝이 어려운 하이퍼레저 패브릭(Hyperledger Fabric)의 성능 최적화 문제를 다룹니다. 연구진은 이 문제를 블랙박스 최적화 문제로 간주하고, 차원 축소(DR)를 적용한 베이지안 최적화(BO)를 활용하여 자동화된 튜닝 파이프라인을 개발했습니다. 구현된 Caliper-in-the-loop 시스템은 실제 테스트베드에서 기존 방식 대비 높은 트랜잭션 처리량(TPS) 개선 효과를 입증하며, 고차원 복잡계 시스템의 성능 최적화에 실용적인 접근법임을 제시합니다.

hyperledger-fabricbayesian-optimizationblackbox-optimization
2일 전4

이 피드 구독하기

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.