본문으로 건너뛰기

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

arXiv cs.AR 432필터 해제

arXiv논문

Chiplet GPU의 페이지 단위 배치와 호환되는 지역성 인식 GEMM 구현

멀티 칩렛 GPU의 비균일 메모리 환경에서 데이터 지역성을 최적화하기 위한 Chiplet-Contiguous Layout을 제안합니다. 이 방식은 OS나 하드웨어 변경 없이 페이지 단위 배치와 호환되며, LLM 연산 시 원격 HBM 트래픽을 획기적으로 감소시킵니다.

4일 전0
arXiv논문

BenDi: 엣지 바이오일렉트로닉스를 위한 에너지 효율적인 준-확률적 시스톨릭 아키텍처 (Quasi-Stochastic Systolic

엣지 바이오일렉트로닉스 시스템을 위해 에너지 효율을 극대화한 준-확률적 시스톨릭 아키텍처 BenDi를 제안합니다. BenDi는 다단계 최적화를 통해 기존 기술 대비 면적과 에너지 효율을 획기적으로 개선하면서도 높은 CNN 정확도를 유지합니다.

4일 전0
arXiv논문

Eidola: 분산 AI 워크로드에서의 멀티-GPU 네트워크 통신 트래픽 모델링

분산 AI 워크로드의 멀티-GPU 네트워크 통신 트래픽을 정밀하게 모델링하는 시뮬레이션 프레임워크 Eidola를 소개합니다. gem5를 확장하여 사이클 수준의 정밀도로 피어 투 피어 GPU 통신과 동기화 동작을 에뮬레이션할 수 있습니다.

4일 전0
arXiv논문

웨어러블 기기에서의 EEG 분석을 위한 딥러닝 모델의 복잡도 감소

웨어러블 기기의 제한된 연산 및 에너지 자원 환경에서 EEG 신호를 분석하기 위한 딥러닝 모델의 복잡도 감소 방안을 연구합니다. 파라미터 양자화와 전극 감소 기술을 통해 모델의 정확도와 연산 복잡도 사이의 트레이드오프를 분석합니다.

4일 전0
arXiv논문

백만 큐비트 규모의 워크로드를 위한 양자 구동 뉴로모픽 컴퓨팅 (Quantum-Driven Neuromorphic Computing for

상온에서 작동하는 10,000 노드 p-큐비트 기반 뉴로모픽 프로세서 'Apollo'를 소개합니다. 양자 엔트로피를 활용해 초고속 확률론적 전이를 구현하며, 기존 극저온 양자 어닐러보다 효율적인 최적화 성능을 보여줍니다.

4일 전0
arXiv논문

8비트 경계 변환 행렬을 이용한 비모수적 이중 매니폴드 매핑: 저전력 AI에서 FP 중심 하드웨어 패러다임에 도전

본 논문은 기존 딥러닝 하드웨어 패러다임이 요구하는 고비용의 부동소수점 연산(FP)에 도전하는 새로운 프레임워크를 제시합니다. 이 프레임워크는 8비트 정수 경계 내에서 작동하며, 비모수적이고 학습이 필요 없는 이중 매니폴드 매핑을 통해 FP 곱셈기 없이도 고성능 추론을 구현합니다.

4일 전0
arXiv논문

SupraSNN: 공동 최적화 매핑 및 스케줄링을 통한 스파이킹 신경망 가속기에서의 시냅스 레벨 병렬성 활용

본 기사는 스파이킹 신경망(SNN)의 병렬성을 극대화하기 위한 하드웨어-소프트웨어 공동 설계 프레임워크인 SupraSNN을 소개합니다. SupraSNN은 시냅스와 뉴런 계산을 물리적으로 분리하여 높은 시냅스 레벨 병렬성을 달성하는 슈퍼스칼라 아키텍처를 채택했습니다. 이 아키텍처는 Multi-Cast Tree와 Merge Tree를 활용하며, FPGA 구현 결과 이전 대비 낮은 지연 시간과 높은 에너지 효율을 입증했습니다.

4일 전0
arXiv논문

자동 음성 인식(ASR)을 위한 Memristor 기반 아날로그 컴퓨팅에서의 위치 인코딩

본 연구는 Memristor 기반 아날로그 컴퓨팅 환경에서 위치 인코딩이 야기하는 성능 저하 문제를 다룹니다. 가중치 및 정밀도 비트 비율 조정을 통해 실행 왜곡을 약 50% 감소시켰으며, 추가적으로 특정 선형 변환 제거를 통해 성능 저하를 약 30% 줄일 수 있음을 제시합니다.

4일 전0
arXiv논문

ReSCom: 확률적 컴퓨팅을 활용한 재구성 가능한 스파이킹 신경망 가속기

본 논문은 스파이킹 신경망(SNNs)의 하드웨어 구현 문제를 해결하기 위해 ReSCom이라는 재구성 가능한 가속기를 제안합니다. ReSCom은 확률적 컴퓨팅을 활용하여 뉴런 동역학의 곱셈 연산에 적용함으로써 하드웨어 복잡도를 줄이고 안정적인 추론을 유지합니다. Xilinx Artix-7 FPGA 실험 결과, 낮은 에너지 소비와 높은 분류 정확도를 달성하며 기존 최첨단 구현보다 우수한 효율성을 입증했습니다.

4일 전0
arXiv논문

하드웨어 통신을 프로그램으로 명세화하기

하드웨어 모듈 테스트 시 사용되던 드라이버와 모니터가 분리되어 발생하는 비일관성 문제를 해결하기 위한 새로운 접근 방식을 제안합니다. 사용자들은 도메인 특화 언어(DSL)를 사용하여 하드웨어 통신 프로토콜을 간결하게 명세화할 수 있으며, 이 단일 명세가 드라이브 설계와 트랜잭션 모니터링 모두에 사용될 수 있습니다.

6월 12일0
arXiv논문

미분 방정식 및 행렬 방정식을 해결하기 위한 현대 아날로그 컴퓨팅

본 논문은 AI 및 과학 계산 요구에 따라 주목받는 현대 아날로그 컴퓨팅을 다룹니다. 미분 방정식 풀이, 행렬 방정식 풀이 등 세 가지 핵심 원시 요소를 식별하고, 이를 CMOS 회로와 저항성 메모리 배열을 이용한 하드웨어 구현 방식을 검토합니다. 궁극적으로 아날로그 컴퓨팅의 응용 분야, 한계점 및 인메모리 컴퓨팅과의 관계를 논하며 차세대 컴퓨팅 프런티어로서의 가능성을 제시합니다.

6월 12일0
arXiv논문

분할된 태그, 공유 데이터: 엄격한 캐시 격리와 쓰기 공유 일관성 재조정

본 논문은 캐시 사이드 채널 공격 방어를 위한 새로운 구조적 방법인 SCP(Secure and Coherent Partitioning)를 제안합니다. SCP는 태그만 분할하고 데이터 풀을 공유하며, 쓰기 공유 일관성을 유지하여 기존의 설계 문제를 해결했습니다. 이 방식은 Prime+Probe 및 Flush+Reload 같은 정교한 캐시 공격을 완화하면서도 성능 저하가 미미하고 하드웨어 비용 증가율이 낮음을 입증했습니다.

6월 11일0
arXiv논문

Raspberry Pi 5 QPU를 위한 소형 ML 런타임 스택 연구

Raspberry Pi 5의 VideoCore VII QPU를 활용한 QPU 우선 ML 런타임 스택을 제안합니다. 타일형 행렬 곱셈과 정수 실행 최적화를 통해 NumPy 및 PyTorch 대비 높은 처리량을 달성했습니다.

6월 10일0
arXiv논문

ARTA: RowHammer 취약점을 위한 적응형 강화학습 기반 스로틀링 에이전트

RowHammer 취약점에 대응하기 위해 Q-learning 기반의 적응형 스로틀링 메커니즘인 ARTA를 제안합니다. 하드웨어 수정 없이 메모리 액세스를 모니터링하여 비트플립을 효과적으로 억제하며, 기존 방어책 대비 높은 성능 향상을 입증했습니다.

6월 10일0
arXiv논문

SPARX: Edge RISC-V SoC를 활용한 보안 및 개인정보 보호 인지형 근사 CNN 가속화

SPARX는 RISC-V SoC 기반의 보안 및 개인정보 보호 인지형 근사 CNN 가속화 프레임워크를 제안합니다. 근사 컴퓨팅을 통해 하드웨어 효율성을 높이면서도, 차분 노이즈 기반 개인정보 보호와 인증 메커니즘을 통합하여 엣지 AI의 보안 제약을 해결합니다.

6월 10일0
arXiv논문

지능형 프리페칭을 향하여: 복잡한 메모리 액세스 예측 기술에 관한 조사

현대 워크로드의 불규칙한 메모리 액세스 패턴을 해결하기 위한 지능형 데이터 프리페칭 기술을 조사합니다. 전통적인 방식의 한계를 분석하고, 머신러닝 기반 프리페처의 분류 체계와 성능 평가 기준을 제안합니다.

6월 10일0
arXiv논문

Twit 표현 기반의 범용 Modulo-$(2^n ext{±} ext{δ})$ RNS 곱셈기

RNS(나머지 수 체계) 환경에서 twit 표현을 활용한 범용 Modulo-$(2^n ext{±} ext{δ})$ 곱셈기 구조를 제안합니다. 피연산자 분할과 캐리-세이브 누적 방식을 통해 기존 설계의 긴 임계 경로 문제를 해결했습니다.

6월 10일0
arXiv논문

3D-TCAD 시뮬레이션을 이용한 사이버 물리 시스템(CPS)용 조합 논리 표준 셀의 결함 특성 분석 및 강화

3D-TCAD 시뮬레이션을 활용하여 사이버 물리 시스템(CPS)용 조합 논리 표준 셀의 결함 특성을 분석한 연구입니다. 결함 에너지와 인접 효과 등 다양한 시나리오를 통해 취약 영역을 식별하고, 이를 개선한 강화된 NAND 셀을 제안합니다.

6월 10일0
arXiv논문

GRAFT: GNN 기반 하드웨어 보안 시스템을 겨냥한 Graphlet 트리거 기반 백도어 공격

GNN 기반 하드웨어 보안 시스템을 무력화하기 위한 새로운 백도어 공격 방식인 GRAFT를 제안합니다. 회로의 원래 기능을 유지하면서 graphlet 기반 트리거를 삽입하여 하드웨어 트로이목마 탐지를 효과적으로 회피합니다.

6월 10일0
arXiv논문

물리적 신경망의 강건한 공동 설계를 위한 LLM 가이드 신경망 구조 탐색 (LLM-Guided Neural Architecture Search)

LLM을 진화 연산자로 활용하여 비전형적 하드웨어에 최적화된 신경망 구조를 탐색하는 UH-NAS 프레임워크를 제안합니다. 에너지 효율과 물리적 제약 조건을 동시에 고려하며, 광학 MZI 하드웨어 테스트를 통해 기존 방식보다 강건한 아키텍처를 발견함을 입증했습니다.

6월 10일0

이 피드 구독하기

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.