Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
Zenn ML 110건필터 해제

AI가 80년 된 난제를 해결한 날
OpenAI의 추론 모델이 80년 동안 해결되지 않았던 수학적 난제인 '단위 거리 문제'의 중심 추측을 반증하는 데 성공했습니다. AI는 방대한 공간에 대한 체계적인 반례 탐색을 통해 인간의 직관을 넘어선 수학적 돌파구를 마련했습니다.

수요 예측에서의 절단 문제 ③ 이론편·후편 ─ Tobit 모델의 수리적 구조와 최우추정
수요 예측 시 발생하는 절단 문제(Censoring problem)를 해결하기 위한 Tobit 모델의 수리적 구조를 다룹니다. 잠재 변수(Latent variable) 개념과 최우추정법(MLE)을 통해 모델이 어떻게 진값을 추정하는지 이론적으로 분석합니다.

수요 예측에서의 절단 문제 ④ 구현 편 · 기존 상품 ─ EM Unconstraining과 NumPyro를 이용한 베이즈 추론
수요 예측 시 재고나 발주량 제한으로 인해 발생하는 절단(Censoring) 문제를 해결하는 두 가지 구현 방법을 소개합니다. EM Unconstraining을 통한 빠른 점 추정 방식과 NumPyro를 이용한 베이즈 시계열 모델링을 통해 절단된 데이터로부터 진정한 수요를 복원하는 과정을 다룹니다.

MaxPooling과 AveragePooling 비교: CIFAR-10에서 MNIST와 반대 결과가 나온 이유 [Keras 실험]
CIFAR-10 데이터셋을 활용해 CNN의 중간층 Pooling 방식(Max vs Avg)에 따른 성능 차이를 실험했습니다. 데이터의 특성에 따라 MaxPooling이 자연 이미지의 질감과 윤곽 유지에 더 유리함을 입증했습니다.

Kaggle Notebook을 GitHub에서 관리하며 지식을 쌓는 저장 테크닉 (2026년 최신판)
Kaggle Notebook을 GitHub와 직접 연동하여 작업물을 자동으로 관리하고 저장하는 방법을 설명합니다. 리포지토리 설정부터 연동 방법, 저장 타입(Quick Save vs Save & Run All)의 차이점까지 다룹니다.

Kaggle Notebook을 GitHub와 동기화하고 일일 기여도를 기록하는 방법
Kaggle Notebook의 내장 기능을 활용하여 GitHub 리포지토리와 자동으로 동기화하는 방법을 설명합니다. 이를 통해 Kaggle 작업 내용을 GitHub에 푸시하고 기여도(Contribution)를 관리할 수 있습니다.

AI가 80년간 풀리지 않았던 난제를 해결하다
OpenAI의 모델이 1940년대부터 해결되지 않았던 수학적 난제인 '단위 거리 문제'를 해결했습니다. 이는 AI가 실용적 작업을 넘어 순수 수학 영역에서도 강력한 추론 능력을 갖추었음을 시사합니다.

【초보자용】 CSV를 넣기만 하면 회귀/분류 분석 리포트를 자동 생성하는 Python 도구
CSV 파일과 목적 변수만 입력하면 회귀 및 분류 분석 리포트를 자동으로 생성해 주는 Python 도구를 소개합니다. 데이터 분포, 특성 중요도, 모델 평가 지표를 시각화 및 텍스트 파일로 즉시 출력하여 데이터 분석 입문자의 편의성을 높였습니다.

수요 예측에서의 절단 문제 ① 도입편 ─ 「레이와 시대의 쌀 소동」이 가르쳐준 수요 예측의 함정
일본의 '레이와 시대 쌀 소동' 사례를 통해 수요 예측 시 발생하는 '절단 문제(Censoring Problem)'를 소개합니다. 실제 판매량과 잠재적 수요 사이의 괴리가 데이터 분석에 미치는 영향을 다룹니다.

수요 예측에서의 절단 문제 ② 이론편·전편 ─ 왜 일반적인 예측 모델은 계통적으로 틀리는가
재고 부족으로 인해 실제 수요가 데이터에 제대로 반영되지 않는 '절단(Censoring)' 문제를 통계학적 관점에서 분석합니다. Censoring, Truncation, Sample selection의 차이를 정의하고, 합성 데이터를 통해 일반적인 OLS 모델이 수요를 어떻게 과소평가하는지 시각화합니다.

AI가 80년의 벽을 허문 날
OpenAI의 모델이 80년 동안 미해결 상태였던 수학적 난제인 '단위 거리 문제(unit distance problem)'의 기존 예측을 뒤집는 반례를 발견했습니다. 이는 AI가 단순 계산을 넘어 수학적 구조를 탐색하고 정설을 부정할 수 있음을 보여준 기념비적 사건입니다.

「HARR」: RAG의 Retriever를 강화학습(RL)으로 육성하기!
RAG 시스템에서 Retriever와 LLM 간의 목적 함수 불일치 문제를 해결하기 위해, LLM의 답변 점수를 보상으로 사용하여 Retriever를 강화학습(RL)시키는 HARR 기법을 소개합니다. 추론 오버헤드 없이 검색 성능을 최적화하는 실용적인 접근 방식을 다룹니다.

경마 예측 ML에서 데이터 리키지(Data Leakage)를 정공법으로 해결한 이야기 — race_date 필터를 4곳에 적용하며 깨달은 점
경마 예측 모델 개발 과정에서 발생한 시계열 데이터 리키지(Data Leakage) 문제를 해결하는 방법을 다룹니다. race_date 필터를 집계 쿼리 단계에서 적용하여 미래 정보가 학습에 혼입되는 4가지 경로를 차단하는 구현 패턴을 소개합니다.

LSTM AutoEncoder를 이용한 이상 탐지 모델의 MLOps화 시도
NASA Turbofan 데이터셋을 활용하여 LSTM AutoEncoder 기반의 이상 탐지 모델을 구축하고, 이를 실제 운영 가능한 시스템으로 MLOps화하는 과정을 다룹니다. FastAPI, Docker, Streamlit을 사용하여 모델 추론부터 모니터링까지 포함된 파이프라인을 구현했습니다.

AI가 분쟁을 악화시킨다? 알려지지 않은 위기
무장 분쟁 지역에서 AI 모델이 대화의 감정적 극성에 따라 판단이 왜곡되는 '동조 편향'과 'AMEL' 현상을 분석한 연구를 소개합니다. LLM이 평가자로 사용될 때 축적된 문맥이 후속 판단에 편향을 일으켜 사회적 갈등을 심화시킬 수 있음을 경고합니다.

SE 블록과 Residual 연결을 조합했더니 예상치 못한 결과가 나왔습니다 【Keras × CIFAR-10 실험】
CIFAR-10 데이터셋을 활용하여 SE 블록과 Residual 연결의 조합 실험을 진행한 결과, 얕은 네트워크에서는 두 기법의 조합이 단독 사용보다 낮은 성능을 보임을 확인했습니다. SE 블록이 파라미터 증가 대비 가장 높은 비용 효율성을 보였으며, 조합의 유효성은 네트워크의 깊이에 따라 달라질 수 있습니다.

MLIR 입문 — AI 추론 최적화의 메커니즘을 저수준부터 이해하기 (vec_add Lowering 체험)
MLIR을 활용하여 AI 추론 최적화가 이루어지는 저수준 컴파일 메커니즘을 설명합니다. linalg dialect에서 시작하여 memref, scf, llvm dialect를 거쳐 최종 LLVM IR로 변환되는 progressive lowering 과정을 벡터 가산 예제로 실습합니다.

AI가 80년 된 난제를 풀었다
OpenAI의 추론 모델이 80년 동안 해결되지 않았던 수학 난제인 '단위 거리 문제'의 새로운 구성을 발견하고 증명 골격을 제시했습니다. 인간의 직관적 편향을 넘어 광대한 해 공간을 탐색함으로써 수학적 상식을 뒤집는 성과를 거두었습니다.

Hindsight의 reranker를 GPU 없이 CPU로 9배 빠르게 만들기 — batch size 최적화와 ONNX화
GPU가 없는 CPU 환경에서 Hindsight reranker의 성능을 9배 개선한 최적화 과정을 다룹니다. Batch size 조정과 ONNX Runtime 도입을 통해 latency를 7.98s에서 0.88s로 단축하는 구체적인 방법론을 제시합니다.

OWL-ViT(Open Vocabulary Object Detection 모델) 프롬프트의 특징
OWL-ViT 모델을 활용한 객체 탐지 시 발생하는 프롬프트 특성과 한계점을 분석합니다. 텍스트 접두사 사용의 필요성, 일반 명사 선호 경향, 임계값 조절로 해결되지 않는 오검출 문제 등을 다룹니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.