Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

도구 호출에서도 큰 모델이 이기지 못했습니다

LLM의 도구 호출(function calling/tool use) 기능은 에이전트 기술과 RAG의 핵심 진화 방향이며, 로컬 LLM의 실용성을 결정하는 중요한 요소입니다. 2026년 벤치마크 테스트 결과에 따르면, 도구 호출 정확도 면에서 모델 크기가 반드시 우위를 점하지 않았습니다. 오히려 3.4GB의 비교적 작은 양자화 모델이 97.5%라는 높은 정확도를 기록하며, 25GB의 대형 모델(85%)을 능가하는 결과를 보여주었습니다.

4월 27일2

Zenn헤드라인

[인과추론 #2] 교란인자 - 제3의 변수의 함정

이번 글은 '교란인자 (confounder)'가 인과 추정을 왜곡하는 원리를 다룹니다. 전체적으로 '여성이 합격률이 낮다'고 보이지만, 학부별로 보면 '모든 학부에서 여성이 합격률이 높다'는 역설적인 상황을 통해 심슨의 패러독스를 설명합니다. 교란인자를 제대로 식별하지 못하거나 부적절하게 조정할 때 발생하는 오류와 그 결과를 구체적인 사례를 통해 직관적으로 이해할 수 있습니다.

4월 27일3

Zenn헤드라인

실무에서 클러스터링을 피하기 위한 Infinite Latent Feature Model 활용

데이터 과학자 모멘은 실무에서 고객 이해를 위해 주로 쓰이는 클러스터링 (clustering) 을 선호하지 않습니다. 해석이 어렵고 클러스터 개수를 제한해야 하는 단점이 있기 때문입니다. 실제 현장에서는 보통 10 개 내외의 클러스터만 허용되지만, 고객 세분화는 그보다 훨씬 복잡합니다. 또한 많은 변수를 투입해 유사한 클러스터를 대량 생산하는 경향이 있습니다. 이러한 한계를 극복하기 위해 무한 잠재 특징 모델 (Infinite Latent Feature Model) 을 실용화하려는 의도를 밝혔습니다.

4월 27일4

Zenn헤드라인

Keras Dense 레이어 활성화 함수: ReLU 대신 ELU 사용 시 CIFAR-10 정확도 향상

MNIST 데이터셋에서는 ReLU, GELU, ELU의 성능 차이가 미미하지만, CIFAR-10과 같은 더 복잡한 이미지 분류 작업에서는 활성화 함수 선택이 중요함을 보여줍니다. Conv2D 레이어는 ReLU로 고정하고 Dense 레이어만 활성화 함수를 변경하는 간단한 실험을 통해, ELU가 ReLU 대비 테스트 정확도를 67.52%에서 68.94%로 높이는 결과를 확인했습니다.

4월 27일2

Zenn헤드라인

Embedding 모델의 정밀도, 비용, 속도를 동시에 평가하는 다축 스코어카드 구현 가이드

MTEB 점수만으로는 Embedding 모델의 실제 성능을 판단하기 어렵습니다. 이 글은 2026년 4월 기준 주요 8 개 모델의 API 요금, 차원 수, MTEB 성능을 종합 비교하고 Python 으로 다축 스코어카드를 구현하는 방법을 안내합니다. Matryoshka 차원 축소와 양자화의 조합이 비용과 정밀도에 미치는 영향, 일본어 RAG 작업에서의 실측 데이터와 벤치마크 간 격차까지 정량적으로 분석하여 용도별 Pareto 최적 모델을 자동 선별할 수 있습니다.

4월 27일2

Zenn헤드라인

【논문 소개】PU 학습으로 보고 편향 하에서도 반응 수율 예측 가능

최근 Journal of the American Chemical Society 에 게재된 논문 'Yield Prediction of Organic Reactions in Biased Data Sets via Positive-Unlabeled Learning'을 소개합니다. 유기 반응 수율 예측 시 발생하는 '저수율 반응이 잘 보고되지 않는 편향(보고 편향)' 문제를 해결하기 위해 Positive-Unlabeled(PU) 학습 기법을 적용한 연구입니다. 기존에는 알려지지 않은 데이터 편향을 AI 모델링 관점에서 해결하는 흥미로운 사례로, 화학 정보학 및 머신러닝 분야에서 데이터 품질 이슈를 어떻게 극복할 수 있는지 보여주는 중요한 논문입니다.

4월 27일2

Zenn헤드라인

일본 자동차 제조사, 디지털 지식 관리 시스템 'e-KHOOL' 도입 배경

TL;DR: 일본 주요 자동차 제조사들이 신입 사원 온보딩을 위해 기존 방식에서 전용 학습 관리 시스템인 'e-KHOOL'로 전환하고 있습니다. 엄격한 규정 준수와 높은 정밀도가 요구되는 자동차 제조 환경에서는 단순한 문서 저장소 역할만 하는 디지털 지식 (Digital Knowledge) 기반은 새로운 기술 인재를 효과적으로 육성하기에 부족합니다. 이에 따라 SOP, 안전 매뉴얼 등 다양한 학습 자료를 통합 관리할 수 있는 전용 시스템 도입이 필수적입니다.

4월 27일3

Zenn헤드라인

Elasticsearch RAG: Dense/BM25/SPLADE를 RRF로 통합한 11개 태스크 검증

TL;DR: Elasticsearch에서 Dense, Lexical(BM25), Sparse(SPLADE) 검색 방식을 RRF(Reciprocal Rank Fusion) 기법으로 통합하여 3-way 검색을 구현하는 실전 가이드입니다. JMTEB 벤치마크의 11개 태스크(NDCG@10 지표)를 대상으로 각 방식의 성능과 통합 시너지 효과를 검증했습니다. 개발자는 단일 모델 의존도를 낮추고 하이브리드 접근법의 효율성을 파악할 수 있습니다.

4월 27일3

Zenn헤드라인

RTX 4090 으로 DeepSeek-V2-Lite QUBO 최적화 실험

대규모 MoE 모델의 VRAM 배치 문제를 '가상의 양자컴퓨터' 방식인 QUBO로 해결해봤습니다. 설정에 따라 기존 LRU 캐시 대체 알고리즘보다 +3.9% 성능을 보였지만, 단순 적용은 실패했습니다. 예측기를 학습형으로 개선하면 이론적 한계까지 42% 도달했습니다. 부정적 결과도 포함한 솔직한 연구 결과를 소개합니다.

4월 26일5

Zenn헤드라인

MLinfo: AI로 매일 자동 수집한 머신러닝 논문 및 리포지토리 일본어解説 사이트

개발자가 arXiv, HuggingFace, GitHub에서 매일 쏟아지는 머신러닝/AI 관련 논문과 리포지토리를 자동으로 수집하고, AI가 이를 일본어로 요약 및 상세하게 설명해주는 서비스 'MLinfo'를 소개합니다. 영어 논문을 직접 읽기 부담스러운 상황에서 핵심 내용을 빠르게 파악할 수 있도록 설계되었습니다.

4월 26일4

이 피드 구독하기

RSSFeedly, Inoreader 등으로 구독

API/api/search?q=검색어

AIllms.txt로 AI 크롤링 가이드