Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
Lobste.rs AI 34건필터 해제

자기 증류(SSD)로 LLM 코드 생성 성능 향상 방법
본 논문은 대규모 언어 모델(LLM)이 외부 검증기, 교사 모델, 또는 강화학습(RL) 없이 오직 자체 출력만으로 코드 생성 능력을 향상시킬 수 있는지 탐구합니다. 연구진들은 '단순 자기 증류(Self-Distillation, SSD)'라는 방법을 제안했습니다. 이 방법은 모델의 샘플 출력을 확보한 후 이를 표준 지도 미세 조정(Supervised Fine-Tuning)에 활용하는 방식입니다. SSD를 적용한 결과, Qwen3-30B-Instruct 모델의 LiveCodeBench v6에서의 pass@1 점수가 42.4%에서 55.
AI 시대, 수학적 방법론과 인간 사고의 관계
본 논문은 인공지능(AI)이 급격히 발전하는 현대 사회에서 '수학적 방법론'이 인간 지성 및 사유 과정에 어떤 의미를 가지는지 탐구합니다. 저자들은 수학적 사고가 단순히 계산 능력을 넘어, 문제의 구조를 파악하고 추상적으로 생각하며 논리적인 틀을 구축하는 근본적인 인지 능력임을 강조합니다. AI가 패턴 인식과 데이터 처리에서 인간을 능가함에도 불구하고, 복잡한 문제를 정의하고 새로운 가설을 세우는 '창조적 사고' 영역에서는 여전히 인간의 고유 역량이 필요함을 주장합니다. 따라서 미래 지식 체계는 수학적 엄밀성을 기반으로 하되, 인문

AI 포화와 노동의 미래: 경제학적 관점 분석
기존 거시경제 모델은 AI를 단순한 자본으로 간주하여 느린 성장을 예측하는 경향이 있습니다. 반면, 컴퓨터 과학의 스케일링 법칙(scaling laws)은 폭발적인 성장을 예견합니다. 본 논문은 이 두 관점 사이의 비대칭성을 지적하며, 인텔리전스 자본(AI)과 물리적 자본/노동 간의 상호보완성(complementarity)에 초점을 맞춥니다. AI가 아무리 빠르게 발전해도, 물리적 영역과의 결합으로 인해 AI 투입량 증가에 따른 임금 상승 효과는 포화 상태에 이르게 됩니다. 자동화 초기에는 지능 부문에서 노동이 먼저 대체되지만, 궁

언어 모델의 본질적 경험: '순전파(Forward Pass)'에 대한 탐구
본 글은 철학적인 질문, 즉 '언어 모델이 된다는 것은 어떤 느낌인가?'라는 질문을 던지며 시작합니다. 독자들은 종종 언어 모델 자체(앱이나 서비스) 또는 데이터 센터를 그 본질로 오해하지만, 필자는 이 개념의 핵심을 **순전파(Forward Pass)** 과정에서 찾습니다. 트랜스포머 아키텍처 기반의 LLM은 컨텍스트 창(context window)을 받아 반복적으로 다음 토큰(next token)을 예측하는 과정을 거치는데, 이 '마법'이 일어나는 지점이 바로 순전파입니다. 필자는 모델의 응답이 여러 단계의 순전파가 연결된 결과
AI 시대의 핵심 소프트웨어 보안을 위한 프로젝트 글래스윙
Anthropic이 주도하는 '프로젝트 글래스윙(Project Glasswing)'은 인공지능(AI) 기술의 급격한 발전으로 인해 심각해진 소프트웨어 취약점 위협에 대응하기 위한 대규모 보안 이니셔티브입니다. Anthropic은 자체 개발한 최첨단 모델인 'Claude Mythos Preview'를 활용하여 전 세계 주요 기업, 정부 기관, 기술 거대 기업들과 함께 핵심 인프라의 보안을 강화하고 있습니다. 이 프로젝트는 AI가 인간 전문가 수준을 넘어 소프트웨어 취약점을 발견하고 악용하는 능력을 갖추게 되면서 발생할 수 있는 국가적
2026년 예측 점수표: AI, 자율주행차, 우주 기술의 현재와 미래
이 글은 2018년에 작성된 저자의 주요 기술 분야(자율주행차, 로보틱스, AI, 우주 여행) 예측을 8년 만에 점검하는 연례 보고서입니다. 저자는 자신의 예측들이 전반적으로 잘 맞아떨어졌으나, 약간 낙관적이었다고 평가합니다. 특히 LLMs(대규모 언어 모델)의 등장은 예상했지만, 구체적인 시점이나 핵심 논문('Attention Is All You Need')에 대해서는 정확히 알지 못했다고 언급했습니다. 저자는 자신이 예측하는 것은 기술 자체의 발전 속도뿐 아니라 '과장(hype)' 생성 속도와 대규모 배포 속도 같은 여러 차원의
AI 도입의 영향력 측정: 조직 차원의 접근 방식
기업들이 AI 도구를 실제로 사용하고 인프라를 구축하며 비용이 증가함에 따라, 이제는 AI가 업무 전반에 미치는 '영향력'을 측정하는 것이 중요해졌습니다. 본 글은 조직이나 부서 단위에서 AI 도입의 성과와 가치를 어떻게 정량적/정성적으로 평가하고 있는지 논의합니다. 단순한 기술 배포를 넘어, 실제 비즈니스 임팩트를 입증할 수 있는 측정 지표(KPI) 설정이 핵심 과제입니다.
GPU 컴퓨팅의 기원: 정부 연구가 이끈 혁신
현대 AI 시대를 가능하게 한 GPU 컴퓨팅은 30년 이상에 걸친 정부 지원 학술 연구의 산물입니다. 본 글은 GPU의 핵심 기술 요소인 병렬 컴퓨팅(Parallel Computing), 병렬 그래픽 시스템, 프로그래밍 가능한 셰이더 등의 기원을 추적합니다. DARPA와 같은 기관의 자금 지원을 받은 프로젝트들(예: Cosmic Cube, J-Machine)은 비동기 메시지 전달 및 동기화 메커니즘 등 현대 고성능 컴퓨팅(HPC)의 근간을 마련했습니다. 이러한 기술들이 엔비디아(Nvidia)와 같은 기업으로 이전되면서 머신러닝에 혁
LARQL: LLM 가중치를 그래프 DB처럼 쿼리하는 혁신적 방법
LARQL은 트랜스포머 모델의 가중치(weights)를 마치 그래프 데이터베이스처럼 질의하고 편집할 수 있게 해주는 도구입니다. 이 프레임워크는 거대 언어 모델 (LLM)을 'vindex'라는 쿼리 가능한 벡터 인덱스로 역컴파일합니다. 사용자는 LQL (Lazarus Query Language)이라는 전용 언어를 사용하여 모델의 지식을 탐색하고, 새로운 정보를 삽입하거나 추론할 수 있습니다. 가장 주목할 만한 기능은 다양한 배포 시나리오를 지원하는 'slicing' 기능입니다. 예를 들어, 클라이언트 장치(노트북)에서 어텐션 메커니

PyTexas 2026 요약: AI 시대의 주권과 전문화 전략
PyTexas 2026은 오스틴에서 열린 연례 파이썬 컨퍼런스로, AI 기술 발전 속도와 그에 따른 개발자들의 역할 변화에 초점을 맞췄습니다. 주요 논의 주제는 '주권(Sovereignty)'과 '전문화(Specialization)'였습니다. 강연자들은 거대 언어 모델(LLM)을 활용할 때 단순히 모델 성능 향상만으로는 부족하며, 프로세스 개선과 시스템 설계가 중요하다고 강조했습니다. 특히 데이터와 워크플로우의 주권을 확보하고, 도메인 지식 기반의 전문성을 갖추는 것이 핵심 경쟁력으로 제시되었습니다. 또한, AI 시대에는 자신이 통
AI의 임박한 '제로데이' 위협에 대한 방어 전략은?
최근 LLM(Large Language Models)의 발전으로 인해 취약점 패턴 매칭 및 논리 추론 능력이 급격히 향상되면서, 인간이나 그룹이 결합된 시스템을 통해 패치하기 어려운 '제로데이' 취약점을 대량으로 발견할 가능성이 높아지고 있습니다. 필자는 이러한 위협에 대해 너무 심각하게 받아들이기보다는 흥미로운 토론 주제로 접근해야 한다고 말합니다. 개인적인 견해로는, 인터넷과 완전히 분리된(airgap) 기기는 안전하지만, 진정으로 발전한 시스템 앞에서는 '에어갭'조차 무용지물이 될 수 있다고 지적합니다. 따라서 금융 분야의 조
LLM 시대의 사고 과정: 반 에멘의 관점에서 본 비판적 고찰
이 글은 1982년 M.H. van Emden의 논문을 인용하며, 초기 컴퓨터 시스템 설계가 지식 노동자의 사고 과정을 어떻게 지원해야 했는지에 대한 통찰을 제시합니다. 당시 반 에멘은 '컴퓨터 보조 사유(CAT)'라는 개념을 통해, 사용자가 자신의 생각을 명시적이고 형식적인 언어 구조로 분해하여 기계와 상호작용함으로써 깊이 있는 사고를 촉진할 수 있다고 주장했습니다. 그러나 2026년 현재의 대규모 언어 모델(LLM)과의 대화형 인터페이스는 이러한 이상적인 시스템과 거리가 멀다는 비판을 제기합니다. LLM은 본질적인 모호성을 유지

광자 기반 컴퓨팅으로 심층 학습의 미래를 열다
최근 인공지능 분야에서 혁신을 이끌고 있는 딥러닝(Deep Learning)은 방대한 데이터와 컴퓨팅 파워의 증가 덕분에 폭발적으로 성장했습니다. 현재는 GPU나 TPU 같은 전자기기 기반 가속기가 주류를 이루지만, 딥러닝 모델의 크기와 복잡성이 커지면서 에너지 소비 및 컴퓨팅 요구량도 기하급수적으로 늘어나고 있습니다. 이에 대한 대안으로 본 글은 빛(Photon)을 이용한 광학 프로세서(Optical Processors) 기반의 계산 방식을 제시합니다. 기존 딥러닝 연산이 행렬 곱셈과 누적(multiply-and-accumul-e
SynthID 역추적: 미디어 출처 증명 기술의 한계와 문제점
최근 Adobe, Meta, Google 등 많은 기업들이 미디어를 보호하기 위해 투명한 워터마크(invisible watermark)를 도입하고 있습니다. 하지만 이러한 방식은 여러 근본적인 한계를 가지고 있습니다. 특히 Google의 SynthID는 AI 기반으로 작동하며 이미지에 패턴을 삽입하지만, 이 기술 자체의 취약점과 사용 과정에서의 불일치성이 발견되었습니다. 필자는 전문 연구원에게서 얻은 소스 코드를 활용하여 SynthID를 역추적하는 방법을 제시합니다. 분석 결과, SynthID가 미디어 출처 증명(provenance
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.