Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

KV Cache가 VRAM을 잠식하고 있습니다 — 메모리가 고갈되기 전에 이를 추정하는 방법

LLM 추론 시 VRAM 부족의 주요 원인인 KV Cache의 메모리 점유를 계산하는 공식과 그 중요성을 설명합니다. 컨텍스트 길이와 배치 크기에 따라 동적으로 증가하는 KV Cache의 특성을 분석하고 메모리 고갈을 예측하는 방법을 다룹니다.

23시간 전0

Dev.to헤드라인

개발자로서 매주 10시간 이상을 아껴주는 7가지 AI 프롬프트 (복사해서 바로 사용 가능)

개발자의 생산성을 높여주는 7가지 핵심 AI 프롬프트 활용법을 소개합니다. 코드 리뷰, 문서화, 커밋 메시지 작성 등 실무에 즉시 적용 가능한 프롬프트와 이를 효율적으로 관리하는 스니펫 활용 팁을 다룹니다.

23시간 전0

X요약

Mila와 McGill 대학교 연구진의 질문: AI는 모든 환자에게 동일한 의료 조언을 제공하는가?

Mila와 McGill 대학교 연구진은 AI가 환자의 인종과 성별에 따라 의료 조언의 가독성과 긴급도를 다르게 제공하는 편향성을 발견했습니다. 연구 결과, 특정 인종 그룹은 의학 논문보다 읽기 어려운 복잡한 조언을 받거나 낮은 긴급도를 할당받는 등 불평등한 대우를 받는 것으로 나타났습니다.

23시간 전0

X요약

한 개발자가 AI 기업을 오픈 소스로 공개했습니다

한 개발자가 147개의 AI 에이전트와 12개의 전문 부서로 구성된 기업 전체를 오픈 소스로 공개했습니다. 이 프로젝트는 엔지니어링, 마케팅, 디자인 등 다양한 역할을 수행하며 출시 2주 만에 5만 개 이상의 GitHub 스타를 기록했습니다.

23시간 전0

Dev.to헤드라인

LLM이 도구를 정확하게 호출하도록 설계하는 방법: CCA-F 블루프린트의 5가지 패턴

LLM 에이전트가 도구를 정확하게 호출하도록 설계하는 5가지 패턴을 소개합니다. 도구 설명을 단순한 docstring이 아닌 프롬프트처럼 작성하고, 스키마를 엄격하게 정의하여 모델의 추측을 최소화하는 방법을 다룹니다.

23시간 전0

Yahoo Finance헤드라인

'빅 쇼트' 주역 스티브 아이즈먼, 중산층 '균열 시작', 세금 환급액은 '휘발유 탱크로 사라졌다'

스티브 아이즈먼은 유가 상승과 세금 환급액 소진으로 인해 미국 중산층의 경제적 압박이 심화되고 있다고 경고했습니다. K자형 경제 구조가 악화되는 가운데, Nike의 실적 부진과 Ralph Lauren의 가격 전략 차이가 기업별 성과 격차를 보여줍니다.

23시간 전0

Dev.to헤드라인

덜 대중적인 프로그래밍 언어를 위한 AI

Emacs Lisp과 같이 괄호 구조가 복잡한 비주류 언어를 다룰 때 AI 에이전트가 겪는 구문 오류 및 토큰 낭비 문제를 분석합니다. 에이전트가 도구 사용(tool use)을 통해 문제를 해결하려다 루프에 빠지는 한계와 이를 개선하기 위한 방향을 제시합니다.

23시간 전0

Dev.to헤드라인

스티어링 벡터 (Steering Vectors): 가중치를 수정하지 않고 LLM의 의도를 바꾸는 방법

LLM의 가중치를 수정하지 않고 활성화 공간(activation space) 내의 특정 방향을 조절하여 모델의 행동을 제어하는 스티어링 벡터 기술을 소개합니다. 선형 표현 가설을 바탕으로 모델의 톤, 전문성, 태도 등을 정밀하게 제어하는 원리와 방법을 다룹니다.

23시간 전0

Yahoo Finance헤드라인

오늘의 주식 시장: 미-이란 공격 중단 촉구 속에 S&P 500, Nasdaq, Dow 선물 상승

미국과 이란 간의 긴장 완화 보고에 따라 S&P 500, Nasdaq, Dow 선물 지수가 상승했습니다. 중동 정세 불안으로 유가는 상승했으나, 시장은 기술주 하락과 헬스케어주의 지지 사이에서 변동성을 보이고 있습니다.

23시간 전0

Qiita헤드라인

【6/15 당일 철회】 Claude Agent SDK 및 claude -p의 구독 별도 분리 정책은 무엇이었나

Anthropic이 Claude의 구독 범위를 대화형과 자동화형으로 분리하려던 과금 정책 변경을 시행 예정일인 6월 15일에 전격 철회했습니다. 이번 정책은 Agent SDK나 claude -p 등 자동화 도구에 별도 크레딧을 적용하려 했던 시도로, 개발자 커뮤니티의 큰 혼란을 야기했습니다.

23시간 전0

Dev.to헤드라인

우리는 스크레이퍼를 에이전트화(Agentic)했다. 그리고 더 느려졌다.

채용 정보 통합 스크레이퍼를 구축하며 겪은 에이전트 방식 도입의 시행착오를 다룹니다. 수동 코딩의 유지보수 문제와 LLM 기반 에이전트 도입 시 발생하는 속도 저하 및 비용 문제를 솔직하게 분석합니다.

23시간 전0

GeekNews헤드라인

아시아 AI 스타트업들, Anthropic Mythos 대체 모델 출시

아시아 AI 스타트업들이 출시한 'Mythos-like' 모델들의 실효성에 대한 비판적 분석입니다. 여러 모델을 조합하는 구조가 실제 성능 향상보다는 비용 소모와 과대광고에 치중되어 있다는 의구심을 제기하며, 검증되지 않은 벤치마크와 규제 가능성을 경고합니다.

23시간 전0

Dev.to헤드라인

AgentGuard: AI 에이전트 코드를 위한 오픈 소스 보안 스캐닝

AgentGuard는 AI 에이전트 코드의 보안 취약점을 탐지하기 위한 오픈 소스 정적 분석 도구입니다. OWASP ASI Top 10을 기반으로 프롬프트 인젝션, 도구 오용, 데이터 유출 등 에이전트 특화 보안 위협을 스캔합니다.

23시간 전0

Dev.to헤드라인

정규 표현식(Regex)을 넘어: AI 에이전트 취약점 탐지 규칙 구축하기

AI 에이전트의 프롬프트 인젝션 취약점을 탐지하기 위한 AgentGuard 구축 과정을 다룹니다. 단순 정규 표현식(Regex) 기반 탐지의 한계를 지적하며, AST(추상 구문 트리)를 활용한 의미론적 분석과 오염 흐름(Taint Flow) 추적의 필요성을 설명합니다.

23시간 전0

Dev.to헤드라인

BitNet: 대규모 언어 모델(LLM)을 위한 1-bit Transformer 스케일링

BitNet은 대규모 언어 모델(LLM)을 위한 1-bit Transformer 스케일링 기술을 제안합니다. 가중치를 1-bit로 압축하여 연산 효율성을 극대화하고 모델의 크기를 획기적으로 줄이는 연구를 다룹니다.

23시간 전0

GeekNews헤드라인

공용 DNS 리졸버 선택 가이드

공용 DNS 리졸버 선택 시 고려해야 할 프라이버시, 운영 주체의 신뢰성, 성능 및 네트워크 환경에 따른 실질적인 가이드를 제공합니다. 단순한 서비스 선택을 넘어 ISP DNS의 장점과 DNS 변경이 프라이버시에 미치는 한계 등을 심도 있게 다룹니다.

1일 전0

X요약

Kuaishou의 Kling 팀이 개발한 UnityShots

Kuaishou의 Kling 팀이 개발한 UnityShots는 일관된 멀티샷 오디오-비디오 생성을 위한 메모리 구동 시스템입니다. LTX-2.3을 기반으로 하며, 메모리 슬롯을 통해 샷 간의 정체성과 세계관을 유지합니다.

1일 전0

X요약

첫 결과물을 얻었습니다; 시퀀스 길이(seq length)가 128k인 5.16 Billion token 규모의 코딩 사전

시퀀스 길이 128k, 5.16B 토큰 규모의 코딩 사전 학습 데이터셋을 구축했습니다. 품질 지표를 통과한 약 1만 개의 GitHub 오픈 소스 저장소를 기반으로 생성되었습니다.

1일 전0

X요약

CodexQB에 이어 Kimi Code를 위한 repo-aware 계획 방식인 KimiQB 개발

Kimi Code를 위한 저장소 인식(repo-aware) 계획 시스템인 KimiQB가 개발되었습니다. 이 시스템은 프로젝트 이해부터 QA 감사, 구현 핸드오프까지 이어지는 엔드 투 엔드 계획 프로세스를 통해 복잡한 개발 작업 중 발생하는 컨텍스트 드리프트를 최소화합니다.

1일 전0

X요약

LLM에서는 더 깊은 것이 항상 더 나은 것은 아니다

Alibaba Qwen 팀이 훈련 없이 추론 성능을 높이는 'Confident Decoding' 기술을 발표했습니다. 최종 레이어의 정렬 세금을 우회하여 가장 확신 있는 표현을 선택함으로써, 낮은 지연 시간 오버헤드로 큰 추론 이득을 얻을 수 있습니다.

1일 전0

이 피드 구독하기

RSSFeedly, Inoreader 등으로 구독

API/api/search?q=검색어

AIllms.txt로 AI 크롤링 가이드