Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
X @krongggggg (검증됨) 315건필터 해제
에이전트가 프롬프트만 돌리는 게 아니라 자체 하네스랑 모델 가중치까지 직접 고치면서 자가 개선하는 구조가 진짜 흥미롭네. OpenAI
에이전트가 프롬프트 수정을 넘어 자체 하네스와 모델 가중치까지 직접 수정하며 자가 개선하는 구조를 소개합니다. OpenAI MLE-Bench에서 1위를 기록할 만큼 뛰어난 성능을 보이지만, 실무 적용 시 비용 제어와 안정성 검증이 필수적입니다.
기존 프로젝트 디자인 시스템을 유지하며 라이브 모드로 UI를 실시간 편집할 때 유용한 레퍼런스
디자인 시스템을 유지하며 UI를 실시간 편집하는 기술적 레퍼런스와 텐센트의 오픈소스 RAG 플랫폼 WeKnora를 소개합니다. CSS 캐스케이드 리졸버를 통한 성능 향상 사례와 추론 에이전트 기반의 문서 관리 자동화가 핵심입니다.
텐센트가 사내 문서 RAG 플랫폼 WeKnora를 오픈소스로 던졌는데 깃허브 스타 1.5만 개 박힐 만하네. 산재된 자료를 추론 에이전트랑
텐센트가 사내 문서 RAG 플랫폼인 WeKnora를 오픈소스로 공개했습니다. 산재된 자료를 추론 에이전트와 자동 정렬되는 위키 구조로 통합하여 문서 관리 효율을 극대화합니다.
클로드 Opus 4.8 출시됐는데 실무에서 긴 호흡의 작업을 자율적으로 처리하는 능력이 대폭 향상됨. 특히 이번에 강조된 Workflows
Claude Opus 4.8이 출시되어 긴 호흡의 작업을 자율적으로 처리하는 능력이 향상되었습니다. 특히 새롭게 강조된 Workflows 기능은 모델이 스스로 진단하며 작업하는 구조를 갖추고 있습니다.
벤치마크 점수 아무리 높게 나와도 내 로컬 코드베이스에 올리면 버그 속출하던 이유가 다 있었음. 데이터 오염 없는 DeepSWE로 다시
기존 SWE-Bench의 데이터 오염 문제를 지적하며, 데이터 오염이 없는 DeepSWE 벤치마크를 통해 모델 성능을 재검증합니다. 테스트 결과 GPT-5.5는 70%의 높은 성능을 보인 반면, Claude Sonnet은 32%로 급격히 낮은 성능을 기록했습니다.
Claude Code 쓰는 개발자면 이 공식 플러그인 디렉터리는 나중에 뜯어볼 만함.
Claude Code의 공식 플러그인 디렉터리 구조와 활용법을 소개합니다. 내부 및 외부 플러그인이 분리되어 있어 효율적인 기능 탐색이 가능하며, 보안을 위한 권한 및 연결 확인의 중요성을 강조합니다.
Graph RAG의 지식 그래프 트래버설이랑 Agentic RAG의 동적 도구 호출 구조를 다이어그램 한 장으로 찢어놓은 자료임. 3가지
Graph RAG의 지식 그래프 트래버설과 Agentic RAG의 동적 도구 호출 구조를 비교 분석한 자료입니다. 쿼리 유형에 따른 아키텍처 선택법과 벡터 검색 효율을 높이는 양자화 기술, 그리고 에이전트 보안을 위한 샌드박싱 가이드를 다룹니다.
나중에 내 도메인 맞춤형 자율 에이전트 인프라 구축할 때 뼈대로 삼기 딱 좋은 아키텍처 레퍼런스 영상임. .hermes 폴더 구조 밑단부터
자율 에이전트 인프라 구축을 위한 아키텍처 레퍼런스 영상에 대한 소개입니다. 폴더 구조, 3계층 메모리 시스템, Claude Code 연동 등 실전 빌드팩 중심의 내용을 다룹니다.
Higgsfield Supercomputer 데모 보면 마케팅 에이전트 아키텍처가 단순 텍스트 생성을 넘어 분석-생성-테스트-학습의 루프로
Higgsfield Supercomputer 데모를 통해 분석, 생성, 테스트, 학습이 순환되는 마케팅 에이전트 아키텍처를 분석합니다. 단순 텍스트 생성을 넘어 대규모 미디어 변형을 실시간으로 처리하는 비선형 자동화 파이프라인의 중요성을 강조합니다.
AI 프론트엔드 생성 툴을 만들 때 단순 깡 프롬프트가 아니라 디자인 감각 제어 레이어가 왜 필요한지 보여주는 좋은 예시가 나왔네.
AI 프론트엔드 생성 시 단순 프롬프팅을 넘어 디자인 감각을 제어하는 레이어의 중요성을 강조합니다. TasteSkill v2와 모델별 비교를 통해 미니멀한 디자인 구현 능력을 분석하며, 코드 생성의 효율성 문제를 지적합니다.
Claude가 지 혼자 코드 짜고 터미널 명령어 날리는 시대에 진짜 중요한 건 성능이 아니라 걔가 내 DB나 소스코드를 날려 먹지 못하게
AI 에이전트가 자율적으로 코드를 작성하고 터미널 명령어를 실행할 때 발생할 수 있는 보안 및 데이터 손실 위험을 경고합니다. Anthropic이 제안한 에이전트용 샌드박싱 기술을 통해 인프라 격리의 중요성을 강조합니다.
깃허브 182k 스타 박힌 것만 봐도 알 수 있듯이 이건 흔한 프롬프트 팩 수준이 아님. Claude Code를 챗 인터페이스가 아니라
Claude Code를 단순 채팅 인터페이스를 넘어 246개의 스킬과 61개의 에이전트, 메모리 시스템을 갖춘 강력한 인프라로 구축한 사례를 소개합니다. 프로덕션 환경의 안정성을 확보하기 위해 설계된 고도화된 에이전트 시스템의 특징을 다룹니다.
내 X 프로필 데이터 긁어다 바이럴 패턴이랑 오디언스 성향 분석할 때 참고하기 좋은 브라우저 에이전트 프롬프트 세팅임. Codex로 타임라인
X(Twitter) 프로필 데이터를 활용해 바이럴 패턴과 오디언스 성향을 분석하는 브라우저 에이전트 프롬프트 설정법을 소개합니다. Codex를 이용해 타임라인 데이터를 추출하고 마케팅 가이드라인 초안을 생성하는 워크플로우를 다룹니다.
Anthropic 공식 아카데미를 통한 Claude 에이전트 마스터하기
Anthropic 공식 아카데미를 통해 Claude Code와 에이전트 구축을 학습할 수 있는 코스가 공개되었습니다. 우분투 기반의 격리된 샌드박스 환경을 제공하여 복잡한 설정 없이 즉시 실습이 가능합니다.
에이전트가 사람이 고친 오답노트 보고 자기 코드를 스스로 수정해서 배포하는 루프가 진짜 프로덕션에 붙기 시작하네. OpenAI가 세무
OpenAI가 Codex를 활용해 세무 워크플로우에 에이전트를 적용한 사례를 소개합니다. 에이전트가 사람이 수정한 오답 노트를 학습하여 스스로 코드를 수정하고 배포까지 수행하는 자가 개선 인프라의 실무 적용을 다룹니다.
Claude Code를 시니어 레드팀 도구로 바꿔준다는 스킬 번들이 나왔네. 24개 취약점 클래스에 걸쳐 574개 이상의 리포트 패턴을
Claude Code를 시니어 레드팀 도구로 활용할 수 있게 해주는 새로운 스킬 번들이 출시되었습니다. 24개 취약점 클래스와 574개 이상의 리포트 패턴을 지원하며, 기업용 공격 체인 분석이 가능합니다.
이거 하나면 굳이 비싼 강의 안 찾아듣고 Claude 에이전트 끝판왕까지 딸각 가능함. Anthropic 공식 아카데미 코스 13개에 무료
Anthropic에서 제공하는 13개의 무료 공식 아카데미 코스를 소개합니다. Claude Code부터 자동화 루틴까지 에이전트 구축을 위한 핵심 기술을 학습할 수 있습니다.
LLM 및 생성형 AI 빌더 면접 시 막연한 소리만 하는 지원자를 필터링하기 위한 자료
LLM 및 생성형 AI 빌더 채용 시 실무 역량을 검증하기 위한 151개의 심층 면접 질문 자료를 소개합니다. 단순 프롬프트 엔지니어링을 넘어 Python 코드, 아키텍처, MLOps, 인프라 예외 처리 등 프로덕션 단계의 실질적인 기술력을 평가하는 데 중점을 둡니다.
요즘 LLM에 먹일 데이터 긁으려고 파이썬으로 직접 스크래퍼 짜는 짓은 진짜 미련한 짓임. Crawl4AI나 Firecrawl 같은 오픈소스
LLM 학습 및 활용을 위한 데이터 수집 시 직접 스크래퍼를 구축하기보다 Crawl4AI나 Firecrawl 같은 오픈소스를 사용하는 것이 효율적입니다. 이러한 도구들은 마크다운 변환과 IP 차단 우회 기능을 제공하여 개발 시간을 단축해 줍니다.
웹 브라우징 에이전트 커스텀할 때 LangChain 같은 거 비대해서 쓰기 싫다면 MS의 Webwright 소스 코드를 뜯어볼 만함. 전체
LangChain과 같은 무거운 프레임워크 대신 사용할 수 있는 MS의 경량 웹 브라우징 에이전트 Webwright를 소개합니다. Playwright 기반의 단일 파이썬 파일로 구성되어 매우 가볍지만, SPA 환경에서의 예외 처리는 직접 구현해야 합니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.