Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
LangChain Blog 45건필터 해제

LangGraph의 장기 기억 (Long-Term Memory) 지원 출시
LangGraph가 Python과 JavaScript 환경에서 대화 간 정보를 저장하고 회상할 수 있는 장기 기억(Long-Term Memory) 지원을 시작했습니다. 이번 업데이트는 단순한 문서 저장소 형태의 지속 가능한 기억 계층을 제공하여, 에이전트가 사용자 선호도를 학습하고 여러 스레드에 걸쳐 정보를 유지할 수 있도록 돕습니다.

기술(Skills) 평가하기
LangChain은 코딩 에이전트의 성능을 높이기 위해 동적으로 로드되는 '기술(Skills)'을 구축하고 있으며, 이를 효과적으로 검증하기 위한 평가 방법론을 제시합니다. 기술은 에이전트가 필요할 때만 호출되는 프롬프트와 리소스의 집합으로, 에이전트의 성능 저하를 방지하면서 전문성을 높이는 역할을 합니다. 안정적인 평가를 위해서는 Docker와 같은 샌드박스 환경을 통해 테스트의 재현성을 확보하는 것이 필수적입니다.
프로덕션 환경의 Deep Agents를 뒷받침하는 런타임 (Runtime)
프로덕션 환경에서 장기 실행되는 Deep Agents를 안정적으로 운영하기 위해서는 단순한 프롬프트와 도구를 넘어 내구성이 있는 실행(Durable execution)을 지원하는 런타임 인프라가 필수적입니다. 본문은 체크포인트 실행, 메모리 관리, 인간 참여형(HITL), 관찰 가능성 등 에이전트의 안정성을 보장하는 핵심 런타임 기능과 LangSmith Deployment(LSD)의 역할을 설명합니다.

LangChain의 GTM 에이전트를 구축한 방법
LangChain은 Salesforce, Gong, LinkedIn 등 다양한 도구를 오케스트레이션하여 영업 프로세스를 자동화하는 GTM(Go-To-Market) 에이전트를 구축했습니다. 이 에이전트는 리드 조사부터 Slack 초안 작성까지의 과정을 수행하며, 인간 참여형(Human-in-the-loop) 원칙을 통해 영업 담당자의 승인 후 메시지가 발송되도록 설계되었습니다.

Madrigal이 LangChain과 LangSmith를 사용하여 제약 분야를 위한 유연하고 확장 가능한 멀티 에이전트(Multi-Agent)
Madrigal Pharmaceuticals는 LangChain과 LangSmith를 활용하여 제약 분야에 특화된 확장 가능한 멀티 에이전트 플랫폼을 구축했습니다. 데이터 소스를 도구 인터페이스로 추상화하고 기능을 모듈형 기술로 설계함으로써, 새로운 도메인과 요구사항에 신속하게 대응할 수 있는 구조를 마련했습니다.

AI를 활용한 사용 가능한 텍스트 생성
이 글은 대규모 언어 모델(LLMs)을 활용한 텍스트 생성 과정에서 발생하는 도전 과제와 이를 해결하기 위한 프롬프트 엔지니어링의 기초 개념을 다룹니다. 프롬프트의 구조화된 설계와 퓨샷 프롬프팅(few-shot prompting), 단계별 추론(step-by-step reasoning)과 같은 핵심 기술을 통해 모델의 성능을 최적화하는 방법을 소개합니다.

높은 카디널리티 (High Cardinality) 상황에서의 쿼리 분석 벤치마킹
LLM을 활용한 구조화된 데이터 추출 및 쿼리 분석 시, 가능한 값의 종류가 매우 많은 '높은 카디널리티(High Cardinality)' 범주형 값을 처리하는 문제와 해결 방안을 다룹니다. 가능한 값이 많아질수록 컨텍스트 제한, 비용, 추론 성능 저하 등의 문제가 발생하므로 이를 효율적으로 처리하기 위한 실험과 벤치마크 결과를 제공합니다.

LangChain에서 PII 데이터 처리하기
LLM 애플리케이션 개발 시 발생할 수 있는 개인 식별 정보(PII) 유출 위험과 이를 방지하기 위한 데이터 마스킹의 중요성을 다룹니다. Microsoft Presidio와 같은 도구를 활용하여 텍스트 내 PII를 식별하고 익명화하는 방법론을 제시합니다.
에이전트 평가 준비 체크리스트
에이전트 평가를 구축하기 전 반드시 수행해야 할 실무 체크리스트를 제공합니다. 실제 트레이스를 수동 검토하여 실패 패턴을 파악하고, 모호하지 않은 성공 기준을 정의하며, 능력 평가와 회귀 평가를 분리하여 관리하는 전략을 강조합니다.

Chat-Your-Data 제출물
사용자 데이터를 기반으로 한 챗봇 제작 경연 대회인 'Chat-Your-Data'의 주요 제출물들을 소개합니다. 이번 대회에서는 25개 이상의 새로운 문서 로더가 추가되었으며, 팟캐스트, 개인 SNS, Roam Research 등 다양한 데이터를 활용한 엔드 투 엔드 프로젝트들이 공개되었습니다.

관측성(Observability)을 통한 AI 에이전트 디버깅 및 평가 방법 — LangChain 가이드
AI 에이전트는 전통적인 소프트웨어와 달리 비결정론적이며 복잡한 추론 과정을 거치므로, 기존의 코드 기반 디버깅과는 다른 관측성(Observability) 접근 방식이 필요합니다. 에이전트의 행동을 기록하는 트레이스(Traces)를 통해 추론 과정을 추적하고, 이를 바탕으로 체계적인 평가를 수행하는 것이 에이전트 엔지니어링의 핵심입니다.
LangGraph Cloud를 활용한 데이터 시각화 에이전트 구축
LangGraph Cloud를 활용하여 SQLite나 CSV 데이터를 쿼리하고 시각화하는 풀스택 데이터 시각화 에이전트 구축 방법을 소개합니다. 스키마 추출, 임베딩 생성, RAG 기반의 테이블 검색 및 SQL 생성으로 이어지는 복잡한 Text-to-SQL 워크플로우를 다룹니다.

GPTwitter: 최초의 개인화된 AI 생성 소셜 미디어 플랫폼
GPTwitter는 사용자의 '좋아요' 이력을 학습하여 개인화된 트윗을 생성하는 AI 기반 소셜 미디어 플랫폼입니다. LangChain을 활용하여 사용자의 관심사에 맞춘 콘텐츠를 지속적으로 생성하며, 소셜 미디어의 콘텐츠 고갈 문제를 LLM으로 해결하고자 하는 실험적인 프로젝트입니다.

LangGraph 구축하기: 제1원칙에 기반한 에이전트 런타임 (Agent Runtime) 설계
LangGraph는 프로덕션 환경에서 신뢰할 수 있는 AI 에이전트를 구축하기 위해 설계된 저수준(low-level) 프레임워크입니다. 기존 LangChain의 한계를 극복하기 위해 높은 추상화 대신 제어력과 내구성에 집중하며, 긴 지연 시간과 비결정론적 특성을 관리하는 데 최적화되어 있습니다.

Deep Agents 평가하기: 우리의 학습 내용
LangChain은 최근 DeepAgents CLI, LangSmith Assist 등 다양한 에이전트 애플리케이션을 출시하며 딥 에이전트 평가에 대한 중요한 통찰을 얻었습니다. 딥 에이전트는 단순한 최종 응답 평가를 넘어, 각 데이터 포인트마다 고유한 성공 기준과 맞춤형 테스트 로직을 적용해야 합니다.

에이전트 프레임워크와 에이전트 관측 가능성에 대하여
LLM 성능 향상에도 불구하고 에이전트 프레임워크는 모델 주변의 시스템으로서 지속적으로 진화하며 유효성을 유지할 것입니다. 에이전트 기술은 단순 체이닝에서 워크플로 오케스트레이션을 거쳐 루프 내 도구 호출 방식으로 발전해 왔으며, 프레임워크는 개발 효율성과 표준화를 위해 필수적입니다.

Pinecone Serverless를 활용한 RAG 애플리케이션 구축 및 배포
본 기사는 프로덕션 환경에서 RAG(검색 증강 생성) 애플리케이션을 구축할 때 발생하는 관리 및 비용 문제를 해결하는 방법을 다룹니다. Pinecone Serverless를 통한 효율적인 벡터 데이터 관리, LangServe를 이용한 신속한 배포, 그리고 LangSmith를 통한 관찰 가능성 확보를 핵심 솔루션으로 제시합니다.

LangSmith를 위한 OpenTelemetry 지원 도입
LangSmith가 분산 트레이싱 및 관찰성을 위한 개방형 표준인 OpenTelemetry 지원을 시작했습니다. 이를 통해 개발자는 다양한 프로그래밍 언어와 프레임워크에서 생성된 텔레메트리 데이터를 LangSmith로 직접 전송하여 통합된 LLM 모니터링 환경을 구축할 수 있습니다.

LangSmith의 엔드 투 엔드 OpenTelemetry 지원 도입
LangSmith가 LangChain 및 LangGraph 기반 애플리케이션을 위한 엔드 투 엔드 OpenTelemetry 지원을 도입했습니다. 이를 통해 개발자는 표준화된 트레이싱을 사용하여 LLM 애플리케이션의 복잡한 워크플로를 모니터링하고, LangSmith뿐만 아니라 Datadog, Grafana 등 다양한 관측성 플랫폼과 상호 운용할 수 있습니다.

OpenEvals로 LLM 평가 빠르게 시작하기
OpenEvals와 agentevals는 LLM 기반 애플리케이션 및 에이전트의 품질을 체계적으로 평가할 수 있도록 돕는 새로운 패키지입니다. 사용자는 사전 구축된 평가자(evaluators)를 활용하여 데이터셋 큐레이션과 지표 설정의 어려움을 해결하고, LLM-as-a-judge 방식을 통해 맞춤형 평가 체계를 빠르게 구축할 수 있습니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.