실제 적합한 인재를 찾아내는 AI 소싱 에이전트 구축하기
요약
본 글은 단순한 직무명 기반 추천 목록 제공 수준을 넘어선 진정한 'AI 소싱 에이전트'를 구축하는 방법을 다룹니다. 핵심은 데이터 계층의 혁신에 있으며, 기존 B2B 데이터 공급업체가 제공하는 제한적인 필터(직무, 위치 등)로는 한계가 명확합니다. 성공적인 에이전트는 GitHub 저장소, 자격증, 구사 언어, 투자 단계 등 70가지 이상의 세분화된 '틈새 필터'를 활용하고, 데이터를 캐시 대신 60개 이상의 공개 출처에서 실시간으로 소싱하며, 여러 정보를 단일 호출로 풍부하게(enrich) 가져오는 것이 중요합니다.
핵심 포인트
- 진정한 AI 소싱 에이전트는 단순한 목록 임대(list rental)가 아닌, 깊은 추론 능력을 갖춰야 합니다.
- 데이터의 질과 다양성이 핵심입니다. 직무명/위치 같은 일반 필터 대신 GitHub 기여도, 특정 기술 스택 등 틈새 필터를 사용해야 합니다.
- 데이터는 캐시된 정보보다 실시간(Live)으로 소싱되어야 하며, 오래되거나 부정확한 프로필은 오히려 해롭습니다.
- 효율성을 위해 여러 데이터를 단계적으로 가져오는 대신, 이메일 주소와 프로필 정보를 단일 호출에서 풍부하게(enrich) 받아 처리해야 합니다.
지난 주말 몇 번을 들여 AI 소싱 에이전트를 만들었습니다. 간단히 말하자면, 이 에이전트에게 직무(role)를 입력하면 후보자들을 순위 매기고 아웃리치 초안까지 작성해 줍니다. 모델 계층은 쉬운 부분이었습니다. 문제는 데이터 계층입니다. 이런 종류의 모든 프로젝트는 조용히 여기서 죽습니다. 모든 'B2B 데이터' 제공업체들은 직무명(job title), 위치(location), 회사(company), 경력 수준(seniority), 산업(industry)이라는 똑같은 다섯 가지 필터만 제공하며, 반쯤 오래된 프로필들이 가득한 거대한 풀을 보여줍니다. 그래서 당신의 'AI 소싱 에이전트'는 결국 다른 모든 사람들의 AI 소싱 에이전트와 마찬가지로 지난 분기의 직무명으로 동일한 200명의 사람들을 추천하게 됩니다. 그것은 소싱 에이전트가 아닙니다. 목록 임대(list rental)일 뿐입니다.
저는 데이터 계층을 DataForB2B로 바꿨고, 에이전트는 갑자기 실제로 추론할 거리가 생겼습니다. GitHub 저장소, 자격증, 구사 언어, 경력 연차, 이전 직장, 현재 회사의 투자 단계 등 기술 소싱에 중요한 필터들을 포함하여 70가지가 넘는 필터를 사용합니다. 프로필은 9개월 동안 창고에서 썩어가던 캐시된 내보내기(cached export)에서 가져오는 것이 아니라, 60개 이상의 공개 출처에서 실시간으로 소싱됩니다. 업무 이메일과 GitHub 프로필은 동일한 호출(call)에서 풍부하게(enriched) 돌아옵니다. GDPR/CCPA를 준수합니다.
만약 비슷한 것을 구축한다면 제가 강조하고 싶은 세 가지가 있습니다. 첫째, 틈새 필터(Niche filters)가 전부입니다. 누구나 'Series B 스타트업의 시니어 엔지니어'라는 결과를 반환할 수 있습니다. 하지만 'Rust 비동기 런타임에 기여했으며 YC 회사 창립팀 멤버였던 시니어 엔지니어'를 반환하는 것이 에이전트를 똑똑하게 느끼게 만듭니다. 둘째, 캐시된 것보다 실시간(Live > cached)입니다. 8개월 전에 회사를 떠난 '매치'는 매치가 없는 것보다 더 나쁩니다. 당신의 에이전트는 자신감 있게 잘못된 사람에게 이메일을 보낼 것이기 때문입니다.
g person. 같은 호출(call)에서 풍부화(enrich)하세요. 두 단계 파이프라인(find → enrich)은 지연 시간과 실패 표면적을 두 배로 늘립니다. 이메일과 프로필을 다시 함께 받으세요. 만약 귀하의 AI 에이전트가 그 아래에 있는 B2B 데이터 API만큼만 좋다면, 다음 오후 시간을 거기에 투자하세요.
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기