Launch HN: Release (YC W20) – AI 인프라 및 애플리케이션 오케스트레이션
요약
Release.ai는 AI 애플리케이션의 개발과 운영(DevOps)을 위한 통합 플랫폼입니다. 기존의 웹 애플리케이션 개발 방식을 넘어선 복잡한 AI 워크플로우를 쉽게 구축하고 관리할 수 있도록 돕습니다. 특히, 데이터 변경에 따른 AI 추론 서버 자동 재배포 같은 오케스트레이션 기능을 제공하며, K8s 기반으로 다중 클라우드 GPU 자원 관리를 단일 인터페이스에서 지원합니다. 또한, RAG(Retrieval-Augmented Generation) 등 주요 오픈소스 프레임워크의 템플릿을 제공하여 초기 개발 장벽을 낮추고 보안 및 사
핵심 포인트
- AI 애플리케이션 생태계에 맞춰 워크플로우 엔진을 구축하여 데이터 변경 시 AI 추론 서버 자동 재배포 등 복잡한 오케스트레이션을 구현할 수 있습니다.
- K8s 기반으로 여러 클라우드 환경의 GPU 컴퓨팅 자원(인스턴스/노드 그룹)을 단일 관리 인터페이스에서 통합적으로 관리하여 비용 및 복잡성을 해결합니다.
- RAG, 파인튜닝 등 20개 이상의 오픈소스 AI 애플리케이션 템플릿을 제공하며, 이는 개발자가 즉시 시작할 수 있도록 환경 설정의 어려움을 해소합니다.
- 데이터와 모델이 클라우드 계정에 안전하게 유지되는 온프레미스/오픈소스 기반 아키텍처를 지향하여 보안 및 프라이버시 우려를 해결합니다.
Launch HN: Release (YC W20) – AI 인프라 및 애플리케이션 오케스트레이션
안녕하세요, Hacker News! 저희는 TrueCar를 떠나 300명 규모의 개발팀을 관리했던 에릭(Erik), 토미(Tommy), 데이비드(David)가 운영하는 Release (https://release.ai/)입니다. 저희는 2020년에 HN에 처음 출시했었습니다 (https://news.ycombinator.com/item?id=22486031). 원래 초점은 임시 환경(ephemeral environments)을 통해 스테이징 환경(staging environments)을 더 쉽게 만드는 것이었지만, 과정 중에 AI 애플리케이션이 분산 애플리케이션(distributed applications)의 중요하고 핵심적인 구성 요소로 부상하는 것을 확인했습니다. 저희가 기존 제품을 사용하는 고객들과 이야기하면서, AI 애플리케이션과 인프라를 오케스트레이션(orchestrating)하는 데 필요한 근본적인 플랫폼을 구축했음을 깨달았습니다. 그래서 오늘 Release.ai를 HN에 공유하게 되어 매우 기쁩니다.
여기서는 플랫폼을 보여주고 사용자가 선택한 RAG 스택(RAG stack)을 사용하여 새로운 데이터와 변경 사항을 쉽게 관리하는 방법을 시연하는 비디오가 있습니다: https://www.youtube.com/watch?v=-OdWRxMX1iA
release.ai를 사용해 보고 싶다면, 제한된 무료 GPU 사이클이 제공되는 샌드박스 계정(sandbox account)을 제공합니다. 이를 통해 자유롭게 테스트하며 Release.ai에 익숙해질 수 있습니다: https://release.ai. RAG AI 템플릿으로 플레이하거나 데모 비디오처럼 사용자 지정 워크플로우(custom workflows)를 추가하는 것을 추천합니다. 이 샌드박스에는 Amazon g5.2xlarge 인스턴스(A10, 24GB VRAM, 8vCPUs 및 32GB)에서 사용할 수 있는 무료 컴퓨팅 시간 5시간이 포함되어 있습니다. 또한 웹 서버와 같은 CPU 워크로드용으로 16 GB 및 4vCPUs도 제공됩니다. 이를 통해 추론 엔진(inference engine) 외에도 API 서버 등 다양한 것을 실행할 수 있습니다.
샌드박스 기간이 만료된 후에는 무료 플랜(free plan)으로 전환할 수 있으며, 이 플랜은 신용카드와 AWS/GCP 계정을 Release에 연결하여 클라우드 계정에서 컴퓨팅을 관리해야 합니다. 무료 계정은 매월 100시간의 무료 관리 환경 시간(managed environment hours)을 제공합니다. 만약 이를 초과하지 않는다면 비용이 발생하지 않습니다. 만약 초과한다면, 저희 가격 정책은 여기입니다: https://release.com/pricing.
더 깊은 배경 지식을 읽고 싶은 분들을 위해 관련 내용을 공유합니다.
오픈 소스 AI(open source AI)와 AI 개인 정보 보호(AI privacy)가 중요해질 것이 분명합니다. 네, 많은 개발자들이 OpenAI 같은 SaaS 제공업체의 오퍼링을 사용하여 AI 애플리케이션을 구축할 것입니다. 하지만 오픈 소스 프레임워크(frameworks)와 모델이 개선됨에 따라, 클라우드에서 구동되는 오픈 소스로의 전환(shift to open source running on cloud)을 목격하고 있습니다. 보안과 개인 정보 보호는 이러한 SaaS 솔루션을 활용하는 기업들의 주요 관심사이며, 이는 그들이 자체적으로 인프라를 운영하도록 강제합니다. 바로 이 지점에서 저희가 기여하고자 합니다: Release.ai를 구축하여 모든 데이터, 모델 및 인프라가 고객의 클라우드 계정 내에 남아있고 오픈 소스로 유지되도록 했습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 HN Chip/GPU의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기