엔터프라이즈 소프트웨어 엔지니어링을 위한 LLM 커스터마이징

엔터프라이즈 소프트웨어 개발은 점진적인 추가, 아키텍처 수정, 프로덕션 배포 및 엄격한 유지보수를 특징으로 하는 지속적인 진화 과정입니다. 이러한 활동은 현대의 LLM (Large Language Models)이 엔터프라이즈 소프트웨어 엔지니어링을 위한 추가적인 도구 가능성을 열 수 있도록 파인튜닝 (Finetuning)할 수 있는 가치 있는 데이터를 생성합니다. 최첨단 LLM들은 이미 매우 뛰어난 능력을 갖추고 있지만, 이러한 형태의 커스터마이징 (Customization)은 엔터프라이즈 특화 최적화를 위한 설득력 있는 경로를 제공합니다. 우리는 Google의 내부 소프트웨어 엔지니어링 생태계에 특화된 Gemini의 적응형 모델인 Gemini for Google (GfG)을 소개합니다. 본 논문은 1조 개의 토큰으로 구성된 독점 데이터셋을 큐레이션하는 것부터 치명적 망각 (Catastrophic forgetting)을 완화하는 미드 트레이닝 (Mid-training) 전략을 구현하는 것에 이르기까지, 모델의 엔드 투 엔드 (End-to-end) 개발 과정을 상세히 설명합니다. 29,000명의 개발자를 대상으로 한 대규모 블라인드 A/B 테스트 결과, Gemini for Google은 베이스라인 (Baselines) 모델들을 크게 능가했습니다. 구체적으로 턴당 평균 반복 횟수를 23% 감소시켰으며, 코드 생존율 (Code survival rates)을 약 17% 향상시켰습니다. 지표를 넘어, 우리는 다음과 같은 내용을 포함하여 엔터프라이즈 모델 적응을 위한 포괄적인 청사진을 제공합니다: (1) 소프트웨어 엔지니어링 데이터로부터 고가치 신호 추출, (2) 데이터 준비 전략, (3) 풀스택 모델 튜닝 (Continued pre-training 및 Post-training), (4) 다운스트림 (Downstream) 애플리케이션의 배포. 우리는 이 방법론이 다른 조직들이 내부 엔지니어링 데이터의 잠재력을 완전히 끌어낼 수 있는 복제 가능한 경로를 제공할 것이라고 믿습니다.

Insights

엔터프라이즈 소프트웨어 엔지니어링을 위한 LLM 커스터마이징

요약

핵심 포인트

댓글

책임 있는 개인화: 인간-로봇 상호작용에서의 양날의 검

TopoBrick: 제로샷 빌딩 IoT 예측을 위한 외생 변수의 에이전트적 토폴로지 샘플링

이번 글은 1편(DB증권), 2편(모건스탠리)에 이어지는 세 번째 이야기입니다.

ExplAIner: 분류 모델 설명(Explanation)을 위한 선언적 질의 언어

TopoBrick: 제로샷 빌딩 IoT 예측을 위한 외생 변수의 에이전트적 토폴로지 샘플링

이번 글은 1편(DB증권), 2편(모건스탠리)에 이어지는 세 번째 이야기입니다.

ExplAIner: 분류 모델 설명(Explanation)을 위한 선언적 질의 언어