머신러닝 취업 면접 - 완벽 가이드 - Insights | Molayo

Machine Learning 박사 학위 후 Research Scientist 직무를 구하는 전체 과정을 정리한 실전 경험 모음
DeepMind, Isomorphic Labs, Cohere, Meta 및 스텔스 스타트업 등 인터뷰를 완료한 모든 회사에서 오퍼를 받은 사례 기반
인터뷰 확보 기준, 기술·감정·로지스틱 준비법 , 스타트업 vs 빅테크 비교, 연봉 협상까지 단계별 정리
RSU와 stock option의 세금·구조 차이, transformer·attention 직접 구현 등 구체적 준비 항목 포함
인터뷰는 본질적으로 확률적(stochastic) 이며, 결과가 연구자로서의 가치를 결정하지 않는다는 메시지 강조
전체 인터뷰 결과와 배경
ML 박사 후 Research Scientist 구직 과정을 직접 경험하고 정리, 시작 시점에 참고할 자료가 거의 없었음
인터뷰를 완료한 모든 회사에서 오퍼 획득 — DeepMind(수락), Isomorphic Labs, Cohere, Meta, 스텔스 스타트업 포함
Anthropic, Mistral, TeslaAI는 연락이 늦어 프로세스 미완료
ReflectionAI는 RS 직무에서 유일한 거절, 대신 Engineering 트랙으로 전환 제안
SpaceXAI, Waymo, Wayve는 인터뷰 초청 없음
Waymo에는 박사 과정 내내 6개월마다 지원했으나 한 번도 응답 없었음
인터뷰 확보 방법
인터뷰 확보의 핵심 레버는 더 많은 논문, 트렌디한 주제, 더 좋은 인턴십
박사 과정 중 ICLR / NeurIPS / ICML에 게재한 1저자(또는 공동 1저자) 논문 4편 보유 (LLM, RL, Meta-Learning, Evolution Strategies)
Apple 인턴십 및 Meta 소프트웨어 엔지니어 경력 보유
대략적 기준: 1저자 논문 3편 이상 + 인턴십 또는 산업 경력 1회 이상 이면 상위 랩에서 꾸준히 콜백 확보 가능
이미 인터뷰를 받고 있다면 추가 논문은 도움 안 됨 → 연구가 아닌 인터뷰 준비에 집중 필요, 준비된 느낌은 오지 않으므로 지금 시작해야 함
커버레터, 추천, 콜드 이메일, LinkedIn/X
LinkedIn / X : 많은 회사가 채용 공고를 올리며, 인턴십은 이곳이 유일한 지원 경로인 경우 있음
공고에 연결된 Google form을 작성해야 실제 지원으로 인정됨
Referrals(추천) : 있으면 좋지만 필수 아님
DeepMind에서는 추천 있던 직무와 없던 직무 모두 인터뷰 초청받음
Cold emails(콜드 이메일) : 채용 담당자나 팀원에게 직접 메일 보내는 것은 종종 환영받음
CV 반복이 아니라 해당 팀에 적합한 이유와 흥미를 느끼는 지점을 설명해야 함
Cover letters(커버레터) : 드물게 요구되나 요구 시 제대로 작성
Claude / Gemini / ChatGPT에 통째로 작성을 맡기지 말 것 , 직접 쓴 뒤 다듬는 용도로만 활용
스타트업 vs 빅테크
스타트업은 찾기가 더 어려움 , 중앙화된 탐색처 없음 → 동료·친구·전 동료를 통한 입소문이 최선이며, 그만큼 경쟁도 덜 치열함
스타트업은 인터뷰 프로세스 편차가 큼 , 빅테크는 비교적 예측 가능한 구조
프로세스가 너무 쉽게 느껴지면 실제 업무 복잡도에 대한 신호일 수 있음
업무 성격은 양방향 — 적합한 스타트업에서는 더 흥미롭고 임팩트 큰 연구 가능, 반대로 더 많은 압박·인프라 작업·잦은 연구 방향 변경 동반 가능
인터뷰에서 연구 우선순위 결정자, 수익화 경로, 경쟁사 등을 질문할 것
성장 기회 : 스타트업은 빠른 성장과 책임 확대, 업무 방향 형성 기회 제공, 빅테크에서는 다수 중 하나
CV 인지도 : OpenAI나 Anthropic은 즉시 인식되나, 무명 스텔스 스타트업은 설명 필요
고용 안정성 : 빅테크도 대규모 정리해고를 반복해왔으며, 어느 쪽도 100% 안전하지 않음
보상: RSU vs Stock Option (영국 기준)
RSU (빅테크 일반적): 베스팅 일정에 따라 실제 주식 수령, 베스팅 시 약 절반은 소득세 충당 위해 즉시 매도 — RSU는 소득으로 과세됨
Stock option (스타트업 일반적): 주식이 아니라 고정 가격 X에 매수할 수 있는 권리 획득
시장가 Y > X이면 X에 사서 Y에 팔아 차익 확보, Y < X이면 옵션은 무가치
Stock option은 보통 퇴사 90일 후 만료 , 회사가 비상장이면 매수 후에도 매도 불가
영국에서는 옵션 행사 순간, 한 푼도 받지 못한 상태에서 Y−X 차익에 대해 소득세 부과
비상장 회사에서 2년 근무 후 퇴사·행사 시 (X × 옵션 수) 매수 비용 + (Y−X) × 옵션 수 × 세율의 소득세를 수익 발생 전에 부담
대부분 cashless exercise 옵션 제공, 다수가 자사주 매입(liquidity event) 진행
단 매 펀딩 라운드마다 지분 희석, 추가 이익에는 약 20% 양도소득세 부과, liquidity event 가치는 공식 기업 가치보다 낮게 책정됨
요약 : 리크루터가 스타트업 지분 포함 총 보상 수치를 제시하면 정중히 웃되 상당 폭 할인해 받아들일 것
인터뷰 구조
대부분 회사가 비슷한 구조를 따르되 단계별 비중은 상이함
Recruiter screen : 보통 부담 적은 대화, 보유 역량의 직무 적합성과 본인 논문에 대한 설명 능력 확인 기회
Technical interviews : 프로세스의 대부분, 준비가 가장 중요, 회사에 따라 38회
Coding: LeetCode 스타일, 보통 Medium 또는 Hard
ML coding/debugging: attention 구현, backward pass 작성, 학습 루프 버그 탐지
ML knowledge: 기초, 이론, 응용 ML, 시스템 디자인
Behavioural interviews : 고전적 행동 질문과 연구형 질문(관심 주제, 분야 전망)으로 구분, 기술 인터뷰보다 캐주얼하나 과소평가 금지
기술 준비
가장 핵심 파트, 건너뛰지 말 것 — 뛰어난 연구자도 준비 부족으로 탈락한 사례 있음, 매일 ML을 다루는 것과 attention을 처음부터 구현하는 것은 다름, 최소 한 달 규칙적 학습 배정 필요
메타 전략: 일반 준비는 최소화하고 다음 특정 인터뷰·회사에 맞춰 타깃 준비 , 자료가 머릿속에 신선하게 유지됨
RS / Engineer 인터뷰는 overfitting 같은 기초부터 LeetCode, transformer 구현, Griffin·TransformerXL·S4 같은 현대 아키텍처까지 거의 무엇이든 출제 가능
Flashcards
ML 기초, 응용 ML, 연구 토론용으로 활용, Anki보다 물리 플래시카드가 더 효과적이었음
카드를 직접 작성하는 것이 학습의 절반 , 남의 덱을 다운로드하지 말 것
복습 시 스스로 질문하며 깊이 이해, 학습 중 던진 질문이 실제 인터뷰에 다수 출제됨
LLM 모의 인터뷰 (Claude / Gemini)
각 인터뷰 전 직무·인터뷰·회사 설명을 LLM(주로 Claude)에 붙여 넣고 인터뷰 요청, 연습 질문과 실제 질문의 중복 빈번
난이도가 맞지 않으면 새 채팅에서 본인 수준·배경을 더 명시
학습에는 Claude가 가장 우수했고 피드백도 공정했던 반면, Gemini는 다소 과도하게 칭찬하는 경향
LeetCode / NeetCode
최소 Blind 75 , 선택적으로 NeetCode 150 수행, Medium 중심
각 문제의 최적 해를 목표 (TwoSum의 O(N²) 해는 인정 안 됨), Hard에는 시간 투자 자제
DFS, BFS, Graphs, Backtracking, DP, Binary Search 등 기본 패턴을 빠르게 구현, Medium당 20분 이하 목표
15분 이상 막히면 해답 확인 후 표시하고 넘어갈 것
깊이보다 넓이가 중요 , 총 Medium 약 150문제 풀이
Books
Designing Machine Learning Systems (Chip Huyen): 기초 및 응용 ML 질문 다수 커버
The JAX Scaling Book : 인터뷰 후 발견했으나 우수, 사전에 알았다면 적극 활용했을 자료
Reinforcement Learning (Sutton & Barto): RL 입문자만 권장, 이미 해당 분야 종사자에겐 과함
Courses
ML coding 및 debugging
좋은 자료가 가장 적고 실제 경험이 가장 중요한 영역, 디버깅 인터뷰는 LLM이 그럴듯한 버그 코드를 안정적으로 생성하지 못해 연습이 어려웠음
목표 베이스라인
transformer를 end-to-end로 구현
causal, cross, self attention 구현
flash attention 구현
attention backward pass 구현
MLP forward / backward pass 구현
PyTorch 또는 JAX로 SGD 학습 루프 구현
위 항목을 시간 압박 속에서 직접 구현할 수 있으면 양호한 상태
감정 준비
정서적으로 괜찮다면 이 섹션은 건너뛸 것, 불필요한 불안을 심지 않기 위함
가장 큰 문제는 수면 — 인터뷰 전날 잠을 못 자고, 주당 10회 인터뷰 시 심각한 문제가 됨, 식사도 어려워 메스꺼움 발생
규칙적 운동, 일관된 저녁 루틴, 사회적 고립 회피 권장
인터뷰 전 달리기가 긴장 에너지 해소와 머리 리셋에 도움
인터뷰 전 루틴 유지에서 큰 안정감 확보 — 배경에 생화 두기, 화장이나 스킨케어, 동일한 위안 영상 시청
어느 시점부터 불안이 준비보다 더 발목을 잡았고 인터뷰 중 머릿속이 백지가 되기도 함
자신의 트리거, 실패와의 관계, 자존감의 근거를 시작 전에 성찰하는 편이 유리
핵심 메시지: 인간으로서의 가치는 이 인터뷰들로 결정되지 않음 , 프로세스는 본질적으로 확률적이며 잘 아는 것도 실수할 수 있고 그래도 괜찮음
도움된 책: The Now Habit , The Gifts of Imperfection , Mindset , The Tyranny of Merit
로지스틱 준비
하루에 한개의 인터뷰만 : 인터뷰는 소모적이라 하루 세 번째에는 자연히 성과 저하, 오전 인터뷰 후 나머지 시간은 다음 준비에 활용
관심 낮은 회사부터 시작 : 소규모 스타트업이나 비선호 지역 등으로 프로세스 감각·자신감·연봉 수준을 사전 보정
타이밍 고려 : 회사마다 진행 속도 상이, 오퍼들이 비슷한 시기에 도착하도록 조정해 실질적 레버리지 확보
모든 회사에 다른 프로세스 진행 사실 알리기 : 타임라인이 명확해지고 진행이 빨라지며, 더 진지한 후보로 인식됨
협상
경쟁 오퍼를 숨기라는 일반적 조언과 달리, 여러 회사가 인상 전 다른 오퍼의 증빙을 명시적으로 요구 , 한 곳은 스크린샷의 진위까지 문의
회사는 원하는 후보에게는 수치를 크게 움직일 수 있음 , 항상 물어볼 가치 있음, 대부분 협상에 열려 있었음
마감 기한 은 12주에서 모호한 "합리적 기간"까지 다양, 연장에는 대체로 비유연
리크루터는 후보의 선호를 잘 읽어냄, 회사 언급 빈도·말투 같은 작은 신호도 기록됨
회사는 후보 선택에 대한 과거 데이터 보유 → 동급 경쟁사(OpenAI 등) 오퍼만 실질적 무게를 가지며, 비현실적 비교는 통하지 않음
의사결정 과정
초기에는 불안해 일찍 받은 오퍼를 수락하고 싶은 유혹이 있었으나, 직감을 믿고 더 나은 선택지를 찾아냄
오퍼 선택 기준은 위치, 보상, 명성, 업무 유형 등 개인마다 상이, 팀·문화·보상을 알아가며 선호 순위 변동
양쪽 회사의 거의 모든 사람과 대화했으나 각자 자기 회사를 택하겠다고 답해 큰 도움 안 됨 → 결국 자신을 잘 아는 사람과의 논의 가 가장 유용
다시 한다면 바꿀 점
스프레드시트 유지 : 머릿속 관리는 한계, 회사·진행 단계·마감·연락처를 정리했다면 관심 있던 곳 지원 누락을 방지했을 것
기술뿐 아니라 감정도 준비 : 인터뷰가 연구자로서의 능력과 박사 가치에 대한 최종 판결처럼 느껴지나 비합리적 프레이밍, 시작 전 성찰이나 상담이 도움 되었을 것
무응답 회사에 더 적극적으로 대응 : 지원서에만 의존하지 말고 직접 콜드 이메일로 관심을 표하고 레이더에 들 것
기술 주제 목록
인터뷰 시작 전 작성한 학습 주제 리스트, 본인 배경상 LLM과 RL 질문이 많았고 거의 모든 학습 주제가 한 번 이상 출제됨
Reinforcement Learning : Q-Learning / TD Learning, Bellman Equations, PPO, GRPO, GAE, DPO, Policy Gradient Theorem, On/Off-Policy, MuZero, Dreamer, AlphaGo, Soft Actor-Critic, MDP 등
LLMs : Flash Attention, LoRA, TransformerXL, Griffin, Perceiver, Scaling Laws, Mixture of Experts, RoPE, S4, Tokenisation, RLHF, Causal/Cross Attention 등
Generative Modelling : GANs, VAE 및 ELBO, Score Function, Diffusion Forward/Reverse Process(DDIM/DDPM), Diffusion SDE, Flow Matching ODE, Classifier Free Guidance
Applied ML : Tensor Parallelism, FSDP, DDP, Pipeline Parallelism, Mixed precision training, Gradient checkpointing/accumulation/clipping, JAX·PyTorch·TensorFlow 등
General ML : Curse of dimensionality, CNN, RNN/LSTM, MLE vs MAP, Bias-Variance Tradeoff, Backprop, BatchNorm/LayerNorm/RMSNorm, Adam/AdamW, KL Divergence, Precision/Recall/F1/AUC-ROC 등
Linear Algebra : Positive Semi-Definite, Jacobian, Eigenvectors/Eigenvalues, Hessian, Null/Image space, Rank/Span, Determinant 등
댓글과 토론

머신러닝 취업 면접 - 완벽 가이드

요약

핵심 포인트

댓글