
【문과 합격자가 정리】 G検定 「머신러닝 알고리즘」 공략|지도 학습 · 비지도 학습의 차이와 대표 수법을 한 번에 이해
요약
G検定(G검정) 합격을 목표로 하는 학습자를 위해 머신러닝 알고리즘의 핵심 개념을 정리한 가이드입니다. 지도 학습, 비지도 학습, 강화 학습의 차이점을 직관적인 비유로 설명하며, 특히 시험에 자주 출제되는 지도 학습 내 회귀와 분류 알고리즘의 특징을 다룹니다.
핵심 포인트
- 머신러닝은 지도 학습, 비지도 학습, 강화 학습의 세 가지 카테고리로 분류할 수 있습니다.
- 지도 학습은 정답 데이터의 유무에 따라 회귀(수치 예측)와 분류(카테고리 예측)로 나뉩니다.
- 선형 회귀와 다중 회귀의 차이, 그리고 리지(Ridge)와 라쏘(Lasso) 회귀의 정규화 방식 차이는 주요 시험 포인트입니다.
- 로지스틱 회귀, 결정 트리, 랜덤 포레스트, SVM, k-NN 등은 분류 문제에서 빈출되는 핵심 알고리즘입니다.
안녕하세요. 2026년 1월 G検定에 합격한, 문과 출신 엔지니어입니다.
G検定 공부를 시작하면 첫 번째 큰 벽이 되는 것이 바로 머신러닝 (Machine Learning) 알고리즘이 아닐까 합니다. "지도 학습 (Supervised Learning)", "비지도 학습 (Unsupervised Learning)", "회귀 (Regression)", "분류 (Classification)", "클러스터링 (Clustering)"]…… 가타카나와 전문 용어가 한꺼번에 몰려와서, 문과인 저는 솔직히 패닉 상태였습니다.
하지만 사실 머신러닝 알고리즘은 3가지 카테고리로 나누어 정리하는 것만으로도 놀라울 정도로 깔끔해집니다. 이 기사에서는 G検定에서 빈출되는 머신러닝 알고리즘을 "문과라도 이해할 수 있는 언어"로 정리해 나가겠습니다.
주의: 이 기사는 JDLA 공식 교재가 아닙니다. 필자 개인의 학습 경험에 기반한 내용입니다. 최신 실라버스(Syllabus)는 JDLA 공식 사이트에서 확인해 주세요.
먼저, 머신러닝은 크게 3가지로 나뉩니다. 이것이 모든 토대입니다.
| 카테고리 | 한마디로 말하면 | 정답 데이터 | G検定 출제 빈도 |
|---|---|---|---|
| 지도 학습 (Supervised Learning) | 「정답이 있는 문제집」으로 배운다 | 있음 | 높음 |
| 비지도 학습 (Unsupervised Learning) | 「정답 없이」 데이터의 구조를 찾는다 | 없음 | 높음 |
| 강화 학습 (Reinforcement Learning) | 「시행착오」를 통해 최적의 행동을 배운다 | 없음 (보상 있음) | 중간 |
저는 이 3가지 분류를 "공부하는 방법"에 비유해서 외웠습니다.
지도 학습 = 선생님이 정답을 알려주는 수업 -
비지도 학습 = 스스로 노트를 정리하며 공통점을 찾는 자습 -
강화 학습 = 게임을 반복해서 플레이하며 하이스코어를 목표로 함
강화 학습에 대해서는 별도의 기사에서 자세히 해설하고 있으므로, 여기서는 지도 학습과 비지도 학습에 집중하겠습니다.
지도 학습은 다시 "회귀 (Regression) (수치를 예측하는 것)"와 "분류 (Classification) (카테고리를 예측하는 것)"로 나뉩니다.
| 알고리즘 | 하는 일 | 친숙한 예 |
|---|---|---|
| 선형 회귀 (Linear Regression) | 데이터에 가장 잘 맞는 직선을 긋는다 | 광고비로부터 매출을 예측 |
| 다중 회귀 분석 (Multiple Regression Analysis) | 여러 요인으로부터 수치를 예측한다 | 면적·역과의 거리·건축 연수로부터 월세를 예측 |
| 리지 회귀 (Ridge Regression) · 라쏘 회귀 (Lasso Regression) | 다중 회귀 + 과적합 (Overfitting)을 방지하는 메커니즘 (정규화 (Regularization)) | 변수가 많을 때의 예측 정밀도 개선 |
G検定 포인트: 선형 회귀와 다중 회귀의 차이(설명 변수가 1개인가 복수인가)는 자주 출제됩니다. 또한, 리지 회귀 (L2 정규화)와 라쏘 회귀 (L1 정규화)의 차이도 빈출됩니다.
| 알고리즘 | 하는 일 | 친숙한 예 |
|---|---|---|
| 로지스틱 회귀 (Logistic Regression) | 확률을 계산하여 2가지 중 하나로 나눈다 | 메일이 스팸인지 아닌지 |
| 결정 트리 (Decision Tree) | 「예/아니오」 질문을 반복하여 분류 | 증상으로부터 병명을 판정 |
| 랜덤 포레스트 (Random Forest) | 수많은 결정 트리로 「다수결」을 한다 | 융자 심사 판정 |
| SVM (Support Vector Machine) | 데이터 사이에 가장 좋은 경계선을 긋는다 | 필기 글자 인식 |
| k-NN (k-최근접 이웃법) | 가까이 있는 데이터의 다수결로 분류 | 영화 장르 추천 |
G検定 포인트: "로지스틱 회귀"는 이름에 "회귀"가 붙어 있지만, 실제로는 분류 알고리즘입니다. 이것은 시험에서 함정 문제로 나오기 쉬우므로 주의가 필요합니다.
비지도 학습은 "클러스터링 (Clustering) (그룹 나누기)"와 "차원 축소 (Dimensionality Reduction) (정보의 압축)"가 중심입니다.
| 알고리즘 | 하는 일 | 친숙한 예 |
|---|---|---|
| k-means 법 | 데이터를 k개의 그룹으로 나눈다 | 고객을 그룹화하여 마케팅 |
| 계층적 클러스터링 (Hierarchical Clustering) | 가까운 데이터부터 차례로 묶어 나간다 | 생물의 계통수와 같은 분류 |
| 알고리즘 | 하는 일 | 친숙한 예 |
|---|---|---|
| 주성분 분석 (PCA) | 많은 특징을 소수의 중요한 것으로 압축 | 100개 항목의 설문조사를 몇 개의 인자로 요약 |
| t-SNE | 고차원 데이터를 2D나 3D로 시각화한다 | 대량 데이터의 경향을 그래프로 확인 |
G検정 포인트: k-means 법에서는 처음에 클러스터 수 k를 스스로 결정해야 한다는 점이 문제로 나옵니다. 또한, 주성분 분석은 「차원 축소」의 대표로서 빈출됩니다.
제가 실제로 모의고사에서 틀렸던 포인트를 공유합니다.
앞서 언급한 대로, 이름에 현혹되지 않도록 합시다. 시그모이드 함수 (Sigmoid Function)로 0~1의 확률로 변환하여 분류하는 수법입니다.
SVM은 두 클래스 사이의 마진 (Margin, 여백)을 최대화하는 경계선을 긋습니다. "서포트 벡터 (Support Vector)"란 경계선에 가장 가까운 데이터 점을 말합니다.
둘 다 「k」가 붙지만, k-means는 비지도 학습 (Unsupervised Learning) (클러스터링 (Clustering)), k-NN은 지도 학습 (Supervised Learning) (분류 (Classification))입니다. 시험에서는 이를 혼동하도록 유도하는 문제가 출제됩니다.
마지막으로, 이 분야의 시험 대비 요령을 정리하겠습니다.
먼저 3가지 분류를 완벽하게: 지도 학습, 비지도 학습, 강화학습 (Reinforcement Learning)의 차이를 자신의 언어로 설명할 수 있도록 할 것
표로 정리하기: 각 알고리즘을 「카테고리 × 태스크 (회귀 (Regression) / 분류 (Classification) / 클러스터링 (Clustering))」 표로 정리하면 머릿속에 넣기 쉽습니다
주변의 사례 생각하기: "이 알고리즘은 일상의 어떤 상황에서 사용할 수 있을까?"라고 생각하면 기억이 정착됩니다
함정 포인트를 의식하기: 로지스틱 회귀 (Logistic Regression), k-means와 k-NN 등 이름이 헷갈리는 것은 중점적으로 복습할 것
G検定 (G-test)의 머신러닝 분야를 더 깊게 공부하고 싶은 분들에게는 다음 리소스를 추천합니다.
- AI 검정 학습 내비 - G検定의 분야별 대책 및 키워드 해설이 정리되어 있습니다
- JDLA 공식 텍스트 (통칭 「백서」) - 머신러닝 장을 반복해서 읽는 것이 기본입니다
- 모의고사 앱 - 알고리즘 분류 문제를 반복해서 풀며 익히세요
이 기사가 G検定의 머신러닝 분야 이해에 조금이라도 도움이 된다면 좋겠습니다. 함께 힘내봅시다!
AI 자동 생성 콘텐츠
본 콘텐츠는 Qiita AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기