【문과 합격자가 정리】 G検定「머신러닝 알고리즘」 공략｜지도 학습 · 비지도 학습의 차이와 대표 수법을 한 번에 이해 - Insights | Molayo

안녕하세요. 2026년 1월 G検定에 합격한, 문과 출신 엔지니어입니다.

G検定 공부를 시작하면 첫 번째 큰 벽이 되는 것이 바로 머신러닝 (Machine Learning) 알고리즘이 아닐까 합니다. "지도 학습 (Supervised Learning)", "비지도 학습 (Unsupervised Learning)", "회귀 (Regression)", "분류 (Classification)", "클러스터링 (Clustering)"]…… 가타카나와 전문 용어가 한꺼번에 몰려와서, 문과인 저는 솔직히 패닉 상태였습니다.

하지만 사실 머신러닝 알고리즘은 3가지 카테고리로 나누어 정리하는 것만으로도 놀라울 정도로 깔끔해집니다. 이 기사에서는 G検定에서 빈출되는 머신러닝 알고리즘을 "문과라도 이해할 수 있는 언어"로 정리해 나가겠습니다.

주의: 이 기사는 JDLA 공식 교재가 아닙니다. 필자 개인의 학습 경험에 기반한 내용입니다. 최신 실라버스(Syllabus)는 JDLA 공식 사이트에서 확인해 주세요.

먼저, 머신러닝은 크게 3가지로 나뉩니다. 이것이 모든 토대입니다.

카테고리	한마디로 말하면	정답 데이터	G検定 출제 빈도
지도 학습 (Supervised Learning)	「정답이 있는 문제집」으로 배운다	있음	높음
비지도 학습 (Unsupervised Learning)	「정답 없이」 데이터의 구조를 찾는다	없음	높음
강화 학습 (Reinforcement Learning)	「시행착오」를 통해 최적의 행동을 배운다	없음 (보상 있음)	중간

저는 이 3가지 분류를 "공부하는 방법"에 비유해서 외웠습니다.

지도 학습 = 선생님이 정답을 알려주는 수업 -
비지도 학습 = 스스로 노트를 정리하며 공통점을 찾는 자습 -
강화 학습 = 게임을 반복해서 플레이하며 하이스코어를 목표로 함

강화 학습에 대해서는 별도의 기사에서 자세히 해설하고 있으므로, 여기서는 지도 학습과 비지도 학습에 집중하겠습니다.

지도 학습은 다시 "회귀 (Regression) (수치를 예측하는 것)"와 "분류 (Classification) (카테고리를 예측하는 것)"로 나뉩니다.

알고리즘	하는 일	친숙한 예
선형 회귀 (Linear Regression)	데이터에 가장 잘 맞는 직선을 긋는다	광고비로부터 매출을 예측
다중 회귀 분석 (Multiple Regression Analysis)	여러 요인으로부터 수치를 예측한다	면적·역과의 거리·건축 연수로부터 월세를 예측
리지 회귀 (Ridge Regression) · 라쏘 회귀 (Lasso Regression)	다중 회귀 + 과적합 (Overfitting)을 방지하는 메커니즘 (정규화 (Regularization))	변수가 많을 때의 예측 정밀도 개선

G検定 포인트: 선형 회귀와 다중 회귀의 차이(설명 변수가 1개인가 복수인가)는 자주 출제됩니다. 또한, 리지 회귀 (L2 정규화)와 라쏘 회귀 (L1 정규화)의 차이도 빈출됩니다.

알고리즘	하는 일	친숙한 예
로지스틱 회귀 (Logistic Regression)	확률을 계산하여 2가지 중 하나로 나눈다	메일이 스팸인지 아닌지
결정 트리 (Decision Tree)	「예/아니오」 질문을 반복하여 분류	증상으로부터 병명을 판정
랜덤 포레스트 (Random Forest)	수많은 결정 트리로 「다수결」을 한다	융자 심사 판정
SVM (Support Vector Machine)	데이터 사이에 가장 좋은 경계선을 긋는다	필기 글자 인식
k-NN (k-최근접 이웃법)	가까이 있는 데이터의 다수결로 분류	영화 장르 추천

G検定 포인트: "로지스틱 회귀"는 이름에 "회귀"가 붙어 있지만, 실제로는 분류 알고리즘입니다. 이것은 시험에서 함정 문제로 나오기 쉬우므로 주의가 필요합니다.

비지도 학습은 "클러스터링 (Clustering) (그룹 나누기)"와 "차원 축소 (Dimensionality Reduction) (정보의 압축)"가 중심입니다.

알고리즘	하는 일	친숙한 예
k-means 법	데이터를 k개의 그룹으로 나눈다	고객을 그룹화하여 마케팅
계층적 클러스터링 (Hierarchical Clustering)	가까운 데이터부터 차례로 묶어 나간다	생물의 계통수와 같은 분류

알고리즘	하는 일	친숙한 예
주성분 분석 (PCA)	많은 특징을 소수의 중요한 것으로 압축	100개 항목의 설문조사를 몇 개의 인자로 요약
t-SNE	고차원 데이터를 2D나 3D로 시각화한다	대량 데이터의 경향을 그래프로 확인

G検정 포인트: k-means 법에서는 처음에 클러스터 수 k를 스스로 결정해야 한다는 점이 문제로 나옵니다. 또한, 주성분 분석은 「차원 축소」의 대표로서 빈출됩니다.

제가 실제로 모의고사에서 틀렸던 포인트를 공유합니다.

앞서 언급한 대로, 이름에 현혹되지 않도록 합시다. 시그모이드 함수 (Sigmoid Function)로 0~1의 확률로 변환하여 분류하는 수법입니다.

SVM은 두 클래스 사이의 마진 (Margin, 여백)을 최대화하는 경계선을 긋습니다. "서포트 벡터 (Support Vector)"란 경계선에 가장 가까운 데이터 점을 말합니다.

둘 다 「k」가 붙지만, k-means는 비지도 학습 (Unsupervised Learning) (클러스터링 (Clustering)), k-NN은 지도 학습 (Supervised Learning) (분류 (Classification))입니다. 시험에서는 이를 혼동하도록 유도하는 문제가 출제됩니다.

마지막으로, 이 분야의 시험 대비 요령을 정리하겠습니다.

먼저 3가지 분류를 완벽하게: 지도 학습, 비지도 학습, 강화학습 (Reinforcement Learning)의 차이를 자신의 언어로 설명할 수 있도록 할 것
표로 정리하기: 각 알고리즘을 「카테고리 × 태스크 (회귀 (Regression) / 분류 (Classification) / 클러스터링 (Clustering))」 표로 정리하면 머릿속에 넣기 쉽습니다
주변의 사례 생각하기: "이 알고리즘은 일상의 어떤 상황에서 사용할 수 있을까?"라고 생각하면 기억이 정착됩니다
함정 포인트를 의식하기: 로지스틱 회귀 (Logistic Regression), k-means와 k-NN 등 이름이 헷갈리는 것은 중점적으로 복습할 것

G検定 (G-test)의 머신러닝 분야를 더 깊게 공부하고 싶은 분들에게는 다음 리소스를 추천합니다.

AI 검정 학습 내비 - G検定의 분야별 대책 및 키워드 해설이 정리되어 있습니다
JDLA 공식 텍스트 (통칭 「백서」) - 머신러닝 장을 반복해서 읽는 것이 기본입니다
모의고사 앱 - 알고리즘 분류 문제를 반복해서 풀며 익히세요

이 기사가 G検定의 머신러닝 분야 이해에 조금이라도 도움이 된다면 좋겠습니다. 함께 힘내봅시다!

【문과 합격자가 정리】 G検定「머신러닝 알고리즘」 공략｜지도 학습 · 비지도 학습의 차이와 대표 수법을 한 번에 이해

요약

핵심 포인트

댓글

【문과 합격자가 정리】 G検定 「머신러닝 알고리즘」 공략｜지도 학습 · 비지도 학습의 차이와 대표 수법을 한 번에 이해

요약

핵심 포인트

댓글

【문과 합격자가 정리】 G検定「머신러닝 알고리즘」 공략｜지도 학습 · 비지도 학습의 차이와 대표 수법을 한 번에 이해