본문으로 건너뛰기

© 2026 Molayo

Qiita헤드라인2026. 05. 20. 08:01

【문과 합격자가 정리】 G検定 「머신러닝 알고리즘」 공략|지도 학습 · 비지도 학습의 차이와 대표 수법을 한 번에 이해

요약

G検定(G검정) 합격을 목표로 하는 학습자를 위해 머신러닝 알고리즘의 핵심 개념을 정리한 가이드입니다. 지도 학습, 비지도 학습, 강화 학습의 차이점을 직관적인 비유로 설명하며, 특히 시험에 자주 출제되는 지도 학습 내 회귀와 분류 알고리즘의 특징을 다룹니다.

핵심 포인트

  • 머신러닝은 지도 학습, 비지도 학습, 강화 학습의 세 가지 카테고리로 분류할 수 있습니다.
  • 지도 학습은 정답 데이터의 유무에 따라 회귀(수치 예측)와 분류(카테고리 예측)로 나뉩니다.
  • 선형 회귀와 다중 회귀의 차이, 그리고 리지(Ridge)와 라쏘(Lasso) 회귀의 정규화 방식 차이는 주요 시험 포인트입니다.
  • 로지스틱 회귀, 결정 트리, 랜덤 포레스트, SVM, k-NN 등은 분류 문제에서 빈출되는 핵심 알고리즘입니다.

안녕하세요. 2026년 1월 G検定에 합격한, 문과 출신 엔지니어입니다.

G検定 공부를 시작하면 첫 번째 큰 벽이 되는 것이 바로 머신러닝 (Machine Learning) 알고리즘이 아닐까 합니다. "지도 학습 (Supervised Learning)", "비지도 학습 (Unsupervised Learning)", "회귀 (Regression)", "분류 (Classification)", "클러스터링 (Clustering)"]…… 가타카나와 전문 용어가 한꺼번에 몰려와서, 문과인 저는 솔직히 패닉 상태였습니다.

하지만 사실 머신러닝 알고리즘은 3가지 카테고리로 나누어 정리하는 것만으로도 놀라울 정도로 깔끔해집니다. 이 기사에서는 G検定에서 빈출되는 머신러닝 알고리즘을 "문과라도 이해할 수 있는 언어"로 정리해 나가겠습니다.

주의: 이 기사는 JDLA 공식 교재가 아닙니다. 필자 개인의 학습 경험에 기반한 내용입니다. 최신 실라버스(Syllabus)는 JDLA 공식 사이트에서 확인해 주세요.

먼저, 머신러닝은 크게 3가지로 나뉩니다. 이것이 모든 토대입니다.

카테고리한마디로 말하면정답 데이터G検定 출제 빈도
지도 학습 (Supervised Learning)「정답이 있는 문제집」으로 배운다있음높음
비지도 학습 (Unsupervised Learning)「정답 없이」 데이터의 구조를 찾는다없음높음
강화 학습 (Reinforcement Learning)「시행착오」를 통해 최적의 행동을 배운다없음 (보상 있음)중간

저는 이 3가지 분류를 "공부하는 방법"에 비유해서 외웠습니다.

지도 학습 = 선생님이 정답을 알려주는 수업 -
비지도 학습 = 스스로 노트를 정리하며 공통점을 찾는 자습 -
강화 학습 = 게임을 반복해서 플레이하며 하이스코어를 목표로 함

강화 학습에 대해서는 별도의 기사에서 자세히 해설하고 있으므로, 여기서는 지도 학습비지도 학습에 집중하겠습니다.

지도 학습은 다시 "회귀 (Regression) (수치를 예측하는 것)"와 "분류 (Classification) (카테고리를 예측하는 것)"로 나뉩니다.

알고리즘하는 일친숙한 예
선형 회귀 (Linear Regression)데이터에 가장 잘 맞는 직선을 긋는다광고비로부터 매출을 예측
다중 회귀 분석 (Multiple Regression Analysis)여러 요인으로부터 수치를 예측한다면적·역과의 거리·건축 연수로부터 월세를 예측
리지 회귀 (Ridge Regression) · 라쏘 회귀 (Lasso Regression)다중 회귀 + 과적합 (Overfitting)을 방지하는 메커니즘 (정규화 (Regularization))변수가 많을 때의 예측 정밀도 개선

G検定 포인트: 선형 회귀와 다중 회귀의 차이(설명 변수가 1개인가 복수인가)는 자주 출제됩니다. 또한, 리지 회귀 (L2 정규화)와 라쏘 회귀 (L1 정규화)의 차이도 빈출됩니다.

알고리즘하는 일친숙한 예
로지스틱 회귀 (Logistic Regression)확률을 계산하여 2가지 중 하나로 나눈다메일이 스팸인지 아닌지
결정 트리 (Decision Tree)「예/아니오」 질문을 반복하여 분류증상으로부터 병명을 판정
랜덤 포레스트 (Random Forest)수많은 결정 트리로 「다수결」을 한다융자 심사 판정
SVM (Support Vector Machine)데이터 사이에 가장 좋은 경계선을 긋는다필기 글자 인식
k-NN (k-최근접 이웃법)가까이 있는 데이터의 다수결로 분류영화 장르 추천

G検定 포인트: "로지스틱 회귀"는 이름에 "회귀"가 붙어 있지만, 실제로는 분류 알고리즘입니다. 이것은 시험에서 함정 문제로 나오기 쉬우므로 주의가 필요합니다.

비지도 학습은 "클러스터링 (Clustering) (그룹 나누기)"와 "차원 축소 (Dimensionality Reduction) (정보의 압축)"가 중심입니다.

알고리즘하는 일친숙한 예
k-means 법데이터를 k개의 그룹으로 나눈다고객을 그룹화하여 마케팅
계층적 클러스터링 (Hierarchical Clustering)가까운 데이터부터 차례로 묶어 나간다생물의 계통수와 같은 분류
알고리즘하는 일친숙한 예
주성분 분석 (PCA)많은 특징을 소수의 중요한 것으로 압축100개 항목의 설문조사를 몇 개의 인자로 요약
t-SNE고차원 데이터를 2D나 3D로 시각화한다대량 데이터의 경향을 그래프로 확인

G検정 포인트: k-means 법에서는 처음에 클러스터 수 k를 스스로 결정해야 한다는 점이 문제로 나옵니다. 또한, 주성분 분석은 「차원 축소」의 대표로서 빈출됩니다.

제가 실제로 모의고사에서 틀렸던 포인트를 공유합니다.

앞서 언급한 대로, 이름에 현혹되지 않도록 합시다. 시그모이드 함수 (Sigmoid Function)로 0~1의 확률로 변환하여 분류하는 수법입니다.

SVM은 두 클래스 사이의 마진 (Margin, 여백)을 최대화하는 경계선을 긋습니다. "서포트 벡터 (Support Vector)"란 경계선에 가장 가까운 데이터 점을 말합니다.

둘 다 「k」가 붙지만, k-means는 비지도 학습 (Unsupervised Learning) (클러스터링 (Clustering)), k-NN은 지도 학습 (Supervised Learning) (분류 (Classification))입니다. 시험에서는 이를 혼동하도록 유도하는 문제가 출제됩니다.

마지막으로, 이 분야의 시험 대비 요령을 정리하겠습니다.

먼저 3가지 분류를 완벽하게: 지도 학습, 비지도 학습, 강화학습 (Reinforcement Learning)의 차이를 자신의 언어로 설명할 수 있도록 할 것
표로 정리하기: 각 알고리즘을 「카테고리 × 태스크 (회귀 (Regression) / 분류 (Classification) / 클러스터링 (Clustering))」 표로 정리하면 머릿속에 넣기 쉽습니다
주변의 사례 생각하기: "이 알고리즘은 일상의 어떤 상황에서 사용할 수 있을까?"라고 생각하면 기억이 정착됩니다
함정 포인트를 의식하기: 로지스틱 회귀 (Logistic Regression), k-means와 k-NN 등 이름이 헷갈리는 것은 중점적으로 복습할 것

G検定 (G-test)의 머신러닝 분야를 더 깊게 공부하고 싶은 분들에게는 다음 리소스를 추천합니다.

  • AI 검정 학습 내비 - G検定의 분야별 대책 및 키워드 해설이 정리되어 있습니다
  • JDLA 공식 텍스트 (통칭 「백서」) - 머신러닝 장을 반복해서 읽는 것이 기본입니다
  • 모의고사 앱 - 알고리즘 분류 문제를 반복해서 풀며 익히세요

이 기사가 G検定의 머신러닝 분야 이해에 조금이라도 도움이 된다면 좋겠습니다. 함께 힘내봅시다!

AI 자동 생성 콘텐츠

본 콘텐츠는 Qiita AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0