【AWS SAA 대비】 AI / ML 서비스 (Textract / Comprehend / Transcribe / Rekognition) 정리

요약

AWS SAA 자격증 대비를 위한 주요 AI/ML 서비스의 기능과 데이터 유형별 대응 관계를 정리한 가이드입니다. Textract, Comprehend, Rekognition 등 핵심 서비스의 용도와 실전 시나리오별 서비스 조합 방법을 다룹니다.

핵심 포인트

서비스별 대상 데이터 유형(텍스트, 이미지, 음성 등) 암기 필수
Textract(OCR)와 Comprehend(NLP)의 조합을 통한 문서 분석 파이프라인 이해
Transcribe(ASR)와 Athena(SQL)를 활용한 음성 데이터 분석 구성
실시간 피드백 처리를 위한 서버리스 아키텍처(SQS, Lambda) 활용법

AWS Solutions Architect Associate (SAA) 학습 중에 정리한 AI / ML 서비스 지식을 정리했습니다.

시험에서는 "어떤 서비스가 어떤 데이터 유형을 처리하는가"가 질문됩니다. 서비스 이름과 대상 데이터 유형의 대응 관계를 정확하게 기억해 두는 것이 중요합니다.

본 기사는 개인의 학습 노트를 기반으로 하고 있습니다. 오류가 있다면 댓글로 지적해 주시면 감사하겠습니다.

서비스	대상	용도
Textract	문서 (PDF, 이미지)	OCR, 테이블·폼 추출
Comprehend	텍스트	감성 분석 (Sentiment Analysis), 엔티티 추출 (Entity Extraction), 토픽 분류
Rekognition	이미지·동영상	얼굴 인식, 객체 탐지, 콘텐츠 모더레이션
Transcribe	음성	음성 → 텍스트 변환, 화자 식별
Translate	텍스트	번역
Polly	텍스트	텍스트 → 음성 (TTS)
SageMaker	임의	커스텀 ML 모델 (전문 지식 필요)
Redshift ML	테이블 데이터	SQL로 ML 모델 구축·훈련

파이프라인	구성
문서 분석	Textract (OCR) → Comprehend (NLP 분석) → S3
음성 분석	Transcribe (음성 → 텍스트) → S3 → Athena (SQL 쿼리) / Comprehend (감성 분석)
실시간 피드백	API Gateway → SQS → Lambda → Comprehend → DynamoDB (TTL)

시험에서는 다음과 같은 서비스를 혼동시키는 선택지가 빈번하게 등장합니다.

Rekognition은 이미지 / 동영상 분석 (텍스트의 감성 분석은 Comprehend)

Translate는 번역 (감성 분석은 Comprehend)

Transcribe는 음성 → 텍스트 (텍스트 → 음성은 Polly)

QuickSight는 BI 시각화 (SQL 쿼리 분석은 Athena)

시나리오: PDF 문서에서 텍스트를 추출하고, 그 내용에 대해 감성 분석이나 엔티티 탐지를 수행하고 싶습니다. 어떤 서비스를 조합해야 할까요?

정답: Textract → Comprehend (엔티티 탐지 + 감성 분석) → S3

Textract = OCR (PDF → 텍스트)
Comprehend = NLP (감성 분석, 엔티티, 토픽)

SageMaker 커스텀 모델은 훈련이 필요하며 운영 부하가 큼
Rekognition은 이미지 / 동영상 분석 (텍스트의 감성 분석은 불가)
Athena는 SQL 쿼리 (감성 분석 기능은 없음)

시나리오: 콜센터의 음성 데이터를 텍스트로 변환하고, SQL로 트렌드 분석을 하고 싶습니다. 어떤 서비스를 조합해야 할까요?

정답: Amazon Transcribe + Amazon Athena

Transcribe = ASR (음성 → 텍스트 변환)
Athena = SQL 쿼리 분석

Kinesis는 음성 파일 읽기에 대응하지 않음
QuickSight는 시각화 도구 (SQL 쿼리 도구가 아님)

시나리오: 사용자의 피드백을 API로 수집하여 감성 분석을 하고 1년간 보관하고 싶습니다. 스파이크(Spike) 발생 시에도 확장 가능한 구성은 무엇인가요?

정답: API Gateway → SQS → Lambda → Comprehend → DynamoDB (TTL 365일)

Translate는 번역 (감성 분석은 불가)
Transcribe는 음성 → 텍스트 (텍스트 분석은 Comprehend)

EC2는 서버리스(Serverless)가 아님

AI / ML 서비스 문제는 "어떤 서비스가 어떤 데이터 유형을 처리하는가"를 정확하게 기억해 두면 대응할 수 있습니다. 특히 "PDF → Textract", "텍스트 감성 분석 → Comprehend", "음성 → Transcribe", "이미지 → Rekognition"의 대응 관계는 반사적으로 판단할 수 있도록 해 두시기 바랍니다.

틀린 부분이나 보충할 내용이 있다면 꼭 댓글로 알려주세요.

AI 자동 생성 콘텐츠

원문 바로가기