
【AWS SAA 대비】 AI / ML 서비스 (Textract / Comprehend / Transcribe / Rekognition) 정리
요약
AWS SAA 자격증 대비를 위한 주요 AI/ML 서비스의 기능과 데이터 유형별 대응 관계를 정리한 가이드입니다. Textract, Comprehend, Rekognition 등 핵심 서비스의 용도와 실전 시나리오별 서비스 조합 방법을 다룹니다.
핵심 포인트
- 서비스별 대상 데이터 유형(텍스트, 이미지, 음성 등) 암기 필수
- Textract(OCR)와 Comprehend(NLP)의 조합을 통한 문서 분석 파이프라인 이해
- Transcribe(ASR)와 Athena(SQL)를 활용한 음성 데이터 분석 구성
- 실시간 피드백 처리를 위한 서버리스 아키텍처(SQS, Lambda) 활용법
AWS Solutions Architect Associate (SAA) 학습 중에 정리한 AI / ML 서비스 지식을 정리했습니다.
시험에서는 "어떤 서비스가 어떤 데이터 유형을 처리하는가"가 질문됩니다. 서비스 이름과 대상 데이터 유형의 대응 관계를 정확하게 기억해 두는 것이 중요합니다.
본 기사는 개인의 학습 노트를 기반으로 하고 있습니다. 오류가 있다면 댓글로 지적해 주시면 감사하겠습니다.
| 서비스 | 대상 | 용도 |
|---|---|---|
| Textract | 문서 (PDF, 이미지) | OCR, 테이블·폼 추출 |
| Comprehend | 텍스트 | 감성 분석 (Sentiment Analysis), 엔티티 추출 (Entity Extraction), 토픽 분류 |
| Rekognition | 이미지·동영상 | 얼굴 인식, 객체 탐지, 콘텐츠 모더레이션 |
| Transcribe | 음성 | 음성 → 텍스트 변환, 화자 식별 |
| Translate | 텍스트 | 번역 |
| Polly | 텍스트 | 텍스트 → 음성 (TTS) |
| SageMaker | 임의 | 커스텀 ML 모델 (전문 지식 필요) |
| Redshift ML | 테이블 데이터 | SQL로 ML 모델 구축·훈련 |
| 파이프라인 | 구성 |
|---|---|
| 문서 분석 | Textract (OCR) → Comprehend (NLP 분석) → S3 |
| 음성 분석 | Transcribe (음성 → 텍스트) → S3 → Athena (SQL 쿼리) / Comprehend (감성 분석) |
| 실시간 피드백 | API Gateway → SQS → Lambda → Comprehend → DynamoDB (TTL) |
시험에서는 다음과 같은 서비스를 혼동시키는 선택지가 빈번하게 등장합니다.
Rekognition은 이미지 / 동영상 분석 (텍스트의 감성 분석은 Comprehend)
Translate는 번역 (감성 분석은 Comprehend)
Transcribe는 음성 → 텍스트 (텍스트 → 음성은 Polly)
QuickSight는 BI 시각화 (SQL 쿼리 분석은 Athena)
시나리오: PDF 문서에서 텍스트를 추출하고, 그 내용에 대해 감성 분석이나 엔티티 탐지를 수행하고 싶습니다. 어떤 서비스를 조합해야 할까요?
정답: Textract → Comprehend (엔티티 탐지 + 감성 분석) → S3
Textract = OCR (PDF → 텍스트)
Comprehend = NLP (감성 분석, 엔티티, 토픽)
- SageMaker 커스텀 모델은 훈련이 필요하며 운영 부하가 큼
- Rekognition은 이미지 / 동영상 분석 (텍스트의 감성 분석은 불가)
- Athena는 SQL 쿼리 (감성 분석 기능은 없음)
시나리오: 콜센터의 음성 데이터를 텍스트로 변환하고, SQL로 트렌드 분석을 하고 싶습니다. 어떤 서비스를 조합해야 할까요?
정답: Amazon Transcribe + Amazon Athena
Transcribe = ASR (음성 → 텍스트 변환)
Athena = SQL 쿼리 분석
- Kinesis는 음성 파일 읽기에 대응하지 않음
- QuickSight는 시각화 도구 (SQL 쿼리 도구가 아님)
시나리오: 사용자의 피드백을 API로 수집하여 감성 분석을 하고 1년간 보관하고 싶습니다. 스파이크(Spike) 발생 시에도 확장 가능한 구성은 무엇인가요?
정답: API Gateway → SQS → Lambda → Comprehend → DynamoDB (TTL 365일)
Translate는 번역 (감성 분석은 불가)
Transcribe는 음성 → 텍스트 (텍스트 분석은 Comprehend)
- EC2는 서버리스(Serverless)가 아님
AI / ML 서비스 문제는 "어떤 서비스가 어떤 데이터 유형을 처리하는가"를 정확하게 기억해 두면 대응할 수 있습니다. 특히 "PDF → Textract", "텍스트 감성 분석 → Comprehend", "음성 → Transcribe", "이미지 → Rekognition"의 대응 관계는 반사적으로 판단할 수 있도록 해 두시기 바랍니다.
틀린 부분이나 보충할 내용이 있다면 꼭 댓글로 알려주세요.
AI 자동 생성 콘텐츠
본 콘텐츠는 Qiita AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기