본문으로 건너뛰기

© 2026 Molayo

Qiita헤드라인2026. 05. 25. 18:10

AI에 전적으로 의지하여 가계부 앱을 추가 개발하기: OCR 구현 ③

요약

AI를 활용하여 가계부 앱의 OCR 영수증 구조 해석 기능을 개선하는 과정을 다룹니다. 정규표현식을 사용하여 날짜와 합계 금액을 정확히 추출하고, 상품 목록의 불필요한 정보를 정제하는 코드 구현에 집중합니다.

핵심 포인트

  • OCR 결과물에서 날짜 및 합계 금액 추출을 위한 정규표현식 적용
  • 상품명과 금액을 구분하기 위한 데이터 파싱 로직 개선
  • 데이터 정규화를 통한 상품명 및 가격 정보의 정확도 향상
  • 영수증 구조 해석을 위한 메인 처리 로직 구현

지난번에는 가계부 앱의 설계를 진행했습니다 (AI가 했습니다).

지난번에는 OCR 구현을 시도했지만 제대로 동작하지 않았습니다.

이번에도 OCR 구현을 진행하겠습니다.

상품의 명칭, 금액은 읽어오고 있지만 날짜, 합계 금액의 읽기가 되지 않고 있으며, 상품 목록에 불필요한 정보가 많이 포함되어 있습니다.

이를 개선하기 위한 코드를 출력해 주세요.

현재 상태를 보면 OCR 자체는 상당히 성공적입니다.

문제는:

OCR 이후의 영수증 구조 해석

입니다.

필요한 것은:

개선 내용대응
날짜 취득전용 Regex (정규표현식)
...

입니다.

다음 코드로 교체해 주세요.

OCR 해석 메인 처리.

public OcrResult ParseReceipt(string text)
{
OcrResult result = new OcrResult();
...
private void ParseDate(
string line,
OcrResult result)
...

중요.

상품 가격과 구별합니다.

private void ParseTotal(
string line,
OcrResult result)
...

이것이 상당히 중요합니다.

private bool IsProductLine(string line)
{
if (string.IsNullOrWhiteSpace(line))
...
private void ParseItem(
string line,
OcrResult result)
...
private string NormalizeProductName(string text)
{
text =
...
private decimal NormalizePrice(string value)
{
value = value.Replace("o", "0");
...
private decimal FixAmountByProductName(
string productName,
decimal amount)
...
2026년 05월 10일

취득 가능.

2363

취득 가능.

남은 것:

상품명금액
버퍼린 PMDX 퀵 + 40정1958
...
  • 날짜
  • 소계
  • 세액
  • 등록 번호
  • 점포 정보
  • 계산대 번호

등.

실행해 보겠습니다.

다음 회차에는 지출 등록 전반을 개발하겠습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 Qiita AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0