레거시 코드의 신경망 코드 번역: APL에서 C#으로

프로그래밍 언어 간의 자동 번역은 특히 소스 언어가 매우 간결하고 특화되어 있는 경우 여전히 어려운 문제로 남아 있습니다. 본 논문은 대규모 언어 모델 (LLM)을 사용하여 APL을 C#으로 번역하는 연구를 조사합니다. 이 작업은 APL의 희소한 구문 (sparse syntax), 대규모 병렬 코퍼스 (parallel corpora)의 부족, 그리고 APL 프로그램을 해석하기 위한 전문 지식의 필요성 때문에 어렵습니다. 이러한 과제를 해결하기 위해, 우리는 자연어 설명 매개 (natural language description-mediated), 검색 증강 (retrieval-augmented), 그리고 반복적 개선 (iterative refinement)이라는 세 가지 가이드 전략을 베이스라인 직접 번역 모델과 비교함으로써 APL-to-C# 번역을 위한 새로운 프레임워크를 소개합니다. 우리는 다양한 복잡도 수준에 걸쳐 기능적으로 동일한 코드 쌍의 다중 데이터셋을 구축하였으며, 번역 품질을 엄격하게 평가하기 위해 생성된 C# 코드의 구문 컴파일 (syntactic compilation)과 기능적 실행 (functional execution)을 모두 검증하는 자동 평가 파이프라인을 개발했습니다. 우리의 결과는 신경망 코드 번역이 광범위한 프로그램에 대해 APL과 C# 사이의 간극을 성공적으로 메울 수 있으며, 추가적인 문맥과 가이드를 통합하는 것이 모델 성능을 크게 향상시킨다는 것을 입증합니다.

Insights

레거시 코드의 신경망 코드 번역: APL에서 C#으로

요약

핵심 포인트

댓글

모든 메모리가 APC에 들어갈 필요는 없습니다

Knowledge-and-Memory-Management: v0.0.2 — 지식 수집 및 메모리 관리

Corsair 2800X RS-R ARGB Micro-ATX PC 케이스 체험기 – 더 작은 점유 면적, 넓은 내부 공간, 팬 3개 포함

Google Cloud가 진정으로 성장을 이끌고 있는가?

Knowledge-and-Memory-Management: v0.0.2 — 지식 수집 및 메모리 관리

Corsair 2800X RS-R ARGB Micro-ATX PC 케이스 체험기 – 더 작은 점유 면적, 넓은 내부 공간, 팬 3개 포함

Google Cloud가 진정으로 성장을 이끌고 있는가?