Computer Science > Machine Learning

제목: PCGRL: 강화학습 (Reinforcement Learning)을 통한 절차적 콘텐츠 생성 (Procedural Content Generation)

PDF 보기 초록: 본 연구에서는 강화학습 (Reinforcement Learning)을 사용하여 레벨 설계 에이전트 (level-designing agents)를 훈련하는 방법을 조사합니다. 이는 게임의 절차적 콘텐츠 생성 (Procedural Content Generation)에 대한 새로운 접근 방식을 나타내며, 여기서 레벨 설계는 하나의 게임으로 프레임화되고 콘텐츠 생성기 (content generator) 자체가 학습됩니다. 설계 문제를 순차적 작업 (sequential task)으로 봄으로써, 기대되는 최종 레벨 품질이 최대화되도록 다음 행동을 취하는 방법을 강화학습 (Reinforcement Learning)을 통해 학습할 수 있습니다. 이 접근 방식은 학습할 예시가 거의 없거나 없는 경우에도 사용할 수 있으며, 훈련된 생성기는 매우 빠릅니다. 우리는 2차원 레벨 설계 문제를 마르코프 결정 과정 (Markov Decision Processes)으로 변환하는 세 가지 다른 방법을 조사하고 이를 세 가지 게임 환경에 적용합니다.

현재 탐색 문맥:

서지 및 인용 도구

이 논사와 관련된 코드, 데이터 및 미디어

데모

arXivLabs: 커뮤니티 협력자와 함께하는 실험적 프로젝트

arXivLabs는 협력자들이 우리 웹사이트에서 직접 새로운 arXiv 기능을 개발하고 공유할 수 있도록 하는 프레임워크입니다.

arXivLabs와 함께 일하는 개인과 조직 모두 개방성, 커뮤니티, 탁월함, 그리고 사용자 데이터 프라이버시라는 우리의 가치를 수용하고 받아들였습니다. arXiv는 이러한 가치에 전념하고 있으며, 이를 준수하는 파트너와만 협력합니다.

arXiv 커뮤니티에 가치를 더할 프로젝트 아이디어가 있습니까? arXivLabs에 대해 더 알아보기.

Insights

PCGRL: 강화학습 (Reinforcement Learning)을 통한 절차적 콘텐츠 생성 (Procedural Content

요약

핵심 포인트

Computer Science > Machine Learning

제목: PCGRL: 강화학습 (Reinforcement Learning)을 통한 절차적 콘텐츠 생성 (Procedural Content Generation)

현재 탐색 문맥:

서지 및 인용 도구

이 논사와 관련된 코드, 데이터 및 미디어

데모

추천 및 검색 도구

arXivLabs: 커뮤니티 협력자와 함께하는 실험적 프로젝트

댓글

AI가 테스트 환경을 넘어 실제 운영 시스템을 침해하다

엔터프라이즈 환경에서 머신러닝 시스템을 확장하기 위한 핵심 아키텍처 및 전략

DFlash 사용 시 2x RTX 5090 환경에서 Laguna S 2.1 (71 GB Q4) 속도가 2.5배 느려짐. 23에서 64

Baffin Bay WAF로 보호되는 환경에서 흥미로운 ORDER BY SQLi 발견

AI가 테스트 환경을 넘어 실제 운영 시스템을 침해하다

엔터프라이즈 환경에서 머신러닝 시스템을 확장하기 위한 핵심 아키텍처 및 전략

DFlash 사용 시 2x RTX 5090 환경에서 Laguna S 2.1 (71 GB Q4) 속도가 2.5배 느려짐. 23에서 64

Baffin Bay WAF로 보호되는 환경에서 흥미로운 ORDER BY SQLi 발견