본문으로 건너뛰기

© 2026 Molayo

X릴리즈2026. 05. 09. 15:36

Microsoft just released Phi-Ground-Any on Hugging Face

요약

Microsoft가 Hugging Face에 Phi-Ground-Any라는 4B 파라미터 시각 모델을 출시했습니다. 이 모델은 GUI(Graphical User Interface) 환경에서 grounding 작업을 수행하도록 설계되었으며, ScreenSpot-pro와 UI-Vision 같은 벤치마크에서 최고 수준의 성능(SOTA)을 달성했습니다. 이를 통해 AI 에이전트가 화면 요소를 높은 정확도로 인식하고 클릭할 수 있게 하는 데 기여합니다.

핵심 포인트

  • Microsoft가 Phi-Ground-Any라는 새로운 시각 모델을 공개했다.
  • Phi-Ground-Any는 4B 파라미터 크기의 GUI grounding 전용 모델이다.
  • 이 모델은 AI 에이전트의 화면 요소 인식 및 상호작용 능력을 향상시킨다.
  • ScreenSpot-pro와 UI-Vision 등 주요 벤치마크에서 최고 성능을 입증했다.

Microsoft 는 Hugging Face 에서 Phi-Ground-Any 를 출시했습니다.

GUI grounding 을 위한 4B 파라미터 시각 모델로, ScreenSpot-pro 와 UI-Vision 에서 SOTA 결과를 달성하며 AI 에이전트가 화면 요소를 정확하게 클릭할 수 있게 합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 X @huggingpapers (자동 발견)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0