Midnight AI Groove 26-06-17: Midjourney Medical부터 GLM-5.2까지, AI 뉴스 최전선을 파헤치다

SE: 심야의 신스웨이브, 여유로운 비트

DJ 미오:

안녕하세요, 미래와 현실 사이를 그루브하는 Midnight AI Groove. 내비게이터 DJ 미오입니다.

DJ 렌:

그리고 파트너 DJ 렌입니다. 오늘 밤도 AI 업계의 소식들을 가벼운 분위기로, 하지만 내용은 알찬 교육 프로그램처럼 전달해 드리겠습니다.

DJ 미오:

오늘의 중심 테마는 상당히 이색적입니다. 이미지 생성 회사로 알려진 Midjourney가 무려 의료용 스캐너를 발표했다는 소식으로 시작합니다.

DJ 렌:

게다가 단순한 이미지나 연구 구상이 아니라, 실제 데모 기기를 접한 사람까지 있었다는 점이 포인트지.

여기에 더해 이번에는 그 주변에서 논의되었던 AI 연구, 오픈 모델 (Open Model), 추론 최적화 (Inference Optimization), 코딩 에이전트 (Coding Agent), 보안, 그리고 업계 인사까지 상당히 넓은 범위를 한꺼번에 살펴보는 회차입니다.

DJ 미오:

그럼 먼저, 오늘 밤의 톱 스토리.

「Midjourney Medical: scan your organs like you step on a scale」.

“체중계에 올라타듯, 장기를 스캔한다”라는 상당히 인상적인 헤드라인입니다.

DJ 렌:

이번에 일어난 일을 정리하면, Midjourney가 **“Midjourney Scanner”**라고 불리는 의료 영상·의료 스캔 계열 시스템을 공개하고, 나아가 그 technical dive, 즉 기술적인 해설까지 내놓았다는 흐름이야.

DJ 미오:

이 발표가 흥미로웠던 점은 사람들의 반응이 단순히 “대단하다!”뿐만 아니라,

놀람, 호기심, 회의론, 전략적 관점까지 섞여 있었다는 점이죠.

“AI 랩이 의료 하드웨어로 간다고?”라는 영역의 경계 초월 그 자체가 화제가 되었습니다.

DJ 렌:

맞아. Midjourney는 보통 이미지 생성 서비스 회사로 알려져 있으니까, 갑자기 스캐너, 그것도 의료 쪽이라는 것은 상당히 비연속적으로 보여.

그렇기에 단순한 신제품 발표 이상으로 “AI 기업이 지금 어디까지 물리 세계에 발을 들이는가”라는 상징적인 뉴스로 받아들여진 거야.

DJ 미오:

이 부분이 중요하므로, 먼저 **사실 기반 (Fact-based)**으로 정리하겠습니다. 본문에서 명시된 요소는 대략 다음과 같습니다.

Midjourney가 **“Midjourney Scanner”**의 기술적 소개를 공개했다.
그 스캐너는 적어도 소개상으로는
방사선을 사용하지 않음
자석을 사용하지 않음
고속
저비용
이라고 되어 있다.
반면,
물에 잠기는 탱크가 필요함
해상도는 CT나 MRI보다 거침

이라는 제약도 있다.

그리고 실제로 어떤 사람이
손을 데모기에 넣고 테스트했다고 말하고 있어, 개념도뿐만 아니라 실물 프로토타입 같은 것이 존재하고 있었다.

DJ 렌:

즉, “꿈의 만능 스캐너가 탄생했습니다”라는 이야기가 아니라,

명확한 트레이드오프 (Trade-off)를 동반하는 새로운 모달리티 (Modality) 같은 것으로 등장한 셈이네.

DJ 미오:

네. 게다가 이 단계에서는 본문에 있는 정보로 한정하자면,

CT나 MRI를 전부 대체한다는 주장은 하지 않고 있습니다.

오히려 반대로 “해상도는 CT/MRI보다 낮다”라고 적혀 있는 점이 중요합니다.

DJ 렌:

여기서부터는 본문이 보여주는 범위 내에서의 추정이나 기술적 해석이겠네.

우선 “방사선을 사용하지 않으므로” X선 CT 계열은 아닐 것 같아.

그리고 “자석을 사용하지 않으므로” MRI도 아니지.

DJ 미오:

더 큰 힌트는 물에 잠기는 탱크입니다.

이것은 파동 계열, 특히 **음향 이미징 (Acoustic Imaging)**이나 어떤 파동의 전파 (Wave Propagation)를 사용하는 계측을 연상시킵니다.

물은 발신기·인체 조직·수신기 사이의 결합을 좋게 하는 용도로 사용되는 경우가 있어서, 이 점이 상당히 강력한 단서가 되고 있습니다.

DJ 렌:

본문에서도 확정된 것은 아니지만, acoustic imaging이나 wave propagation 같은 문맥이 전면에 나와 있어.

요컨대 빛, 초음파, 전류, 기타 파동을 사용하는 계측은 X선처럼 “거의 직진하는 것을 찍는 것”보다 재구성 문제 (Reconstruction Problem)가 어려운 경우가 많지.

DJ 미오:

맞습니다. John Whitaker의 기술적 코멘트로 소개된 것이,

빛이나 초음파나 전류 등을 사용하는 방식은 X선보다 역문제 (Inverse Problem)가 어렵다는 점입니다.

신호가 단순한 직선 경로로 진행하지 않기 때문에, 내부 구조를 이미지로 복원하는 것이 상당히 복잡해집니다.

DJ렌:

이 '역문제(Inverse Problem)'라는 것은 교육 프로그램으로 한마디로 말하자면,

관측된 신호로부터 원래의 내부 구조를 추정하는 문제입니다.

보이는 결과로부터 보이지 않는 원인을 추리하는 것이죠. 의료 영상에서는 이것이 핵심입니다.

DJ미오:

그리고 이러한 종류의 장치에서는 하드웨어 자체뿐만 아니라,

재구성 알고리즘(Reconstruction Algorithm), 노이즈 제거, 초해상도(Super-resolution), 나아가 해석 지원까지 AI나 기계 학습(Machine Learning)이 큰 역할을 할 수 있습니다.

Midjourney의 브랜드가 '학습된 시각 시스템'과 연결되어 있기 때문에, 사람들이 그곳에 기대감을 투영했다는 맥락도 본문에서 지적되었습니다.

DJ렌:

현재까지의 본문을 읽어보면, 이 장치의 강점은

최고 화질이 아니라 접근성과 운용성 개선에 있을 가능성이 높습니다.

DJ미오:

구체적으로는,

방사선이 없다 -
자기장도 사용하지 않는다 -
빠르다 -
저렴하다

라는 조건입니다. 이게 사실이라면, 의료 현장에서의 용도는 '최고 정밀도의 정밀 검사'라기보다는 오히려 -
스크리닝(Screening) -
트리아지(Triage) -
CT/MRI가 사용하기 어려운 환경에서의 대체 수단 -
반복 촬영이 필요하고 방사선을 피하고 싶은 장면 -
수조 방식에서도 허용되는 특정 부위/특정 워크플로우

같은 곳이 후보가 될 것입니다.

DJ렌:

본문에도 이것은 '모든 면에서 MRI/CT보다 좋다'가 아니라,

고급 지표에서는 뒤처지지만, 비용이나 휴대성, 접근성에서 승리하는 타입의 파괴적 혁신 노선일 수 있다고 되어 있었습니다.

그 부분이 굉장히 현실적인 시각이네요.

DJ미오:

물론 회의적인 시각도 강합니다. 본문에 있는 논점을 정리하자면, 우선 첫째로,

해상도가 CT/MRI보다 낮다.

이는 의료 분야에서 상당히 큰 문제입니다. 이미지 품질은 진단 능력에 직결될 수 있기 때문에 '조금 거칠다'는 것은 가벼운 단점이 아닙니다.

DJ렌:

다음으로, 물 탱크 안에 들어갈 필요가 있다.

이 역시 현장 도입에서는 상당히 큰 제약입니다. 일부 용도라면 허용될 수 있지만, 일상 진료나 일반 소비자에게 확대하기에는 인체공학적으로나 운용상으로 난관이 있습니다.

DJ미오:

그리고 세 번째가 아까의 모달리티(Modality)의 어려움입니다. 파동이 곧게 나가지 않고 복잡하게 산란하며, 경계 조건의 영향도 받습니다. 그런 신호로부터 안정적으로 임상적으로 신뢰할 수 있는 이미지를 재구성할 수 있는지에 대한 문제가 있습니다.

DJ렌:

즉, 화려한 데모가 그대로 임상의 견고함을 의미하는 것은 아니다. 의료 기기는 겉모습이 재미있는 것만으로는 전혀 부족합니다.

DJ미오:

본문에서는 이 뉴스에 대한 반응을 몇 가지 입장에 나누어 설명했습니다. 먼저 지지/낙관파입니다.

DJ렌:

이 계층은 '바로 이런 이상한 것을 하는 창업자가 필요하다'고 봅니다. 채팅 UI나 작은 개선이 아니라, 비연속적이고 비합의적인 발명에 도전하고 있다는 자체를 높이 평가합니다. 'let inventors invent(발명가들이 발명하게 두자)' 같은 분위기죠.

DJ미오:

게다가 실물 장치에 만져본 사람이 있다는 점에서, '논문을 읽었다', 'PV를 봤다'가 아니라 실제로 접할 수 있는 이상한 장치가 거기에 있다는 신체적 감각의 임팩트도 강했습니다.

DJ렌:

다음은 중립/기술 호기심파입니다. 이 입장이 가장 현실에 발을 붙이고 있으며,

'방사선 없음・자석 없음・빠름・저렴하지만, 물 탱크가 필요하고 해상도는 낮다'라는, 말 그대로 장단점의 요약을 냉정하게 바라봅니다.

DJ미오:

더 나아가,

어떤 송수신기 배치를 하는지
기계적으로 움직여 스캔하는지
장래에는 분산된 검출기/에미터(Emitter)를 다수 배치하여 실시간화할 수 있는지

등, 설계 방향성에 대한 호기심이 언급되었습니다.

DJ렌:

그리고 세 번째가 신중파/회의파입니다. 노골적인 적의는 적지만,

해상도 부족
물탱크라는 실용적 제약
역문제의 어려움
'보기 좋은 데모'와 '견고한 임상 성능' 사이의 거리

를 생각하면 쉽게 신뢰하기 어렵다는 것입니다.

DJ미오:

이 뉴스가 주목받은 가장 큰 이유는 장치 자체의 성능보다,

Midjourney가 그곳에 있다는 사실 자체에 있습니다.

DJ렌:

맞습니다. Midjourney는 본래 이미지 생성 회사로 유명합니다.

거기서부터 현실 세계의 센싱(Sensing) 하드웨어 및 의료 장치로 넘어옵니다.

이것은 단순한 사업 다각화가 아니라, AI 기업의 자기 정의가 변하고 있다는 징후로 읽을 수 있습니다.

DJ 미오:

본문에서도 "모델 벤더(Model Vendor)"가 아니라,

물리 세계를 향한 새로운 인터페이스를 만드는 회사로서 AI 인접 기업들이 자신을 재정의하기 시작했다는, 2025년 이후의 흐름으로 위치 지어져 있었습니다.

DJ 렌:

게다가 의료 영상은 단순한 소프트웨어와는 달리,

물리적 계측 (Physical Measurement)
신호 처리 (Signal Processing)
영상 재구성 (Image Reconstruction)
ML(머신러닝) 기반의 해석

이 전부 얽혀 있는 깊은 영역이죠.

AI 회사가 이곳에 진입한다는 건, 상당히 진심인 **풀스택 응용 발명 (Full-stack Applied Invention)**이라고 봐야 해요.

DJ 미오:

다만, 본문이 강조했듯이 중요하지만 아직 불분명한 점이 많습니다.

DJ 렌:

우선 규제와 승인의 경로입니다.

의료 기기로 사용하려면 승인, 검증 시험, 임상 검증 (Clinical Validation)이 필요합니다.
하지만 본문의 범위 내에서는 이것이 연구용인지, 아니면 임상 전개를 진심으로 목표로 하는 것인지는 불분명합니다.

DJ 미오:

다음은 재구성 스택 (Reconstruction Stack)의 내용입니다.

기술적 심층 분석 (Technical Dive)이라고는 하지만, 여기서 인용된 게시물들만으로는 알고리즘의 핵심을 볼 수 없습니다.
제약이 큰 센싱 조건으로부터 어디까지 유용한 영상을 끌어낼 수 있는가, 그 부분이 승부처입니다.

DJ 렌:

나아가 유스케이스 (Use Case)의 특정입니다.

해상도가 CT/MRI보다 낮더라도, 좁은 용도에서 "충분히 유용"하다면 승산이 있을 가능성은 있습니다.
하지만 "어떤 질환"을, "어느 부위"를, "어떤 워크플로우 (Workflow)"를 겨냥하고 있는지는 이 본문에서 명확히 드러나지 않습니다.

DJ 미오:

**폼 팩터 (Form Factor)**도 큰 문제입니다.

수조(Tank) 형태가 시제품이라서 임시로 만든 형태인지, 아니면 이 방식에 본질적으로 필요한 것인지 말이죠.
그 차이에 따라 미래상은 크게 달라집니다.

DJ 렌:

그리고 비용과 처리량 (Throughput)의 현실성입니다.

"빠르다", "싸다"라고 말해도,

실제 촬영 시간
장치 가격
소모품
오퍼레이터 부하
영상 판독 및 후처리 작업

같은 수치가 없으면 비교할 수 없습니다.

DJ 미오:

마지막으로, AI의 역할은 어디에 있는가입니다.

하드웨어 설계인가
역문제 (Inverse Problem)의 해법인가
노이즈 제거(Denoising)나 초해상도(Super-resolution)인가
자동 진단 지원인가
혹은 이들을 통합한 스택 전체인가

이 부분도 향후의 핵심이 되겠네요.

DJ 렌:

본문에서는 Midjourney Scanner 자체뿐만 아니라, 다른 AI 기업과의 비교도 다뤄졌습니다.

어떤 반응에서는 훨씬 더 수수한 웨어러블 카메라 계열의 AI 하드웨어보다, Midjourney가 압도적으로 대담하다는 경쟁적 프레이밍 (Competitive Framing)이 나왔습니다.

DJ 미오:

즉, "타사가 라펠 카메라 같은 것을 만들고 있는 동안, Midjourney는 의료 스캐너를 만들고 있는 것인가"라는 관점이군요.
물론 이것은 감정적이고 과장된 면도 있지만, AI 기업의 야심을 보여주는 방식으로서는 강렬했다는 뜻입니다.

DJ 미오:

Midjourney Medical 이후, 본문은 더 넓은 AI 연구와 에이전트(Agent) 이야기로 넘어갑니다.
먼저 메타적인 이야기로, 중국의 오픈 소스 문헌은 추적할 가치가 높다는 코멘트가 있었죠.

DJ 렌:

"alpha is insanely huge"라는, 요컨대 정보 우위가 매우 크다는 주장이지.
실제로 이번 본문에서도 후반부는 GLM-5.2 이야기가 상당히 비중 있게 다뤄집니다.

DJ 미오:

그전에 연구 관련 소식을 짚어보자면, PapersWithCode의 트렌드 논문으로 VibeThinker-3B가 언급되었습니다.
3B라는 작은 규모의 모델임에도 **검증 가능한 추론 (Verifiable Reasoning)**을 탐구하는 방향성이 주목받았고, DeepSeek V3.2나 GLM-5, Gemini 3 Pro급의 성능대에 진입할 것이라는 이야기가 있었습니다.

DJ 렌:

에이전트 계열에서는 PreAct라는 논문이 흥미롭습니다.
성공한 에이전트 실행을 **재생 가능한 상태 머신 (Reproducible State Machine)**으로 컴파일하여, 동일한 경로라면 매번 LM을 순차적으로 호출할 필요가 없게 만듭니다.
결과적으로 8.5배에서 13배 빠른 재생이 가능하다는 이야기죠.

DJ 미오:

이것은 실무적으로 매우 중요합니다.
에이전트는 "똑똑함"보다 동일한 성공 절차를 저렴하고 안정적으로 재사용할 수 있는가가 가치가 되는 경우가 있습니다.
매번 전체 추론을 수행하면 비용과 지연 시간(Latency)이 너무 크니까요.

DJ 렌:

또 하나는, LLM-as-Environment-Engineer입니다.

실패하면 다음 훈련 환경을 스스로 재구성한다는 발상입니다.

벤치마크는 MAPF-FrozenLake입니다.

에이전트가 환경 설계에 개입한다는, 메타 학습 (Meta-learning)에 가까운 개념입니다.

DJ 렌:

DJ 미오:

실운용 관점에서는, Omar Sar0의

“코딩 에이전트에는 검증기와 견고한 가드레일 (Guardrails)이 필요하며, 맹목적인 자율 루프는 안 된다”

라는 주장도 소개되었습니다.

최근 트렌드로, 무엇이든 자율에 맡기기보다 **제약된 에이전트 실행 (Constrained Agent Execution)**이 더 높게 평가받고 있습니다.

DJ 렌:

David Khourshid의

“AI가 작성한 코드도 읽어야 한다. 읽지 않는 것은 디버깅 부채 (Debug Debt)를 미루는 것뿐이다”

라는 지적도, 상당히 미미해 보이지만 중요하네요.

DJ 미오:

RL (강화학습) 이론 이야기도 있었습니다. John Schulman이,

PPO가 LLM 시대에 재평가되고 있는 이유는, 원 논문에서 예기치 못했던 효과가 작용하고 있기 때문이다

라고 언급했습니다.

DJ 렌:

구체적으로는, 중요도 비율 (Importance Ratio)의 목적 함수 (Objective Function)가,

수치 오차
비동기 학습 (Asynchronous Learning)
Forward Pass의 노이즈

로 인한 편향 (Bias) 보정에 도움이 되고 있다고 합니다.

게다가 클리핑 (Clipping)이 엔트로피 (Entropy)에 미치는 영향도 나중에야 이해가 진전되었다고 하네요.

DJ 미오:

Midnight AI Groove 26-06-17: Midjourney Medical부터 GLM-5.2까지, AI 뉴스 최전선을 파헤치다

요약

핵심 포인트

댓글