AI가 RFIC 설계의 “흑마술”을 배우다
요약
AI 기술의 모호한 정의와 'AI'라는 용어가 가진 마케팅적 함의를 비판적으로 고찰합니다. 전통적 기계학습(ML)과 LLM을 구분하여 명확하게 정의할 필요성을 강조하며, 기술적 실체와 대중적 환상 사이의 간극을 다룹니다.
핵심 포인트
- AI라는 용어의 모호함이 기술적 정확성을 저해함
- LLM의 한계를 AI 전체의 한계로 오해하는 경향 경계
- 마케팅적 효과를 위해 SF적 환상을 이용하는 현상 지적
- ML과 LLM을 구분하여 명확한 용어 사용 권장
참된 이론은 어딘가 아름답고 우아해야 한다는 흔한 기대가 앞으로 한 세기를 버틸지 궁금함. 실제 자연 현상이 사실은 기계만 다루고 추론할 수 있는, 끔찍하게 지저분한 방정식 덩어리로 가장 잘 설명된다면 어떨까 싶고, 그건 꽤 슬플 듯
그 “흔한 기대”라는 표현은 좀 지나친 것 같음. 대부분의 사람은 과학 이론을 근사로 이해함. F=ma도 뉴턴 역학 범위 안에서만 맞고, 각 항에도 수많은 단서가 붙어서 실제 측정은 언제나 근사일 뿐임
물리학자들이 “완전한 구형 소”를 가정한다는 농담도 이 맥락이고, 사실 “수학의 비합리적 효과성” 에세이의 핵심도 여기에 가까움. 수학적 근사가 세상을 그렇게 잘 설명한다는 것 자체가 비합리적으로 놀랍다는 이야기임
의학과 인간 몸을 보면서 자주 이런 생각을 함. 우리는 몸이 기적처럼 잘 기름칠된 기계라고 믿고 싶어 하지만, 실제로는 간신히 붙어 있는 엉망인 주머니처럼 보일 때가 많음
요즘 나도 이 생각을 자주 함. 특히 이해하기 어렵지만 기계로 검증 가능한 증명들이 많이 나오고 있다는 점을 보면 더 그렇다
오컴의 면도날은 유용한 휴리스틱이지만, 더 단순한 설명 쪽으로 우리를 편향시키기도 함
오히려 정말 멋질 듯. 가장 낮은 수준에서는 모든 것이 이미 확률 구름이라는 걸 알고 있음. 무엇도 영원히 확정할 수 없다는 데에도 아름다움과 편안함이 있음
“흔한 기대”는 핵심을 놓친 것 같음. 근본 이론이 단순하거나 우아해야 한다는 뜻이 아니라, 더 복잡한 이론과 더 단순한 이론 중 하나를 골라야 한다면 대체로 가장 단순한 이론이 더 정확한 선택이라는 뜻에 가까움. 양자물리 방정식도 꽤 못생겼음
AI 설계의 훌륭한 용도 중 하나는 특허 오염임. AI로 대량의 변형 설계를 만들어 웹사이트에 공개해 두고, 나중에 특허가 나오면 겹치는 부분을 이용해 무효화하거나 최소한 범위를 좁힐 수 있음. 특허의 일반화는 선행기술에 의해 제한되기 때문임
조금 답답함. AI가 많은 일을 할 수는 있지만, LLM과 몬테카를로, 유전 알고리즘, 전문가 시스템, 기타 통계적 마술 같은 전통적 기계학습을 계속 뒤섞으면서, 이미 자리 잡은 도덕적으로 중립적인 기계학습 활동과 LLM·Stable Diffusion에 대한 우려를 너무 공격적으로 한데 묶고 있음
그리고 아마 그게 의도일 수도 있겠다는 생각도 듦
문제는 사람들이 AI가 무엇을 할 수 있다고 말하면서 마치 LLM이 그 일을 할 수 있다는 듯 암시한다는 데 있음. 그래서 순수 LLM이 거의 뭐든 할 수 있는 것처럼 보임. 반대로 LLM이 어떤 일을 기본적으로 잘 못한다는 이유로 AI는 절대 X를 못 할 거라고도 말함. AI라는 말은 너무 모호해져서 쓸모가 줄었음
마법 지팡이를 휘둘러서 AI라는 단어 자체를 없애고 싶음. 실제 의미가 없음. Mario Kart의 상대 캐릭터부터 Stable Diffusion까지 무엇이든 가리킬 수 있음
“AI”는 멋진 SF 함의에 저주받은 용어임. 그래서 마케팅 용어로는 강력함. 많은 사람이 SF 속 AI에 익숙하고, “어떤 매체가 어떤 기술을 예언했다”는 믿음도 Star Trek, 은하수를 여행하는 히치하이커를 위한 안내서, Arthur C. Clarke 같은 X와 인터넷, 휴대폰, VR 같은 Y에 대해 꽤 널리 퍼져 있음
뭔가에서 큰 진전이 있다고 말하고 싶을 때, SF가 인간 성취를 예언한다는 대중과학적 이해에 연결하는 건 노력은 적고 효과는 큰 방식임. 사람들을 흥분시키는 것이 1순위라면 정확하게 전달하려는 게 아님
그래서 전통적 기계학습은 ML, 대규모 언어 모델은 LLM이라고 부르는 연습을 하고 있음. 더 이상 AI라는 말은 되도록 쓰지 않으려 함. 너무 애매함. 게임 AI를 말할 때도, 그 AI가 쓰는 것 같은 알고리즘의 줄임말을 쓰려고 함. 종종 순서도라고 표현하지만 실제 내부가 꼭 순서도인지는 확실하지 않음
AI 겨울 동안 더 성공한 기계학습 분야들이 그 용어와 거리를 뒀던 것처럼, 이제 AI 여름이 되었으니 다시 그 용어를 받아들이는 모습을 보게 될 듯하고, 이미 그러고 있는지도 모름
“인간은 상상조차 못 했다”는 말은 과장처럼 보임. 그래도 기계학습 알고리즘이 무차별 탐색으로 아무도 시도하지 않은 칩 설계에 도달할 수 있고, 그중 일부가 우리에게 유용할 수 있다는 건 충분히 가능해 보임. 컴퓨터가 하기엔 꽤 합리적인 일임
마케팅 헛소리임. 하나는 부정을 증명하는 것과 같아서, 인간이 그것을 상상할 수 없었다는 걸 증명할 수 없음. 둘째로 인간은 이미 꽤 많은 괴상한 것들을 상상해 왔음
무차별 탐색 부스러기가 올라간 기계학습 레이어 케이크 같음
기사에서 얻을 수 있는 한 가지는 이런 발전을 만들기 위해 검증된 칩 설계의 기본 구성 블록을 버려야 했다는 점임. 평범한 코딩에도 같은 얘기가 적용될지 궁금함. AI 코딩의 놀라운 혁신이 실제로는 Rust와 Python에 가로막히고 있는 걸까? AI 도구가 가능한 한 가장 낮은 수준에서 그냥 코딩하게 둬야 할까?
나도 이걸 올리려 했음. 처음 읽었을 때 정말 충격적이었기 때문에 다른 사람들도 즐긴다는 걸 보니 반갑다
근처 다른 댓글에서 실험실에서 자란 설계의 견고성 얘기가 나왔는데, Damn Interesting 글에서 가장 흥미로웠던 부분도 진화한 프로그램이 학습에 사용된 단 하나의 물리적 FPGA와 분리될 수 없었다는 사실이었음. 이번 RFIC 학습 모델은 시뮬레이터를 쓰니, 시뮬레이터가 돌아가는 물리 하드웨어의 특성이 학습에서 충분히 격리되어 서로 다른 하드웨어에서 시뮬레이터를 돌려도 설계들이 비슷하게 동작할지 궁금함
더 명백한 질문은 시뮬레이터에서 진화한 설계가 실제 물리 하드웨어에서도 기대대로 동작할 희망이 있느냐는 것임. 후자에 대한 내 직감은 아니라는 쪽이지만, 여전히 흥미로운 연구로 보이고, FPGA에서 실제로 무슨 일이 벌어졌는지 제대로 이해하는 것이 강화학습을 진짜로 다루는 데 선행 조건일지도 모른다는 생각을 자주 함
이 글을 올려줘서 반갑고, 이 분야와 관련된 다른 즐겨찾기가 있으면 보내주면 좋겠음
너무 특화되고 최적화되어 더 이상 적응할 수 없게 된 종의 예시이기도 함. 또한 POSIWID의 예시이기도 함
가장 큰 질문은 이런 설계가 얼마나 견고한가임
논문에서는 실제 장치 측정값이 예측과 잘 맞는다고 보여주긴 했지만, 본문에서 이를 명시적으로 다룬 부분은 찾지 못했음. 또 제시된 일부 시스템에는 전통적으로 설계된 하위 블록이 포함되어 있어서 그쪽이 일부 역할을 떠맡고 있을 수도 있음
어쩌면 내 일자리를 노리는 것 같아 괜히 삐딱하게 보는 걸 수도 있고, 어쩌면 우리가 그렇게 생각하길 바라는 걸 수도 있음
실제로 이기는 건 제조·환경 변동과 모델 한계에도 버틸 수 있는 단순한 아이디어라고 봄. 피드백이나 대칭성 같은 것들임. 그런데 여기서 보여주는 건 그 반대에 가까움. 회로 파라미터를 블라인드 최적화해 본 적이 몇 번 있는데, 결국 “여기에는 대칭이 필요하구나”나 “여기에는 대역폭이 더 필요하구나” 같은 놓쳤던 단순한 아이디어를 깨닫고 나면 완전히 말이 됐음. 그래서 이 구조의 몇 픽셀만 손보면 더 단순한 무언가가 드러나지 않을까 궁금함
그리고 의무적으로 “유전 안테나”도 언급해야 함
바로 이 부분이 이 기사와 과거의 몇몇 비슷한 기사에서 걸리는 점임. 설계에서 AI가 유용하다는 주장에 대한 증거가 들어 있지 않음
본문에 따르면 AI의 역할은 최적화 과정에서 전자기 시뮬레이터를 대체해 구조의 동작을 추정하는 것이고, 이는 시뮬레이션보다 여러 자릿수 빠르다고 함
그럴듯하게 들리지만, 이를 믿으려면 AI 학습에 쓰인 것과 크게 다른 기하 구조에 대해 AI의 추정과 실제 측정 사이의 차이를 보고 싶음. 또 AI 모델의 속도를 정확히 어떤 시뮬레이터와 비교했는지도 봐야 함
전자기장과 전자회로에는 정확도와 속도를 맞바꾸는 여러 시뮬레이션 접근법이 있음. 그래서 AI 추론이 반드시 더 빠른 저정확도 시뮬레이션보다 훨씬 적은 시간을 쓴다고는 확신하지 못하겠음. 그런 시뮬레이션도 AI 추정보다 더 정확하고 신뢰할 만할 수 있음
나도 유전 안테나를 언급하러 왔음
이미 먼저 말했으니, “꽤 단순한 아이디어를 깨닫는다”는 얘기와 관련해 하나 덧붙이면, 이런 컴퓨터 지원 설계의 큰 장점 중 하나는 “innovization”[1]이라고 생각함. 다소 어색한 용어지만, 이런 시스템이 특정 과정에 대한 더 깊은 이해로 이끌어 주는 것이 핵심임. 실제로 겪어 보면 꽤 재미있는 느낌임
[1]: https://dl.acm.org/doi/10.1145/1143997.1144266
그냥 과장된 쓰레기 기사임
이 기사에서 설명한 방법들은 새롭지 않음. 과학자들은 수십 년 전부터 유전 알고리즘으로 아무도 이해하지 못했지만 잘 작동하는 안테나를 설계하고 있었음
그렇게 마법 같은 일은 아님. 기사에서도 말하듯 RFIC 설계는 일반적인 RF 엔지니어링을 훨씬 넘어 설계자의 지식과 경험에 크게 기대는 흑마법에 가깝고, 몇십 년 전이면 슈퍼컴퓨터급이었을 모델링·설계 도구의 도움을 받음
AI가 할 수 있는 일은 가능한 모든 결과를 너비 우선으로 탐색한 뒤 성능이 가장 좋은 것을 고르는 것임. 사람이 “이 경로가 좋아 보이니 더 파보자”라고 하는 방식과 다름
AI 자동 생성 콘텐츠
본 콘텐츠는 GeekNews의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기