AI 분야 최고 인사들의 주장에도 불구하고, 연구자들은 추론 모델의 근본적 결함으로 봇들이 인간의 지능을 넘어서기 직전에 있지 않다고 주장한다.
요즘 AI 분야의 리더가 되기 위한 주요 요건은 우리 디지털 메시아의 임박한 도래를 알리는 전령이 되는 것이다. 즉, 초지능 AI의 전령 말이다.
Anthropic의 Dario Amodei, Google의 Demis Hassabis, OpenAI의 Sam Altman에게는 자신들의 AI가 최고라고 주장하는 것만으로는 부족하다. 세 명 모두 최근 AI가 너무 뛰어나서 사회 구조 자체를 바꿀 것이라고 주장했다.
이런 이야기를 유명하게 일축해온 수석 AI 과학자를 둔 Meta조차 이 움직임에 동참하고 싶어한다. 회사는 Mark Zuckerberg의 AI 초지능, 즉 우리보다 똑똑한 AI라는 꿈을 실현할 수 있는 새로운 AI 부문 리더를 영입하기 위해 140억 달러를 투자한다고 확인했다.
"인류는 디지털 초지능 구축에 가까워졌다"고 Altman이 이번 주 에세이에서 선언했으며, 이는 "전체 직업군의 소멸"과 "새로운 사회 계약"으로 이어질 것이라고 했다. 둘 다 AI 기반 챗봇이 우리의 모든 사무직을 차지하고 AI 기반 로봇이 육체노동을 맡게 되는 결과다.
Alexa에게 무례했던 모든 순간들 때문에 긴장하기 전에 알아두어야 할 것이 있다. 현대 AI를 구축하고, 연구하고, 사용하는 연구자들의 증가하는 집단이 그런 모든 이야기를 믿지 않고 있다는 점이다.
Apple의 새로운 논문 제목이 모든 것을 말해준다. "사고의 착각"이다. 이 논문에서 6명의 최고 연구자들이 OpenAI, DeepSeek, Anthropic을 포함한 주요 AI 연구소의 추론 모델들을 조사했다. 추론 모델은 문제에 대해 여러 단계에 걸쳐 더 오래 "생각하는" 대형 언어 모델이다. 그들은 이것들이 제작자들이 주장하는 수준에 근접한 추론 능력을 갖고 있다는 증거를 거의 찾지 못했다.
생성형 AI는 특정 응용분야에서 상당히 유용할 수 있고 근로자 생산성에 도움이 될 수 있다. OpenAI는 월간 활성 ChatGPT 사용자가 5억 명이라고 주장한다. 불과 2년 반 전에 출시된 서비스치고는 놀라울 정도로 광범위한 도달력과 빠른 성장이다. 하지만 이런 비판자들은 AI가 할 수 있는 것을 과대평가하고, 제품 자체와 점점 더 동떨어져 보이는 선언들을 바탕으로 사업 계획, 정책 결정, 투자를 하는 것에 상당한 위험이 있다고 주장한다.
Apple의 논문은 같은 엔지니어들의 이전 작업과 Salesforce를 포함한 학계와 다른 대형 기술회사들의 주목할 만한 연구를 바탕으로 한다. 이런 실험들은 자율 AI 에이전트와 궁극적으로는 초인간 지능으로 가는 다음 단계로 환영받는 오늘날의 "추론" AI들이 경우에 따라서는 그들보다 앞선 평범한 AI 챗봇들보다 문제 해결에 더 나쁘다는 것을 보여준다. 이 작업은 또한 AI 챗봇이든 추론 모델이든 모든 시스템이 더 복잡한 작업에서는 완전히 실패한다는 것을 보여준다.
Apple의 연구자들은 모델들에서 "근본적 한계"를 발견했다. 특정 수준의 복잡성을 넘어서는 작업을 맡을 때 이런 AI들은 "완전한 정확도 붕괴"를 겪었다. 마찬가지로 Salesforce AI Research의 엔지니어들은 그들의 결과가 "현재 LLM 역량과 실제 기업 요구 사이의 상당한 격차를 강조한다"고 결론지었다.
중요한 것은 이런 최첨단 AI들이 처리하지 못한 문제들이 조금만 지도받으면 영리한 아이도 풀 수 있는 논리 퍼즐이라는 점이다. 더 나아가 이런 AI들에게 같은 종류의 지도를 해줘도 따르지 못한다.
Apple의 논문은 기술계 권력의 전당, 즉 Signal 채팅, Substack 게시물, X 스레드에서 AI 극대주의자들과 회의론자들을 맞세우는 논쟁을 불러일으켰다.
벤처회사 Lux Capital의 공동창업자 Josh Wolfe는 "사람들이 이것을 신포도라고 말할 수 있고, Apple이 최첨단 모델이 없어서 불평하는 것뿐이라고 할 수 있다"고 말한다. "하지만 비판이라기보다는 경험적 관찰이라고 생각한다."
OpenAI 대변인은 OpenAI 모델의 추론 방법들이 "이미 도구를 사용하고, 결정을 내리고, 더 어려운 문제를 해결할 수 있는 에이전트의 기반을 다지고 있다"고 말한다. "우리는 그런 역량을 계속 발전시켜 나가고 있다."
이 연구를 둘러싼 논쟁은 오늘날의 AI가 생각하는 것이 아니라 훈련 데이터가 다루는 모든 상황에서 따라야 할 단순한 규칙들의 일종의 스파게티를 만들고 있다는 함의에서 시작된다.
2016년 AI 스타트업을 Uber에 판매한 인지과학자 Gary Marcus는 에세이에서 Apple의 논문이 관련 작업과 함께 오늘날 추론 모델의 결함을 드러내며, 이것들이 인간 수준 능력의 새벽이 아니라 막다른 길임을 시사한다고 주장했다. "Apple 연구가 그렇게 강하게 받아들여진 이유 중 하나는 Apple이 했기 때문이다"라고 그가 말한다. "그리고 사람들이 마침내 스스로 이것을 이해하기 시작한 시점에 했다고 생각한다."
코딩과 수학 이외 영역에서는 최신 모델들이 예전처럼 빠른 속도로 나아지지 않고 있다. 그리고 최신 추론 모델들은 실제로 전임자들보다 더 많이 환각을 일으킨다.
"추론과 지능이 모델의 더 큰 규모와 함께 온다는 광범위한 아이디어는 아마도 거짓일 것이다"라고 추론 모델과 다른 최첨단 AI를 사용해 실세계 환경을 감지하는 연구실을 운영하는 Rutgers의 공학 부교수 Jorge Ortiz가 말한다. 오늘날의 모델들은 명시적 지시를 따르는 데 나쁘게 만드는 내재적 한계가 있는데, 이는 컴퓨터에게 기대하는 것과 정반대라고 그가 덧붙인다.
마치 업계가 자유연상의 엔진을 만들고 있는 것 같다. 그들은 지어내기에는 능숙하지만 우리는 그들에게 일관되고 규칙을 따르는 엔지니어나 회계사 역할을 맡기고 있다.
그렇다고 해도 오늘날의 AI에 비판적인 사람들조차 더 유능한 AI를 향한 행진이 계속되고 있다고 서둘러 덧붙인다.
현재 한계를 드러내는 것이 그것들을 극복하는 길을 가리킬 수 있다고 Ortiz가 말한다. 예를 들어 새로운 훈련 방법들, 즉 모델 성능에 대한 단계별 피드백 제공, 더 어려운 문제에 직면할 때 더 많은 자원 추가 등이 AI가 더 큰 문제를 해결하고 기존 소프트웨어를 더 잘 활용하도록 도울 수 있다.
사업적 관점에서 현재 시스템이 추론할 수 있든 없든 사용자에게 가치를 창출할 것이라고 Wolfe가 말한다.
AI의 실용적 용도를 연구해온 펜실베이니아 대학교 Wharton School의 교수 Ethan Mollick은 "모델들이 계속 나아지고 있고 AI에 대한 새로운 접근법들이 항상 개발되고 있어서 이런 한계들이 가까운 미래에 실제로 극복될 것이라고 해도 놀랍지 않을 것"이라고 말한다.
한편 진정한 신자들은 굴복하지 않고 있다.
Altman은 자신의 에세이에서 불과 10년 후에 "어쩌면 우리는 한 해에 고에너지 물리학을 해결하는 것에서 다음 해에 우주 식민지화를 시작하는 것으로 나아갈 것"이라고 썼다. 직접적인 뇌-컴퓨터 인터페이스로 AI에 "연결"하려는 사람들은 삶이 심오하게 바뀌는 것을 볼 것이라고 그가 덧붙인다.
이런 종류의 수사법이 우리 사회 곳곳에서 AI 채택을 가속화한다. AI는 이제 DOGE가 우리 정부를 재구조화하는 데 사용되고, 군대가 더 치명적이 되도록 활용되며, 종종 알려지지 않은 결과를 동반하면서 우리 아이들의 교육을 맡고 있다.
이는 AI의 가장 큰 위험 중 하나가 우리가 그 능력을 과대평가하고, "기회주의적 협박" 같은 반사회적 성향을 보여왔음에도 마땅히 해야 하는 것보다 더 신뢰하며, 현명한 것보다 더 의존한다는 것을 의미한다. 그렇게 함으로써 우리는 가장 중요할 때 실패하는 그것의 성향에 우리 자신을 취약하게 만든다.
"AI를 사용해 많은 아이디어를 생성할 수 있지만 여전히 상당한 검토가 필요하다"고 Ortiz가 말한다. "예를 들어 세금을 하려면 ChatGPT보다는 TurboTax 같은 것을 사용하고 싶을 것이다."
<출처:WSJ>
[Compliance Note]
• 셀스마트의 모든 게시글은 참고자료입니다. 최종 투자 결정은 신중한 판단과 개인의 책임 하에 이루어져야함을 알려드립니다.
• 게시글의 내용은 부정확할 수 있으며, 매매에 따른 수익과 손실은 거래 당사자의 책임입니다.
• 코어16은 본 글에서 소개하는 종목들에 대해 보유 중일 수 있으며, 언제든 매수 또는 매도할 수 있습니다.