엔비디아가 미국 새너제이에서 열린 세계 최대 AI·가속 컴퓨팅 콘퍼런스인 ‘엔비디아(NVIDIA) GTC 2026’에서 최초의 엔비디아 DGX 스테이션(DGX Station) 시스템을 델 테크놀로지스(Dell Technologies)에 공급했다고 밝혔다. 엔비디아 GB300 슈퍼칩을 탑재한 엔비디아 DGX 스테이션 시스템이 선구적인 AI 개발자들에게 제공되면서, 프런티어급 모델과 에이전트를 활용한 데스크사이드 개발의 새로운 장이 열렸다.
첫 번째 시스템인 델 테크놀로지스의 GB300 탑재 델 프로 맥스(Dell Pro Max)는 3월 6일(현지시간) 팔로알토(Palo Alto)에서 안드레이 카파시(Andrej Karpathy)에게 전달됐다. 카파시는 2015년부터 2017년까지 오픈AI(OpenAI)의 창립 멤버이자 연구 과학자로 활동하며, 컴퓨터 비전, 생성형 모델링, 강화학습 등 딥러닝 초기 핵심 연구에 기여해 초창기 연구 방향 설정을 도왔다.
추가 공급도 진행 중이다. 최근 사례로는 유튜버 겸 개발자, AI 애호가인 매트 버먼(Matt Berman)이 있다. 버먼은 AI 연구를 논문에서 실제 시스템으로 곧바로 구현하는 방식을 실천해 왔으며, 아이디어에서 실험까지의 과정을 단축하고 있다.
DGX 스테이션 GB300은 데이터센터에서 사용되는 엔비디아 GB300 슈퍼칩 아키텍처를 데스크사이드 시스템에 구현한 제품이다. 이 시스템은 748GB의 코히어런트 메모리(coherent memory)를 제공하며, 최대 20페타플롭스의 FP4 성능을 지원한다. 동시에 프런티어 AI 개발을 위해 최대 1조 파라미터 규모의 AI 모델을 사용자 데스크톱에서 바로 실행할 수 있다. DGX 스테이션에서 로컬로 개발된 작업은 동일한 GB300 아키텍처를 통해 클라우드나 데이터센터로 확장할 수 있다.
초기 공급 사례는 장시간 실행되는 자율 에이전트의 AI 개발을 위한 데스크사이드 컴퓨팅의 필요성을 보여준다. 이러한 에이전트는 로컬 도구와 데이터에 접근해 시간에 따라 추론, 계획, 작업을 수행할 수 있다.
이 변화는 피터 슈타인베르거(Peter Steinberger)가 만든 오픈 소스 자율 에이전트 프레임워크인 오픈클로(OpenClaw)를 통해 가시화됐다. 오픈클로는 에이전트가 로컬 파일과 애플리케이션에 접근하고, 코드를 작성하며, 서브 에이전트를 생성하는 한편, 상태를 유지하고, 복잡한 워크플로우를 실행하면서 스스로 작업을 수행할 수 있음을 보여줬다. 이 프로젝트는 깃허브(GitHub)에서 10만 개 이상의 스타(star)를 기록했으며, 첫 주에 200만 명 이상의 방문자를 끌어모았다.
엔비디아는 하드웨어와 더불어, 엔비디아 네모클로(NemoClaw)를 통해 오픈클로에 기여하며 장시간 실행되는 자율 에이전트 발전에 힘쓰고 있다. 이는 단일 명령으로 오픈클로 기반 상시 실행 어시스턴트를 보다 안전하게 구동할 수 있도록 단순화한 오픈 소스 스택이다.
엔비디아 네모클로는 엔비디아 에이전트 툴킷(Agent Toolkit)의 일부로, 엔비디아 오픈쉘(OpenShell) 런타임을 함께 설치한다. 이는 자율 에이전트와 엔비디아 네모트론(Nemotron)과 같은 오픈 소스 모델을 실행하기 위한 안전한 환경을 제공한다.
네모클로와 DGX 스테이션의 결합은 보다 안전하고 자율적이며 장시간 실행 가능한 에이전트를 로컬에서 구축·운영할 수 있는 궁극의 개발자 플랫폼을 제공한다.
더 많은 시스템이 개발자들에게 제공되면서, AI 개발 환경은 새로운 전환점을 맞이하고 있다. 에이전틱 AI는 실험적 프롬프트 단계에서 지속적으로 작동하는 시스템으로 진화하고 있으며, 이러한 작업의 일부를 위해 고성능 컴퓨팅이 다시 데스크 환경으로 돌아오고 있다.
GTC 파크(GTC Park)에서 열리는 엔비디아 ‘빌드 어 클로(build-a-claw)’ 이벤트에서 직접 에이전트를 구축하고, 선제적으로 작동하는 상시 실행 AI 어시스턴트를 맞춤 설정하고 배포할 수 있다.
| |
| |
| |
| |
|
| 관련뉴스 | - 관련뉴스가 없습니다. |