엔비디아 '네모트론 3' 오픈 모델 제품군 공개

등록일 2025년12월17일 09시59분 트위터로 보내기

 

엔비디아(CEO 젠슨 황)가 오픈 모델, 데이터, 라이브러리로 구성된 엔비디아 네모트론™ 3(NVIDIA Nemotron™ 3) 제품군을 발표했다. 해당 제품군은 산업 전반에서 투명하고 효율적이며 목적에 맞게 특화된 에이전틱 AI 개발을 지원한다.

 

네모트론 3 모델은 나노(Nano), 슈퍼(Super), 울트라(Ultra) 규모로 제공되며, 혁신적인 하이브리드 잠재 전문가 혼합 방식(mixture-of-experts, MoE) 아키텍처를 도입했다. 이는 개발자가 대규모 환경에서 신뢰할 수 있는 멀티 에이전트 시스템을 구축하고 배포할 수 있도록 돕는다.

 

기업들이 단일 모델 기반 챗봇에서 협업형 멀티 에이전트 AI 시스템으로 전환함에 따라, 개발자들은 통신 과부하, 맥락 이탈, 높은 추론 비용 등 점점 더 많은 과제에 직면하고 있다. 또한 복잡한 워크플로우를 자동화할 모델을 신뢰하기 위해 투명성에 대한 요구도 커지고 있다. 네모트론 3는 이러한 과제를 직접적으로 해결하며, 고객이 전문화된 에이전틱 AI를 구축하는 데 필요한 성능과 개방성을 제공한다.

 

엔비디아 창립자 겸 CEO 젠슨 황(Jensen Huang)은 “오픈 혁신은 AI 발전의 토대이다. 네모트론을 통해 우리는 첨단 AI를 개방형 플랫폼으로 전환해, 개발자들이 대규모 환경에서 에이전틱 시스템을 구축하는 데 필요한 투명성과 효율성을 제공하고 있다”고 말했다.

 

엔비디아 네모트론은 엔비디아의 광범위한 소버린 AI 전략을 지원한다. 유럽부터 한국에 이르는 다양한 조직들이 자체 데이터, 규제, 가치에 부합하는 AI 시스템을 구축할 수 있도록 개방적이고 투명하며 효율적인 모델 채택을 가능하게 한다.

 

네모트론 3의 초기 도입 기업들로는 액센츄어(Accenture), 케이던스(Cadence), 크라우드스트라이크(CrowdStrike), 커서(Cursor), 딜로이트(Deloitte), EY, 오라클 클라우드 인프라스트럭처(Oracle Cloud Infrastructure), 팔란티어(Palantir), 퍼플렉시티(Perplexity), 서비스나우(ServiceNow), 지멘스(Siemens), 시놉시스(Synopsys), 줌(Zoom) 등이 있다. 이들은 제조, 사이버보안, 소프트웨어 개발, 미디어, 커뮤니케이션 등 다양한 산업 전반의 AI 워크플로우를 구현하기 위해 네모트론 제품군의 모델을 통합하고 있다.

 

서비스나우의 회장 겸 CEO인 빌 맥더멋(Bill McDermott)은 “엔비디아와 서비스나우는 수년간 AI의 미래를 함께 만들어왔으며, 최고의 순간은 아직 오지 않았다. 오늘 우리는 모든 산업의 리더들이 에이전틱 AI 전략을 빠르게 추진할 수 있도록 지원하는 데 있어 중요한 진전을 이루고 있다. 서비스나우의 지능형 워크플로우 자동화와 엔비디아 네모트론 3의 결합은 탁월한 효율성, 속도, 정확성을 바탕으로 계속해서 업계 표준을 제시할 것”이라고 말했다.

 

멀티 에이전트 AI 시스템이 확산됨에 따라, 개발자들은 최첨단 추론을 위해 독점 모델에 점점 더 의존하는 한편, 비용 절감을 위해 보다 효율적이고 맞춤화가 가능한 오픈 모델을 함께 활용하고 있다. 단일 워크플로우 내에서 최전선 수준의 모델과 네모트론 간에 작업을 라우팅하면, 에이전트의 지능을 극대화하는 동시에 토크노믹스를 최적화할 수 있다.

 

퍼플렉시티 CEO 아라빈드 스리니바스(Aravind Srinivas)는 “퍼플렉시티는 AI 어시스턴트와 같은 뛰어난 도구에 내장된 정확한 AI가 인간의 호기심을 증폭시킨다는 아이디어를 기반으로 구축됐다. 우리의 에이전트 라우터를 통해 네모트론 3 울트라와 같은 최적화된 오픈 모델로 워크로드를 전달하거나, 고유한 역량이 요구되는 작업에는 선도적인 독점 모델을 활용할 수 있다. 이를 통해 퍼플렉시티의 AI 어시스턴트는 탁월한 속도와 효율성, 확장성을 바탕으로 운영된다”고 말했다.

 

오픈 네모트론 3 모델은 스타트업이 AI 에이전트를 보다 빠르게 개발하고 반복 개선할 수 있도록 지원하며, 프로토타입 단계부터 엔터프라이즈 배포에 이르기까지 혁신을 가속화한다. 제너럴 캐털리스트(General Catalyst), 메이필드(Mayfield), 시에라 벤처스(Sierra Ventures)의 포트폴리오 기업들은 인간과 AI의 협업을 지원하는 AI 팀원을 구축하기 위해 네모트론 3 도입을 검토하고 있다.

 

메이필드의 매니징 파트너인 나빈 차다(Navin Chaddha)는 “엔비디아의 오픈 모델 스택과 엔비디아 인셉션(Inception) 프로그램은 초기 단계 기업에 실험과 차별화, 빠른 확장을 가능하게 하는 모델과 도구, 비용 효율적인 인프라를 제공한다. 네모트론 3는 창업자들이 에이전틱 AI 애플리케이션과 AI 팀원을 구축하는 데 있어 빠른 출발을 가능하게 하고, 엔비디아의 방대한 설치 기반을 활용할 수 있도록 돕는다”고 말했다.

 

네모트론 3, 효율성과 정확성으로 멀티 에이전트 AI 재정의 네모트론 3 MoE 모델 제품군은 세 가지 규모로 구성된다.

 

- 네모트론 3 나노는 300억 개의 파라미터를 갖춘 소형 모델로, 한 번에 최대 30억 개의 파라미터를 활성화해 목적에 맞는 고효율 작업을 수행한다.

- 네모트론 3 슈퍼는 약 1,000억 개의 파라미터와 토큰당 최대 100억 개의 활성 파라미터를 갖춘 고정확도 추론 모델로, 멀티 에이전트 애플리케이션에 적합하다.

- 네모트론 3 울트라는 약 5,000억 개의 파라미터와 토큰당 최대 500억 개의 활성 파라미터를 갖춘 대규모 추론 엔진으로, 복잡한 AI 애플리케이션을 지원한다.

 

현재 제공 중인 네모트론 3 나노는 컴퓨팅 비용 효율성이 가장 뛰어난 모델로, 낮은 추론 비용으로 소프트웨어 디버깅, 콘텐츠 요약, AI 어시스턴트 워크플로우, 정보 검색과 같은 작업에 최적화돼 있다. 이 모델은 고유한 하이브리드 MoE 아키텍처를 활용해 효율성과 확장성 측면에서 향상된 성능을 제공한다.

 

이러한 설계를 통해 네모트론 3 나노는 네모트론 2 나노 대비 최대 4배 높은 토큰 처리량을 달성하며, 추론 토큰 생성량을 최대 60%까지 줄여 추론 비용을 크게 절감한다. 또한 100만 토큰 컨텍스트 윈도우를 지원해 더 많은 정보를 기억할 수 있으며, 장시간에 걸친 다단계 작업에서도 정보 간 연결성을 높여 정확도를 향상시킨다.

 

AI 성능을 벤치마킹하는 독립 평가 기관인 아티피셜 애널리시스(Artificial Analysis)는 네모트론 3 나노를 동일한 규모의 모델 중 가장 개방적이고 효율적이며, 정확도 측면에서도 선도적인 성능을 기록했다고 밝혔다.

 

네모트론 3 슈퍼는 낮은 지연 시간으로 다수의 협업 에이전트가 복잡한 작업을 수행해야 하는 애플리케이션에 강점을 보인다. 네모트론 3 울트라는 심층 연구와 전략적 계획 수립이 요구되는 AI 워크플로우를 위한 고급 추론 엔진 역할을 수행한다.

 

네모트론 3 슈퍼와 울트라는 엔비디아 블랙웰(Blackwell) 아키텍처 기반의 초고효율 4비트 NVFP4 훈련 포맷을 사용해 메모리 요구 사항을 크게 줄이고 훈련 속도를 가속화한다. 이러한 효율성 덕분에 기존 인프라에서도 높은 정밀도 포맷 대비 정확도를 유지한 채 더 대규모 모델 훈련이 가능하다.

 

네모트론 3 모델 제품군을 통해 개발자는 특정 워크로드에 적합한 규모의 오픈 모델을 선택할 수 있다. 또한, 수십 개에서 수백 개의 에이전트로 확장하는 동시에 복잡한 워크플로우에서 더 빠르고 정확한 장기 추론 성능의 이점을 누릴 수 있다.

 

AI 에이전트 맞춤화를 위한 새로운 오픈 도구와 데이터

엔비디아는 전문화된 AI 에이전트를 구축을 위한 훈련 데이터세트와 최첨단 강화학습 라이브러리 컬렉션을 공개했다.

 

총 3조 개의 토큰으로 구성된 새로운 네모트론 사전 훈련, 사후 훈련, 강화학습 데이터세트는 고도화된 추론과 코딩, 다단계 워크플로우 사례를 풍부하게 제공해 높은 역량을 갖춘 도메인 특화 에이전트 구축을 지원한다. 네모트론 에이전틱 세이프티 데이터세트(Nemotron Agentic Safety Dataset)는 실제 환경에서 수집된 원격 측정 데이터를 제공해, 복잡한 에이전트 시스템의 안전성을 평가하고 강화할 수 있도록 돕는다.

 

개발 속도를 높이기 위해 엔비디아는 네모트론 모델의 훈련 환경과 사후 훈련 기반을 제공하는 오픈소스 라이브러리인 네모 짐(NeMo Gym)과 네모 RL을 함께 공개했다. 또한 모델의 안전성과 성능을 검증할 수 있도록 네모 이밸류에이터(Evaluator)도 선보였다. 모든 도구와 데이터세트는 현재 깃허브(GitHub)와 허깅 페이스(Hugging Face)를 통해 제공되고 있다.

 

네모트론 3는 LM 스튜디오(LM Studio), 라마.cpp(llama.cpp), SGLang, vLLM을 통해 지원된다. 이와 함께 프라임 인텔렉트(Prime Intellect)와 언슬로스(Unsloth)는 네모 짐의 즉시 사용 가능한 훈련 환경을 자사 워크플로우에 직접 통합하고 있으며, 이를 통해 강력한 강화학습 훈련 환경에 보다 빠르고 손쉽게 접근할 수 있다.

 

엔비디아 오픈 모델 시작하기

네모트론 3 나노는 현재 허깅 페이스에서 제공되며, 베이스텐(Baseten), 딥인프라(DeepInfra), 파이어웍스(Fireworks), 프렌들리에이아이(FriendliAI), 오픈라우터(OpenRouter), 투게더 AI(Together AI) 등 추론 서비스 제공업체를 통해서도 이용할 수 있다.

 

네모트론은 카우치베이스(Couchbase), 데이터로봇(DataRobot), H2O.ai, 제이프로그(JFrog), 람다(Lambda), 유아이패스(UiPath) 등 엔터프라이즈 AI, 데이터 인프라 플랫폼에서도 제공된다. 퍼블릭 클라우드 고객의 경우, 네모트론 3 나노는 아마존웹서비스(Amazon Web Services, AWS)에서 아마존 베드록(Amazon Bedrock, 서버리스 방식)을 통해 제공될 예정이며, 구글 클라우드(Google Cloud), 코어위브(CoreWeave), 크루소(Crusoe), 마이크로소프트 파운드리(Microsoft Foundry), 네비우스(Nebius), 엔스케일(Nscale), 요타(Yotta)에서도 곧 지원될 예정이다.

 

네모트론 3 나노는 엔비디아 가속 인프라 전반에서 안전하고 확장 가능한 배포를 위해 엔비디아 NIM™ 마이크로서비스 형태로도 제공되며, 이를 통해 최고 수준의 개인정보 보호와 제어 기능을 보장한다.

 

네모트론 3 슈퍼와 네모트론 3 울트라는 2026년 상반기에 제공될 예정이다.

 


관련뉴스 - 관련뉴스가 없습니다.
 

가장 많이 본 뉴스

취재기사 기획/특집 게임정보

화제의동영상