AMD는 오늘, 자사의 ‘Advancing AI’ 행사에서 마이크로소프트(Microsoft), 메타(Meta), 오라클(Oracle), 델 테크놀로지스(Dell Technologies), HPE, 레노버(Lenovo), 슈퍼마이크로(Supermicro), 아리스타(Arista), 브로드컴(Broadcom), 시스코(Cisco) 등 주요 파트너사와 함께 클라우드, 기업 및 PC 등 다양한 부문에 고급 AI 솔루션을 제공하기 위한 다양한 협업 사례를 발표했다. 또, AMD 인스팅트 MI300(Instinct™ MI300) 시리즈 데이터 센터 AI 가속기, 대규모 최적화 및 대규모 언어 모델(LLM)을 지원하는 새로운 기능을 갖춘 ROCm™ 6 개방형 소프트웨어 스택, 라이젠 AI(Ryzen™ AI)가 탑재된 라이젠 8040(Ryzen™ 8040) 시리즈 프로세서 등 다양한 신제품도 출시했다.
AMD의 CEO인 리사 수 박사(Dr. Lisa Su)는, "AI는 컴퓨팅의 미래이다. AMD는 대규모 클라우드부터 엔터프라이즈 클러스터, AI 지원 지능형 임베디드 기기 및 PC에 이르기까지 AI 시대를 정의할 엔드투엔드 인프라를 강화할 수 있는 독보적인 위치에 있다"고 강조했다. 또, “우리는 생성형 AI를 위한 세계 최고 성능의 가속기인 인스팅트 MI300 GPU에 대한 수요가 매우 높다고 보고 있다. 현재 최대 규모의 클라우드 기업, 업계 최고의 서버 제공업체, 가장 혁신적인 AI 스타트업과 함께 데이터 센터 AI 솔루션 분야에서 상당한 모멘텀을 구축하고 있으며, 인스팅트 MI300 솔루션을 시장에 빠르게 보급하고자 긴밀히 협력하고 있다. AI 생태계 전반의 혁신 속도가 빨라지고 있다”고 설명했다.
클라우드에서 엔터프라이즈 데이터 센터 및 슈퍼컴퓨터로 확장되는 AI 기술
AMD는 이번 행사 기간 동안 여러 파트너와 함께 AMD 인스팅트 데이터 센터 AI 가속기 채택 사례를 발표하고 성장 모멘텀에 대해 강조했다.
마이크로소프트는 AI 워크로드에 최적화된 새로운 애저 ND MI300x v5 가상머신(Azure ND MI300x v5 Virtual Machine) 시리즈 구동을 위해 AMD 인스팅트 MI300X 가속기를 활용하는 방안에 대해 자세히 설명했다.
메타는 AI 추론 워크로드를 강화하기 위해 ROCm 6과 함께 데이터 센터에 AMD 인스팅트 MI300X 가속기를 추가하고 있으며, AMD가 라마 2(Llama 2) 모델 제품군에 대한 ROCm 6 최적화를 수행한 것에 대해서도 인지하고 있다고 밝혔다.
오라클은 AMD 인스팅트 MI300X 가속기를 갖춘 OCI 베어 메탈 컴퓨팅 솔루션 공급 및 향후 자사 생성형 AI 서비스에 대한 AMD 인스팅트 MI300X 가속기 포함 계획을 발표했다.
다수의 대형 데이터 센터 인프라 제공업체가 자사 제품 포트폴리오 전반에 걸쳐 AMD 인스팅트 MI300 가속기를 탑재할 계획이라고 발표했다. 델은 AMD 인스팅트 MI300X 가속기와 파워엣지 XE9680(PowerEdge XE9680) 서버 솔루션을 통합해 생성형 AI 워크로드에 대한 획기적인 성능을 제공하는 확장 가능한 모듈식 제품을 공급한다. HPE는 엔터프라이즈 및 HPC 제품에 AMD 인스팅트 MI300 가속기를 도입한다는 계획을 발표했다. 레노버는 AMD 인스팅트 MI300X 가속기를 레노버 씽크시스템(Lenovo ThinkSystem) 플랫폼에 도입하여 소매, 제조, 금융 서비스 및 의료를 포함한 산업 전반에 AI 솔루션을 지원할 계획이다. 슈퍼마이크로는 자사의 AI 솔루션 포트폴리오 전반에 걸쳐 AMD 인스팅트 MI300 GPU를 제공할 예정이다. 이 밖에도, 에이수스(Asus), 기가바이트(Gigabyte), 인그라시스(Ingrasys), 인벤텍(Inventec), QCT, 위스트론(Wistron), 위윈(Wiwynn) 등도 AMD 인스팅트 MI300 가속기 기반의 솔루션을 공급할 계획이다.
얼라인드(Aligned), 아르콘 에너지(Arkon Energy), 시라스케일(Cirrascale), 크루소(Crusoe), 덴버 데이터웍스(Denvr Dataworks), 텐서웨이브스(Tensorwaves) 등의 전문 AI 클라우드 사업자 또한 개발자 및 AI 스타트업을 위해 AMD 인스팅트 MI300X GPU에 대한 액세스를 확장하는 제품을 제공할 예정이다.
검증된 개방형 AI 소프트웨어 플랫폼 출시
AMD는 자사의 AMD 인스팅트 데이터 센터 가속기를 지원하는 소프트웨어 생태계 확장에 대해서도 강조했다.
AMD는 생성형 AI, 특히 대규모 언어 모델에 최적화된 AMD 인스팅트 GPU용 오픈 소스 소프트웨어 스택인 ROCm 6의 최신 버전을 공개했다. ROCm 6는 새로운 데이터 유형, 고급 그래프 및 커널 최적화, 최적화된 라이브러리 및 강력한 어텐션 알고리즘을 지원한다. 라마 2 기준 텍스트 생성 전체 대기 시간을 비교하면, ROCm6를 MI300X에서 구동 시 MI250에서 실행되는 ROCm 5 대비 최대 8배 향상된 성능을 제공한다.
최신 모델과 AI 솔루션을 개발하는 스타트업인 데이터브릭스(Databricks), 에센셜 AI(Essential AI), 라미니(Lamini)는 AMD 인스팅트 MI300X 가속기와 개방형 ROCm 6 소프트웨어 스택을 활용하여 고객에게 차별화된 AI 솔루션을 제공하는 방법에 논의했다.
오픈AI(OpenAI)는 트리톤 3.0(Triton 3.0)에 AMD 인스팅트 가속기에 대한 지원을 추가하여 개발자가 AMD 하드웨어에서 더 높은 수준의 추상화 작업을 수행할 수 있도록 지원한다.
AI PC 발전을 선도
AMD는 이번 행사에서 더욱 다양한 AI 컴퓨팅 기능을 제공하는 최신 AMD 라이젠 8040 시리즈 프로세서도 출시했다. 또, 개발자가 사전 훈련된 모델을 사용하여 윈도우 애플리케이션에 손쉽게 AI 기능을 추가하고 배포할 수 있도록 하는 소프트웨어 스택인 라이젠 AI 1.0(Ryzen AI 1.0)을 출시했다. 아울러, AMD는 2024년 출시 예정인 차세대 "스트릭스 포인트(Strix Point)" CPU에 XDNA™ 2 아키텍처가 탑재되어 이전 세대에 대비 3배 이상 향상된 AI 컴퓨팅 성능을 제공하고 새로운 생성형 AI 경험을 지원할 것이라고 밝혔으며, 마이크로소프트와 향후 윈도우 PC의 AI 경험 관련 협력에 대해서도 논의했다.
| |
| |
| |
| |
|
관련뉴스 | - 관련뉴스가 없습니다. |