엔비디아, AI와 디지털 생물학 발전을 위한 대규모 언어 모델 클라우드 서비스 출시

등록일 2022년09월21일 15시47분 트위터로 보내기

 

엔비디아(CEO 젠슨 황)가 21일 두 가지 새로운 대규모 언어 모델(LLM) 클라우드 AI 서비스 엔비디아 네모 LLM 서비스(NVIDIA NeMo Large Language Model Service)와 엔비디아 바이오네모 LLM 서비스(NVIDIA BioNeMo LLM Service)를 발표했다. 이 서비스는 개발자가 LLM을 쉽게 적응시키고 콘텐츠 생성, 텍스트 요약, 챗봇, 코드 개발뿐만 아니라 단백질 구조와 생체 분자 특성 예측 등을 위한 맞춤형 AI 애플리케이션을 배포할 수 있도록 지원한다.

 

네모 LLM 서비스를 통해 개발자는 엔비디아 관리 인프라에서 프롬프트 러닝이라는 훈련 방법을 사용하여 사전 훈련된 여러 기초 모델을 신속하게 조정할 수 있다. 엔비디아 바이오네모 서비스는 LLM 사용을 언어 분야를 넘어 과학 애플리케이션으로 확장함으로써 제약, 생명 공학 회사의 약물 발견을 가속화하는 클라우드 API(응용 프로그래밍 인터페이스)다.

 

엔비디아의 창립자 겸 CEO 젠슨 황(Jensen Huang)은 “대규모 언어 모델은 모든 산업을 변화시킬 잠재력을 가지고 있다. 기초 모델을 조정할 수 있는 능력은 수백만 명의 개발자가 LLM의 힘을 활용할 수 있게 함으로써 이제 처음부터 대규모 모델을 구축할 필요 없이 언어 서비스를 만들고 과학적 발견을 강화할 수 있다"라고 말했다.

 

네모 LLM 서비스, 프롬프트 러닝으로 정확도 높이고 배포 가속화

네모 LLM 서비스를 통해 개발자는 자체 훈련 데이터를 사용해 30억 개의 파라미터부터 세계 최대 LLM 중 하나인 메카트론 530B(Megatron 530B)에 이르는 기초 모델을 커스터마이징할 수 있다. 모델을 처음부터 훈련하려면 몇 주에서 몇 개월까지 소요되지만, 이 프로세스에 걸리는 시간은 단 몇 분에서 몇 시간에 불과하다.

 

모델은 p-튜닝이라는 기술을 사용하는 프롬프트 러닝으로 커스터마이징된다. 이를 통해 개발자는 원래 수십억 개의 데이터 포인트로 훈련된 기초 모델을 수백 개의 예제만 사용하여 신속하게 조정할 수 있다. 커스터마이징 프로세스는 작업별 프롬프트 토큰을 생성한 다음 기초 모델과 결합하여 특정 사용 사례에 대해 더 높은 정확도와 관련성 높은 응답을 제공한다.

 

개발자는 동일한 모델을 사용하여 여러 사용 사례에 맞게 커스터마이징하고 다양한 프롬프트 토큰을 생성할 수 있다. 플레이그라운드 기능은 모델을 쉽게 실험하고 상호 작용할 수 있는 코드 없는 옵션을 제공하여 산업별 사용 사례에 대한 LLM의 효율성과 접근성을 더욱 향상시킨다.

 

배포할 준비가 되면 조정된 모델을 클라우드 인스턴스나 온프레미스 시스템, 또는 API를 통해 실행할 수 있다.

 

대규모 모델의 힘을 활용할 수 있게 해주는 바이오네모 LLM 서비스
바이오네모 LLM 서비스에는 화학, 생물학 애플리케이션을 위한 두 가지 새로운 바이오네모 언어 모델이 포함되어 있다. 이는 단백질, DNA, 생화학 데이터에 대한 지원을 제공하여 연구자가 생물학적 서열에서 패턴과 통찰력을 발견하는 데 도움을 준다.

 

바이오네모는 연구원들이 수십억 개의 파라미터를 포함하는 모델을 활용하여 작업 범위를 확장할 수 있도록 한다. 이렇게 더 큰 모델은 단백질 구조와 유전자 간의 진화적 관계에 대한 더 많은 정보를 저장할 수 있으며 치료 애플리케이션을 위한 새로운 생체 분자를 생성할 수도 있다.

 

클라우드 API, 메가트론 530B과 다른 기존 모델에 대한 액세스 제공
기초 모델 조정 외에도, LLM 서비스에는 클라우드 API(Cloud API)를 통해 기존 또는 맞춤 모델을 사용하는 옵션이 포함된다.

 

이를 통해 개발자는 메가트론 530B를 포함하여 사전 훈련된 광범위한 LLM에 액세스할 수 있다. 또한 엔비디아 네모 메가트론(NVIDIA NeMo Megatron) 프레임워크(현재 오픈 베타 버전으로 제공됨)로 생성된 T5와 GPT-3 모델에 대한 액세스를 제공하며 광범위한 애플리케이션과 다국어 서비스 요구 사항을 지원한다.

 

자동차, 컴퓨팅, 교육, 의료, 통신 등 다양한 산업의 선도기업들은 네모 메가트론을 사용하여 중국어, 영어, 한국어, 스웨덴어 등의 언어로 고객 서비스를 혁신하고 있다.

 

이용 정보
네모 LLM과 바이오네모 서비스, 클라우드 API는 다음 달부터 조기 액세스로 제공될 예정이다. 자세한 내용은 지금 신청해서 확인할 수 있다.

 

네모 메가트론 프레임워크의 베타 릴리스는 엔비디아 NGC(NVIDIA NGC)에서 사용할 수 있으며 엔비디아 DGX 파운드리(NVIDIA DGX Foundry), 엔비디아 DGX 슈퍼POD(NVIDIA DGX SuperPOD)와  아마존웹서비스(AWS), 마이크로소프트 애저(Microsoft Azure), 오라클 클라우드 인프라(Oracle Cloud Infrastructure)의 가속화된 클라우드 인스턴스에서 실행하도록 최적화되어 있다.

 

네모 메가트론 프레임워크를 경험해보고 싶은 개발자는 엔비디아 런치패드(NVIDIA LaunchPad) 랩을 무료로 사용해 볼 수 있다.

 

CEO 젠슨 황의 GTC 22 키노트에서 엔비디아 AI로 구동되는 대규모 언어 모델에 대해 자세히 알아볼 수 있다.

 


관련뉴스 - 관련뉴스가 없습니다.

가장 많이 본 뉴스

취재기사 기획/특집 게임정보

화제의동영상