{"id":7655,"date":"2023-03-27T08:13:55","date_gmt":"2023-03-27T11:13:55","guid":{"rendered":"https:\/\/revistaempresarios.net\/web\/?p=7655"},"modified":"2023-03-27T08:13:55","modified_gmt":"2023-03-27T11:13:55","slug":"gpus-nvidia-hopper-expandem-alcance-a-medida-que-cresce-a-demanda-por-ia","status":"publish","type":"post","link":"https:\/\/revistaempresarios.net\/web\/2023\/03\/27\/gpus-nvidia-hopper-expandem-alcance-a-medida-que-cresce-a-demanda-por-ia\/","title":{"rendered":"GPUs NVIDIA Hopper expandem alcance \u00e0 medida que cresce a demanda por IA"},"content":{"rendered":"<div class=\"itemBody\">\n<div class=\"itemIntroText\">\n<p>As NVIDIA H100s j\u00e1 est\u00e3o sendo oferecidas pelas gigantes da nuvem para atenderem \u00e0 crescente demanda por infer\u00eancia e treinamento de IA generativa; Meta, OpenAI e Stability AI utilizam a H100 para a pr\u00f3xima onda de IA<\/p>\n<\/div>\n<div class=\"itemFullText\">\n<p>A NVIDIA e seus principais parceiros anunciam a disponibilidade de novos produtos e servi\u00e7os, apresentando a GPU NVIDIA H100 Tensor Core \u2013 a GPU para IA mais potente do mundo \u2013 para atender \u00e0 demanda em r\u00e1pido crescimento por infer\u00eancia e treinamento de IA generativa.<\/p>\n<p>A Oracle Cloud Infrastructure (OCI) anunciou a disponibilidade limitada das novas inst\u00e2ncias de GPU bare-metal OCI Compute, que disp\u00f5em de GPUs H100. Al\u00e9m disso, a Amazon Web Services anunciou seus pr\u00f3ximos UltraClusters EC2 de inst\u00e2ncias P5 da Amazon EC2, que podem receber at\u00e9 20.000 GPUs H100 interconectadas. Isso segue o an\u00fancio da semana passada sobre a pr\u00e9-visualiza\u00e7\u00e3o privada da H100 do Microsoft Azure para sua m\u00e1quina virtual H100, a ND H100 v5.<\/p>\n<p>Al\u00e9m disso, a Meta implantou internamente seu supercomputador para IA Grand Teton, equipado com H100, para suas equipes de pesquisa e produ\u00e7\u00e3o de IA.<\/p>\n<p>Durante sua palestra de abertura no GTC, Jensen Huang, fundador e CEO da NVIDIA, anunciou que os supercomputadores para IA NVIDIA DGX H100 est\u00e3o em plena produ\u00e7\u00e3o e estar\u00e3o dispon\u00edveis em breve para empresas de todo o mundo.<\/p>\n<p>\u201cO incr\u00edvel potencial da IA generativa \u00e9 inspirar praticamente todos os setores para que reinventem suas estrat\u00e9gias de neg\u00f3cios e a tecnologia necess\u00e1ria para alcan\u00e7\u00e1-las\u201d, diz Huang. \u201cA NVIDIA e os nossos parceiros est\u00e3o agindo com rapidez para fornecer a plataforma de computa\u00e7\u00e3o de IA mais potente do mundo para criar essas aplica\u00e7\u00f5es que v\u00e3o transformar radicalmente a forma como vivemos, trabalhamos e nos divertimos.\u201d<\/p>\n<p>A arquitetura Hopper acelera a IA<\/p>\n<p>A H100, baseada na arquitetura de computa\u00e7\u00e3o de GPU NVIDIA Hopper\u2122 com Motores Transformer integrados, \u00e9 otimizada para desenvolvimento, treinamento e implanta\u00e7\u00e3o de IA generativa, grandes modelos de linguagem (LLMs) e sistemas de recomenda\u00e7\u00e3o. Essa tecnologia faz uso da precis\u00e3o FP8 da H100 e oferece treinamento em IA nove vezes mais r\u00e1pido e infer\u00eancia de IA 30 vezes mais veloz em LLMs, em compara\u00e7\u00e3o com a A100 da gera\u00e7\u00e3o anterior. A H100 come\u00e7ou a ser comercializada no final do terceiro trimestre em unidades de placa individuais e selecionadas de fabricantes globais.<\/p>\n<p>A NVIDIA DGX\u2122 H100 apresenta oito GPUs H100 conectadas com interconex\u00f5es de alta velocidade NVIDIA NVLink\u00ae e rede Ethernet integrada NVIDIA Quantum InfiniBand e Spectrum\u2122. Essa plataforma fornece 32 petaflops de desempenho de computa\u00e7\u00e3o com precis\u00e3o FP8, com o dobro da velocidade de rede da gera\u00e7\u00e3o anterior, ajudando a maximizar a efici\u00eancia energ\u00e9tica no processamento de grandes cargas de trabalho de IA.<\/p>\n<p>A DGX H100 tamb\u00e9m apresenta a pilha de software NVIDIA AI completa, permitindo que as empresas executem e gerenciem perfeitamente suas cargas de trabalho de IA em escala. Essa oferta inclui a vers\u00e3o mais recente do NVIDIA AI Enterprise, anunciado separadamente no GTC, al\u00e9m do NVIDIA Base Command\u2122, o sistema operacional do data center DGX, que coordena as opera\u00e7\u00f5es e treinamento de IA na plataforma NVIDIA DGX para simplificar e agilizar o desenvolvimento de IA.<\/p>\n<p>\u201cA NVIDIA vem oferecendo plataformas de computa\u00e7\u00e3o de IA para todos os setores. Com o crescimento da IA generativa e infer\u00eancia, a H100 \u00e9 uma possibilidade para acelerar o fluxo de trabalhos e melhorar o desempenho\u201d, pontua Marcio Aguiar, diretor da divis\u00e3o Enterprise da NVIDIA para Am\u00e9rica Latina.<\/p>\n<p>Pioneiros em IA adotam a H100<\/p>\n<p>V\u00e1rios pioneiros em IA generativa est\u00e3o adotando a H100 para acelerar seus trabalhos:<\/p>\n<p>A OpenAI usava as antecessoras da H100 \u2013 GPUs NVIDIA A100 \u2013 para treinar e executar seu ChatGPT, um sistema de IA otimizado para di\u00e1logo, que tem sido usado por centenas de milh\u00f5es de pessoas em todo o mundo em tempo recorde. A OpenAI vai usar as H100s em seu supercomputador Azure para impulsionar sua pesquisa cont\u00ednua em IA.<br \/>\nA Meta, uma importante parceira de tecnologia da NVIDIA, desenvolveu seu sistema Grand Teton de supercomputadores para IA baseado na Hopper com v\u00e1rias melhorias no desempenho em rela\u00e7\u00e3o ao seu antecessor, Zion, incluindo quatro vezes a largura de banda do host para a GPU, o dobro da largura de banda de rede de dados e computa\u00e7\u00e3o e o dobro da pot\u00eancia. Com maior capacidade de computa\u00e7\u00e3o, o Grand Teton pode suportar a infer\u00eancia de produ\u00e7\u00e3o e de treinamento de avan\u00e7ados modelos de recomenda\u00e7\u00e3o de deep learning e compreens\u00e3o de conte\u00fado.<br \/>\nA Stability AI, uma pioneira em IA generativa de texto para imagem, foi uma das primeiras clientes a ter acesso \u00e0 H100 na AWS. A Stability AI planeja usar a H100 para acelerar seus futuros modelos multimodais, de v\u00eddeo e 3D.<br \/>\nA Twelve Labs, uma plataforma que oferece \u00e0s empresas e aos desenvolvedores acesso \u00e0 compreens\u00e3o de v\u00eddeo multimodal, planeja usar as inst\u00e2ncias da H100 em um Supercluster OCI para a cria\u00e7\u00e3o de v\u00eddeos que podem ser pesquisados de maneira instant\u00e2nea, inteligente e f\u00e1cil.<br \/>\nAnlatan, a criadora da aplica\u00e7\u00e3o NovelAI para cria\u00e7\u00e3o de hist\u00f3rias e s\u00edntese de texto para imagem assistidas por IA, est\u00e1 usando inst\u00e2ncias da H100 na plataforma de nuvem do CoreWeave para infer\u00eancia e cria\u00e7\u00e3o de modelos.<\/p>\n<p><strong>A DGX H100 pelo mundo<\/strong><\/p>\n<p>Empresas inovadoras de todo o mundo est\u00e3o recebendo o primeiro ciclo do sistema DGX H100, entre elas:<\/p>\n<p>A CyberAgent, uma empresa l\u00edder em servi\u00e7os de internet e publicidade digital com sede no Jap\u00e3o, que est\u00e1 criando avatares de digital twins e an\u00fancios digitais produzidos por IA, est\u00e1 usando plenamente tecnologias de LLM e IA generativa.<br \/>\nO Laborat\u00f3rio de F\u00edsica Aplicada da Universidade Johns Hopkins, o maior centro de pesquisa universit\u00e1rio dos Estados Unidos, vai usar a DGX H100 para treinamento de LLMs.<br \/>\nA KTH Royal Institute of Technology, uma importante universidade t\u00e9cnica e de engenharia da Europa com sede em Estocolmo, vai usar a DGX H100 para fornecer programas de ci\u00eancia da computa\u00e7\u00e3o avan\u00e7ados para o ensino superior.<br \/>\nA Mitsui, um dos principais grupos empresariais do Jap\u00e3o, que tem uma ampla variedade de empresas em campos como energia, bem-estar, TI e comunica\u00e7\u00e3o, est\u00e1 construindo o primeiro supercomputador para IA generativa do Jap\u00e3o para a descoberta de medicamentos, equipado com DGX H100.<br \/>\nA Telconet, uma provedora l\u00edder em telecomunica\u00e7\u00f5es no Equador, est\u00e1 criando an\u00e1lises de v\u00eddeo inteligentes para cidades seguras e servi\u00e7os lingu\u00edsticos para oferecer apoio aos clientes em todos os dialetos espanh\u00f3is.<\/p>\n<p><strong>Suporte a ecossistemas<\/strong><\/p>\n<p>Anlatan: Eren Do\u011fan, CEO da Anlatan<\/p>\n<p>\u201cEstamos totalmente focados na inova\u00e7\u00e3o da IA e em produtos que priorizam a IA. As GPUs NVIDIA H100 s\u00e3o aceleradores avan\u00e7ados de machine learning, nos dando uma significativa vantagem competitiva dentro do setor de machine learning para uma ampla variedade de aplica\u00e7\u00f5es, desde o treinamento at\u00e9 infer\u00eancia de modelos.\u201d<\/p>\n<p>AWS: David Brown, vice-presidente da Amazon EC2 da AWS<\/p>\n<p>\u201cA AWS e a NVIDIA v\u00eam colaborando h\u00e1 mais de 12 anos para fornecer solu\u00e7\u00f5es econ\u00f4micas de grande escala baseadas em GPU sob demanda\u201d, conta David Brown, vice-presidente da Amazon EC2 da AWS. \u201cA AWS tem uma experi\u00eancia inigual\u00e1vel no fornecimento de inst\u00e2ncias baseadas em GPU que desafiam os limites da capacidade de expans\u00e3o com cada gera\u00e7\u00e3o sucessiva. Hoje, muitos clientes expandem as cargas de trabalho de treinamento de machine learning para mais de 10.000 GPUs. Com a segunda gera\u00e7\u00e3o de EFA, os clientes podem expandir suas inst\u00e2ncias P5 para mais de 20.000 GPUs H100, o que leva os recursos de supercomputadores sob demanda a qualquer organiza\u00e7\u00e3o.\u201d<\/p>\n<p><strong>Meta: Alexis Bjorlin, vice-presidente de Infraestrutura, Sistemas de IA e Plataformas Aceleradas<\/strong><\/p>\n<p>\u201c\u00c0 medida que criamos novas experi\u00eancias alimentadas por IA \u2013 como aquelas baseadas na IA generativa \u2013 os modelos de IA subjacentes se tornam cada vez mais sofisticados. O mais recente supercomputador para IA Grand Teton da Meta, equipado com H100, proporciona maior computa\u00e7\u00e3o, capacidade de mem\u00f3ria e largura de banda, al\u00e9m de acelerar o treinamento e a infer\u00eancia dos modelos de IA da Meta, como o DLRM de c\u00f3digo aberto. Conforme avan\u00e7amos para a pr\u00f3xima plataforma de computa\u00e7\u00e3o, a H100 tamb\u00e9m fornece maiores recursos de computa\u00e7\u00e3o para pesquisa das futuras necessidades de recomenda\u00e7\u00e3o de conte\u00fado, IA generativa e metaverso da Meta.\u201d<\/p>\n<p>Microsoft: Scott Guthrie, vice-presidente executivo do grupo Cloud + AI da Microsoft<\/p>\n<p>\u201c\u00c0 medida que a ado\u00e7\u00e3o da IA continua a acelerar, a maneira como as empresas operam e alcan\u00e7am sucesso est\u00e1 mudando fundamentalmente. Ao trazermos a arquitetura Hopper da NVIDIA para o Microsoft Azure, somos capazes de oferecer funcionalidade e desempenho de computa\u00e7\u00e3o inigual\u00e1veis para as empresas que buscam expandir seus recursos de IA. A IA est\u00e1 mudando a maneira como as empresas operam e alcan\u00e7am sucesso, conforme sua ado\u00e7\u00e3o continua a acelerar. A arquitetura Hopper da NVIDIA est\u00e1 trazendo funcionalidade, escala e desempenho de computa\u00e7\u00e3o sem precedentes para um n\u00famero cada vez maior de empresas que inovam com o Microsoft Azure.\u201d<\/p>\n<p>OpenAI: Greg Brockman, presidente e cofundador<\/p>\n<p>\u201cA pot\u00eancia computacional da GPU NVIDIA H100 Tensor Core ser\u00e1 essencial para capacitar nossos esfor\u00e7os de ultrapassar as fronteiras da infer\u00eancia e do treinamento da IA. Os avan\u00e7os da NVIDIA liberam nosso trabalho de alinhamento e pesquisa em sistemas como o GPT-4.\u201d<\/p>\n<p>Oracle Cloud Infrastructure: Greg Pavlik, CTO e vice-presidente s\u00eanior<\/p>\n<p>\u201cA OCI est\u00e1 levando os recursos da supercomputa\u00e7\u00e3o para IA em escala a milhares de organiza\u00e7\u00f5es de todos os tamanhos. Nossa forte colabora\u00e7\u00e3o com a NVIDIA est\u00e1 proporcionando um grande valor para os clientes, e estamos empolgados com a pot\u00eancia da H100.\u201d<\/p>\n<p>Stability AI: Emad Mostaque, fundador e CEO da Stability.ai<\/p>\n<p>\u201cComo a principal empresa de modelos de IA generativa de c\u00f3digo aberto do mundo, a Stability AI tem o compromisso de fornecer aos clientes e empresas as melhores ferramentas do mundo para cria\u00e7\u00e3o multimodal\u201d, declara Emad Mostaque, fundador e CEO da Stability AI. \u201cAproveitar o poder da NVIDIA H100 proporciona pot\u00eancia computacional sem precedentes para alimentar a criatividade e os recursos de pesquisa dos n\u00fameros cada vez maiores de profissionais que buscam se beneficiar dos poderes transformadores da IA generativa. Isso vai liberar nossos modelos de v\u00eddeo, 3D, entre outros, que se beneficiam exclusivamente da interconex\u00e3o superior e da avan\u00e7ada arquitetura para exabytes de dados.\u201d<\/p>\n<p><strong>Twelve Labs: Jae Lee, CEO<\/strong><\/p>\n<p>\u201cA Twelve Labs est\u00e1 entusiasmada por utilizar as inst\u00e2ncias de bare-metal da Oracle Cloud Infrastructure Compute, equipadas com GPUs NVIDIA H100, para continuar a liderar os esfor\u00e7os para levar os modelos b\u00e1sicos de v\u00eddeo para o mercado.\u201d<\/p>\n<p>Disponibilidade<\/p>\n<p>Os supercomputadores NVIDIA DGX H100 est\u00e3o em plena produ\u00e7\u00e3o e j\u00e1 podem ser encomendados de parceiros NVIDIA do mundo todo. Os clientes podem experimentar a DGX H100 hoje mesmo com o NVIDIA DGX Cloud. Os pre\u00e7os j\u00e1 est\u00e3o dispon\u00edveis com parceiros NVIDIA DGX de todo o mundo.<\/p>\n<p>A NVIDIA H100 na nuvem j\u00e1 est\u00e1 dispon\u00edvel com o Azure em pr\u00e9-visualiza\u00e7\u00e3o privada, com a Oracle Cloud Infrastructure em disponibilidade limitada e com disponibilidade geral com a Cirrascale e a CoreWeave. A AWS anunciou que a H100 estar\u00e1 dispon\u00edvel nas pr\u00f3ximas semanas com pr\u00e9-visualiza\u00e7\u00e3o limitada. O Google Cloud, juntamente com os parceiros de nuvem Lambda, Paperspace e Vultr, planeja oferecer a H100.<\/p>\n<p>Servidores e sistemas que apresentam as GPUs NVIDIA H100 est\u00e3o dispon\u00edveis com os principais fabricantes de servidores, incluindo Atos, Cisco, Dell Technologies, GIGABYTE, Hewlett Packard Enterprise, Lenovo e Supermicro.<\/p>\n<p>Pre\u00e7os e outros detalhes est\u00e3o dispon\u00edveis diretamente com parceiros NVIDIA.<\/p>\n<p>Assista a Huang falar sobre a arquitetura NVIDIA Hopper em sua palestra de abertura no GTC.<\/p>\n<p><strong>Sobre a NVIDIA<\/strong><\/p>\n<p>Desde sua funda\u00e7\u00e3o em 1993, a NVIDIA (NASDAQ: NVDA) tem sido pioneira em computa\u00e7\u00e3o acelerada. A inven\u00e7\u00e3o da GPU pela empresa em 1999 estimulou o crescimento do mercado de games para PC, redefiniu a computa\u00e7\u00e3o gr\u00e1fica, iniciou a era da IA moderna e tem ajudado na cria\u00e7\u00e3o do metaverso. A NVIDIA agora \u00e9 uma empresa de computa\u00e7\u00e3o full-stack com solu\u00e7\u00f5es em escala de data center que est\u00e3o revolucionando o setor.<\/p>\n<\/div>\n<\/div>\n<div class=\"e-mailit_toolbox circular  size48\">\n<div class=\"e-mailit_btn_EMAILiT\"><\/div>\n<\/div>\n","protected":false},"excerpt":{"rendered":"<p>As NVIDIA H100s j\u00e1 est\u00e3o sendo oferecidas pelas gigantes da nuvem para atenderem \u00e0 crescente demanda por infer\u00eancia e treinamento de IA generativa; Meta, OpenAI e Stability AI utilizam a H100 para a pr\u00f3xima onda de IA A NVIDIA e seus principais parceiros anunciam a disponibilidade de novos produtos e servi\u00e7os, apresentando a GPU NVIDIA [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":7657,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_jetpack_memberships_contains_paid_content":false,"_joinchat":[],"footnotes":""},"categories":[51,60],"tags":[6696],"featured_image_src":{"landsacpe":["https:\/\/revistaempresarios.net\/web\/wp-content\/uploads\/2023\/03\/a565cae77df5c42f21193fd01e669e93_XL-1140x445.jpg",1140,445,true],"list":["https:\/\/revistaempresarios.net\/web\/wp-content\/uploads\/2023\/03\/a565cae77df5c42f21193fd01e669e93_XL-463x348.jpg",463,348,true],"medium":["https:\/\/revistaempresarios.net\/web\/wp-content\/uploads\/2023\/03\/a565cae77df5c42f21193fd01e669e93_XL-300x169.jpg",300,169,true],"full":["https:\/\/revistaempresarios.net\/web\/wp-content\/uploads\/2023\/03\/a565cae77df5c42f21193fd01e669e93_XL.jpg",1220,686,false]},"jetpack_sharing_enabled":true,"jetpack_featured_media_url":"https:\/\/revistaempresarios.net\/web\/wp-content\/uploads\/2023\/03\/a565cae77df5c42f21193fd01e669e93_XL.jpg","jetpack-related-posts":[],"_links":{"self":[{"href":"https:\/\/revistaempresarios.net\/web\/wp-json\/wp\/v2\/posts\/7655"}],"collection":[{"href":"https:\/\/revistaempresarios.net\/web\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/revistaempresarios.net\/web\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/revistaempresarios.net\/web\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/revistaempresarios.net\/web\/wp-json\/wp\/v2\/comments?post=7655"}],"version-history":[{"count":1,"href":"https:\/\/revistaempresarios.net\/web\/wp-json\/wp\/v2\/posts\/7655\/revisions"}],"predecessor-version":[{"id":7658,"href":"https:\/\/revistaempresarios.net\/web\/wp-json\/wp\/v2\/posts\/7655\/revisions\/7658"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/revistaempresarios.net\/web\/wp-json\/wp\/v2\/media\/7657"}],"wp:attachment":[{"href":"https:\/\/revistaempresarios.net\/web\/wp-json\/wp\/v2\/media?parent=7655"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/revistaempresarios.net\/web\/wp-json\/wp\/v2\/categories?post=7655"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/revistaempresarios.net\/web\/wp-json\/wp\/v2\/tags?post=7655"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}