NVIDIA cria uma onda de 5 trilhões de dólares! O fosso CUDA aprisiona empresas de IA em todo o mundo, ninguém consegue escapar.

No dia 30 de outubro, a capitalização de mercado da Nvidia ultrapassou os 5 trilhões de dólares, tornando-se a única empresa no mundo a atingir este marco. No entanto, além da surpresa, uma grande confusão surgiu: se a indústria de chips de IA é tão lucrativa, por que só a Nvidia está a lucrar? A resposta está na proteção que a Nvidia construiu ao longo de quase 20 anos — CUDA, esta arquitetura de equipamentos de computação unificada que prendeu mais de 4,5 milhões de desenvolvedores em todo o mundo.

Os concorrentes da NVIDIA são todos especialistas de alto nível, por que ninguém consegue superá-los?

Afinal, a NVIDIA tem concorrentes? Sim. Muitos. E todos são especialistas de alto nível. Olhando ao redor, podemos pelo menos contar três “concorrentes” de peso. Por exemplo, a AMD. Ela é uma velha rival da NVIDIA no campo dos semicondutores, com décadas de competição. Em termos de tecnologia e experiência, é definitivamente uma das jogadoras mais qualificadas para competir com a NVIDIA. Por exemplo, a Intel. Ela foi a antiga “rainha dos chips”. Com uma forte capacidade de fabricação e uma grande base de clientes. Por exemplo, o Google. Ele quase possui recursos infinitos e uma das melhores equipes de IA do mundo. Além disso, está desenvolvendo seus próprios chips de IA dedicados.

Você vê, essas três gigantes, qual delas não é reconhecida em todo o mundo? No entanto, isso também tornou a questão mais aguda: na mesa de jogo, claramente todos são especialistas, mas as fichas parecem estar nas mãos de um único jogador. Mas por que isso acontece?

Começando pela resposta, a NVIDIA usou um sistema com um alto “custo de migração” para manter seus clientes firmemente. Você pode dizer que isso se deve aos chips da NVIDIA, que são os mais rápidos e melhores. Mas, na verdade, essa resposta não é suficientemente rigorosa. Imagine a seguinte cena: a CEO da AMD, Lisa Su, entra no escritório da OpenAI e faz uma proposta muito atraente ao CEO Sam Altman. A AMD tem novos chips de GPU que são 30% mais eficientes do que os B200 da NVIDIA e custam metade do preço.

Se você fosse Sam Altman agora, você assinaria esta “ordem” ou não? Deixe-me adivinhar, é muito provável que Sam Altman não assine. Pelo menos, ele ficaria muito, muito hesitante. Por quê? Uma opção mais barata e mais eficiente está à vista, mas isso não o atrai? Porque o preço é apenas uma pequena parte de todo o processo. Nos investimentos em tecnologia comercial, deve-se considerar a partir da estrutura TCO (custo total de propriedade). Isso não inclui apenas o preço mais direto, mas também vários custos indiretos e ocultos.

cárcere invisível com custos de migração de até dezenas de bilhões de dólares

Se a OpenAI realmente trocasse a NVIDIA pela AMD, o que aconteceria? Para ser direto, a principal questão é que os custos de mão de obra, os custos de migração de código, os custos operacionais e os custos de oportunidade aumentariam significativamente. E qualquer uma dessas mudanças poderia determinar diretamente a sobrevivência ou a morte.

Pense bem, se trocar de plataforma, o que acontece com os mil engenheiros de topo? A experiência deles ao longo de mais de dez anos deve ser apagada da noite para o dia e recomeçada? Isso representaria um custo enorme em treinamento. E quanto aos milhões de linhas de código, o que fazer? Não é uma simples questão de “copiar e colar”. É como tentar plantar lichias do sul no norte. Não é só cavar e levar, é necessário fazer uma enorme quantidade de pesquisa e testes, além de gastar muito tempo. A IA é assim, no final, não se pode ter certeza se vai funcionar.

Além disso, durante a troca de plataformas, significa que é necessário operar e manter duas armadilhas completamente diferentes ao mesmo tempo. Os custos envolvidos podem facilmente dobrar. O que é mais preocupante, e o maior risco, é que o custo de oportunidade é muito alto. Na corrida da IA, cada segundo conta. Se a mudança de plataforma resultar em atraso no desenvolvimento ou na publicação do modelo por alguns meses, é muito provável que se passe de líder da indústria para seguidor.

Lista de custos ocultos da transição da OpenAI

Custo de mão de obra: mil engenheiros requalificados, experiência zerada, custo de tempo de vários anos

Migração de código: milhões de linhas de código CUDA precisam ser reescritas, teste e validação consomem tempo e esforço.

Manutenção em duas plataformas: Durante o período de migração, operamos simultaneamente dois sistemas, o que dobra os custos.

Custo de oportunidade: o atraso no progresso de P&D em relação aos concorrentes pode fazer com que um líder se torne um seguidor.

Custo de risco: A falha na migração pode levar à diminuição do desempenho do modelo, e o impacto comercial é difícil de quantificar.

Portanto, após somar todos os custos diretos e indiretos, alcançou-se o resultado de “bloquear o fornecedor”. Em outras palavras, estou atando você firmemente a mim, desde o software até o hardware. A longo prazo, essa é a solução ideal para as empresas de IA, pois não precisarão se preocupar com o hardware durante o período contratual futuro. Agora, olhando novamente para aquele pedido da AMD de “30% mais desempenho, metade do preço”, ainda parece atraente? A resposta é não. Os milhões de dólares economizados em hardware são insignificantes em comparação com os custos de migração que podem chegar a dezenas de bilhões de dólares e os potenciais riscos estratégicos.

Windows da era da inteligência artificial do ecossistema CUDA

Ecossistema CUDA da NVIDIA

(Fonte:X)

Até aqui, você deve ter percebido que o que realmente prende os clientes da NVIDIA não é seu hardware. Mas sim uma “armadilha” invisível e intangível. Essa armadilha é conhecida como “margem de segurança da NVIDIA” e se chama CUDA. CUDA é a sigla para Compute Unified Device Architecture (Arquitetura Unificada de Dispositivos de Cálculo). Em outras palavras, é um conjunto de ferramentas de programação que permite aos programadores utilizarem melhor as GPUs da NVIDIA.

Se dissermos que a GPU da Nvidia é a “máquina” da era da IA, então o CUDA é o “sistema Windows” da era da IA. Pense bem, por que, ao longo de várias décadas, uma tecnologia que pode ser tecnicamente superior e ainda é gratuita, como o Linux, nunca conseguiu desafiar a posição dominante do Windows no mercado de desktops pessoais? A resposta não está no sistema em si, mas sim no ecossistema.

Porque o enorme ecossistema de aplicações no Windows é demasiado poderoso. Desde o Office da Microsoft, passando pela Adobe, até várias aplicações específicas da indústria, tudo está intimamente ligado a esse ecossistema. Imagine uma empresa que precisa de muitos softwares especializados; entre o custo de comprar uma licença do Windows e o custo de re-treinar os funcionários, qual escolha acha que fará? A resposta é, sem dúvida, óbvia.

CUDA, é assim, possui um ecossistema de aplicações imenso. Para muitas empresas e indivíduos, esta é uma opção obrigatória. Há estatísticas que indicam que, até agora, mais de 4,5 milhões de desenvolvedores em todo o mundo estão utilizando o CUDA para desenvolvimento. E em 2020, esse número era de 1,8 milhão. O número de downloads do pacote de ferramentas CUDA chega a centenas de milhares por mês.

20 anos de apostas grandiosas de ninguém acreditar a algo insubstituível

Em 2006, quando o CUDA foi lançado, ninguém se importou, e tanto o Vale do Silício quanto Wall Street não tinham uma visão positiva. Em 2008, devido à crise financeira, o preço das ações da NVIDIA caiu mais de 80%, com uma capitalização de mercado de cerca de 4 bilhões. Até mesmo dentro da NVIDIA, havia divergências sobre o futuro do CUDA. Ao mesmo tempo, o custo de desenvolver o CUDA também foi muito alto. A primeira GPU da NVIDIA a suportar CUDA foi a G80. Para desenvolver este chip, a NVIDIA levou 4 anos, com um custo de até 475 milhões de dólares, representando um terço do orçamento total de pesquisa e desenvolvimento nos 4 anos.

Naquela época, realmente era uma questão de vida ou morte. O que fazer? Huang Renxun teve uma ideia: investir dinheiro. O foco foi investir dinheiro em escolas e instituições de pesquisa. Através de doações e doações de equipamentos, ele fez com que o CUDA entrasse nas universidades, formando primeiro usuários nas áreas de educação e pesquisa. Além disso, estabeleceu vários centros de pesquisa e desenvolvimento CUDA, centros de ensino e lançou cursos de ensino em todo o mundo. Naquela época, o custo de pesquisa e desenvolvimento investido no CUDA era de mais de 500 milhões de dólares por ano.

Apesar de todo o esforço humano, material e financeiro, a CUDA não era bem vista por um longo período. No início de 2013, muitos analistas de investimento acreditavam que, para que as ações da Nvidia subissem, era necessário abandonar a CUDA e retornar ao negócio central de jogos para PC. Alguns até questionaram se o CEO Jensen Huang ainda conseguiria continuar. Agora, olhando para trás, a CUDA da Nvidia foi uma aposta. Além disso, ele apostou certo.

Por que o CUDA passou de ser pouco valorizado a uma grande oportunidade? Porque os graduados que aprenderam CUDA estão entrando em empresas de tecnologia, e os recursos da comunidade e bibliotecas de código do CUDA estão se tornando cada vez mais ricos. Até 2015, já havia 800 universidades ao redor do mundo oferecendo cursos de CUDA. Com o passar do tempo, os cenários de uso do CUDA se expandiram, desde as universidades até áreas como medicina, comércio e muito mais. Quanto à sua relação com o campo da inteligência artificial, pode-se dizer que é pura “coincidência”.

Em 2012, durante uma competição global de reconhecimento de imagem em IA promovida pela Universidade de Stanford, um grupo de três pessoas da Universidade de Toronto apresentou uma rede neural de IA chamada AlexNet, que ganhou o campeonato. Além disso, a precisão foi 41% maior do que a do segundo colocado. Como conseguiram isso? A equipe disse que usou 2 placas NVIDIA GTX 580 GPU, e eles também foram a única equipe na competição a treinar a rede neural usando CUDA.

Naquela época, o Google também notou essa equipe. Eles descobriram que o AlexNet, que usou apenas duas placas de vídeo GPU, obteve resultados quase idênticos aos que o Google treinou com 16000 CPUs. Em pouco tempo, toda a indústria percebeu que as GPUs eram o melhor hardware para suportar a IA. E a NVIDIA, muito provavelmente, se tornaria a chave para o desenvolvimento da IA.

A luta dos concorrentes: AMD de código aberto, Intel segmentada, Google desenvolvendo internamente

Uma vez que se compreende o CUDA, ao olhar para os concorrentes da NVIDIA, percebe-se que cada passo deles é rigidamente limitado pela NVIDIA. Por exemplo, a AMD optou pelo código aberto. Ela desenvolveu uma plataforma de código aberto chamada ROCm, cujo objetivo é substituir o CUDA. No entanto, é como o “Linux da era da IA”, gratuito, de código aberto, com potencial técnico e mais barato. Mas, para os usuários, o custo de migração é muito alto.

Por exemplo, a Intel escolheu segmentar o mercado. A Intel é inteligente, pois admite diretamente que a NVIDIA está muito à frente no mercado de IA de alta gama. Assim, a Intel posiciona sua série de chips Gaudi nos segmentos de inferência empresarial e treinamento de modelos de pequeno e médio porte. Mas isso também significa que a Intel abandonou a parte mais lucrativa do mercado de chips de IA.

Por exemplo, o Google escolheu enfrentar a situação de frente. A Investopedia relatou que a margem de lucro da Nvidia na venda de GPUs é de cerca de 80%, o que é conhecido na indústria como “imposto Nvidia”. Para evitar pagar um alto prêmio, o Google começou a desenvolver internamente sua própria solução em 2015, utilizando um ecossistema de computação chamado TPU. Em comparação, o TPU está profundamente integrado à plataforma interna do Google, não afetando a posição da Nvidia.

Então você vê, aqueles gigantes concorrentes não estão apenas competindo em desempenho, mas sim em estratégia. Todos estão tentando contornar o CUDA, contornar a NVIDIA. Mas pelo menos até agora, ninguém pode ser abalado. Todos os desafiantes estão contornando a montanha, isso em si, é a maior expressão de respeito por esta montanha difícil de escalar.

Dica para empreendedores: a vala de proteção é insubstituível

A Nvidia passou de ser ignorada para se tornar o centro das atenções hoje em dia. Esta jornada realmente nos deixou sem palavras. Algumas pessoas na internet expressaram preocupação: a Nvidia subiu tanto, é exagerado, será que é uma bolha? Será que vai ser a segunda Cisco? Durante a bolha da internet em 2000, a Cisco era uma fornecedora de hardware de rede e, no seu auge, foi avaliada em mais de 150 vezes seu múltiplo preço-lucro a longo prazo. Mas após o estouro da bolha, caiu drasticamente.

Na verdade, eles têm diferenças fundamentais. A Cisco enfrenta um mercado de construção “única vez”. Quando a internet primitiva terminou de “instalar os tubos”, o crescimento da Cisco naturalmente parou. Por outro lado, a Nvidia enfrenta um mercado em constante crescimento. Pelo menos agora, a IA ainda está em crescimento, então esta “corrida armamentista” ainda não tem fim à vista. Mais importante, os clientes da Nvidia são gigantes como Microsoft, Google e Meta, que não têm problemas financeiros no mundo. Para eles, comprar os chips da Nvidia não é uma escolha, mas uma necessidade para sobreviver na era da IA.

Claro, o que acontecerá no futuro, ninguém pode prever. Talvez um dia, de repente, apareça um novo algoritmo que pode tornar a GPU irrelevante, mudando completamente as regras do jogo. Mas pelo menos no momento, podemos aprender uma lição muito importante com a NVIDIA. Qual é a sua barreira de proteção? Não se trata de se perguntar, “o meu produto é melhor, mais rápido ou mais barato do que o dos concorrentes?” Mas sim de perguntar: “O meu produto tem um ecossistema do qual os clientes não conseguem se afastar?”

Na verdade, a capitalização de mercado de 5 trilhões de dólares da Nvidia é a resposta mais clara para essa questão. Ela prova que, no mundo dos negócios, a lógica central mais simples e mais importante é que o mais profundo fosso defensivo não é construído com preços e desempenho, mas sim fazendo com que você se torne insubstituível.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
0/400
Nenhum comentário
  • Fixar
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)