OpenAI Revela Jalapeño, Seu Primeiro Chip de IA Próprio

Q: O que é o Jalapeño?

O Jalapeño é um circuito integrado de aplicação específica (ASIC) , ou seja, um chip feito para uma única tarefa em vez da flexibilidade geral de uma placa gráfica. A OpenAI descreve o componente como o seu primeiro "Intelligence Processor", nome que a empresa usa para distinguir um acelerador desenhado em torno da sua visão para o futuro da inferência de modelos de linguagem. Segundo o anúncio oficial publicado no blog da OpenAI , o Jalapeño não é um acelerador de propósito geral adaptado de cargas de trabalho anteriores, mas um "desenho em folha em branco" para a inferência moderna de LLMs. A arquitetura reduz o movimento de dados e equilibra computação, memória e rede para atingir uma utilização real muito mais próxima do pico teórico de desempenho. Amostras de engenharia já rodam cargas de machine learning no laboratório, na frequência e na potência-alvo de produção, incluindo o modelo GPT-5.3-Codex-Spark . A empresa alerta, contudo, que ainda está a medir o desempenho final.

Em 24 de junho de 2026, a OpenAI apresentou o Jalapeño, o seu primeiro processador próprio de inteligência artificial, desenvolvido em parceria com a Broadcom e a Celestica. Construído do zero para rodar modelos de linguagem na fase de inferência, o chip promete desempenho por watt “substancialmente superior” ao estado da arte atual e deve entrar em operação em escala de gigawatt até o fim do ano.

Resumo e pontos-chave

O que é: o Jalapeño é o primeiro “Intelligence Processor” da OpenAI, um acelerador (ASIC) desenhado especificamente para inferência de modelos de linguagem.
Parceiros: projetado com a Broadcom (NASDAQ: AVGO), com a Celestica na integração de placas e racks.
Prazo recorde: do desenho inicial à produção em apenas nove meses, acelerado pelos próprios modelos da OpenAI.
Promessa de eficiência: testes iniciais indicam desempenho por watt “substancialmente melhor” que o estado da arte.
Estratégia: reduzir a dependência das GPUs da Nvidia e baixar o custo recorrente de servir o ChatGPT, o Codex e a API.

O que é o Jalapeño

O Jalapeño é um circuito integrado de aplicação específica (ASIC), ou seja, um chip feito para uma única tarefa em vez da flexibilidade geral de uma placa gráfica. A OpenAI descreve o componente como o seu primeiro “Intelligence Processor”, nome que a empresa usa para distinguir um acelerador desenhado em torno da sua visão para o futuro da inferência de modelos de linguagem.

Segundo o anúncio oficial publicado no blog da OpenAI, o Jalapeño não é um acelerador de propósito geral adaptado de cargas de trabalho anteriores, mas um “desenho em folha em branco” para a inferência moderna de LLMs. A arquitetura reduz o movimento de dados e equilibra computação, memória e rede para atingir uma utilização real muito mais próxima do pico teórico de desempenho.

Amostras de engenharia já rodam cargas de machine learning no laboratório, na frequência e na potência-alvo de produção, incluindo o modelo GPT-5.3-Codex-Spark. A empresa alerta, contudo, que ainda está a medir o desempenho final.

Parceria com a Broadcom

O Jalapeño nasceu de uma colaboração formalizada em outubro de 2024 entre a OpenAI e a Broadcom, como recordou o TechCrunch. A Celestica junta-se ao projeto na implementação do silício, na integração de placas e racks e nos sistemas de produção escalável. A Broadcom ainda contribui com o seu silício de rede Tomahawk, fundamental para levar a plataforma a larga escala.

A entrega das primeiras unidades foi feita pessoalmente: Hock Tan e Charlie Kawwas, presidente e copresidente da Broadcom, entregaram amostras ao presidente Greg Brockman e ao diretor-executivo Sam Altman. “Esta é apenas o início de um roteiro de várias gerações”, afirmou Hock Tan, prometendo centros de dados em escala de gigawatt com a Microsoft e outros parceiros a partir de 2026.

Desenvolvimento em nove meses

Um dos números mais impressionantes do anúncio é o ritmo. O Jalapeño foi codesenvolvido do desenho inicial até o tape-out (a versão final enviada para fabricação) em apenas nove meses. A OpenAI afirma tratar-se do ciclo de desenvolvimento de ASIC mais rápido alguma vez alcançado em semicondutores avançados de alto desempenho.

Essa velocidade vem de duas fontes. Primeiro, a codesenvolução profunda entre software e hardware, com as equipas de engenharia da OpenAI a trabalhar lado a lado com a especialização em silício da Broadcom. Segundo, o uso dos próprios modelos de IA da empresa para acelerar partes do processo de desenho e otimização — ou seja, os mesmos modelos servidos aos usuários estão a ajudar a melhorar a infraestrutura que vai rodar os modelos futuros. Richard Ho, responsável pelo programa de hardware da OpenAI, diz que a arquitetura foi otimizada em torno dos kernels, do movimento de memória, da rede e dos padrões de serviço que mais importam para os modelos de fronteira.

Inferência, não treinamento

É essencial entender a distinção: o Jalapeño é feito para inferência, o processo de executar modelos já treinados em resposta aos comandos dos usuários — e não para o treinamento, a fase inicial e intensiva que ainda deve continuar dependendo do hardware da Nvidia. Como explicou o Forbes, a escolha faz sentido económico: treinar um modelo é um gasto único e enorme, mas a inferência é a conta que nunca para de chegar — cada resposta do ChatGPT, cada passo de um agente, milhares de milhões de vezes por dia.

Fisicamente, o chip aponta para o gargalo de memória que abranda os grandes modelos de linguagem. O desenho combina uma grande secção de computação com seis pilhas de memória de largura de banda elevada (HBM), otimizando os caminhos de dados diretamente no silício para cortar a energia necessária às cargas de trabalho complexas e em vários passos que os agentes de IA geram.

Custo e a dependência da Nvidia

A motivação de fundo é clara: reduzir a conta de luz recorrente e a dependência das GPUs da Nvidia. Hock Tan, da Broadcom, afirmou que o Jalapeño executa inferência por aproximadamente metade do custo de uma GPU de IA típica. O Forbes recomenda cautela: é um número da própria Broadcom, medido em cargas escolhidas pela OpenAI, sem benchmark independente — a direção é o que importa, mais do que a percentagem exata.

Mesmo pequenas reduções no custo de inferência podem melhorar drasticamente a margem da OpenAI, que projeta prejuízo de US$ 14 bilhões em 2026 conforme já analisamos em artigo anterior. O outro motivo, menos óbvio mas mais estratégico, é o controle. Alugar hardware de propósito geral significa construir um negócio sobre um componente que outra empresa desenha, precifica e decide como alocar. Ter o próprio desenho muda essa equação.

Implantação em escala gigawatt

O Jalapeño é apenas o primeiro passo de uma plataforma de computação de várias gerações, projetada para implantação inicial até ao fim de 2026 e expansão nos anos seguintes. A OpenAI fala em operação “em escala de gigawatt” com parceiros de centros de dados, combinando os aceleradores próprios com a implementação de silício, a rede e as tecnologias de conectividade da Broadcom, e a perícia em placas, racks e sistemas da Celestica.

O contexto é de uma corrida acelerada por infraestrutura. Enquanto a OpenAI avança com silício próprio, a Google fechou um acordo de US$ 32 bilhões para alugar 110 mil GPUs da SpaceX, como documentamos aqui. Quem controlar mais camadas da pilha — do modelo ao silício — terá uma vantagem estrutural na próxima década de IA.

A corrida dos chips próprios

A OpenAI não está sozinha nesta estratégia. O TechCrunch recorda que a Google e a Amazon já constroem os seus próprios chips para um propósito semelhante, frequentemente chamados de “aceleradores de IA” — silício desenhado especificamente para acelerar cargas de machine learning. A Meta também segue o mesmo caminho.

Empresa	Chip próprio	Foco principal
OpenAI	Jalapeño (com Broadcom)	Inferência de LLM
Google	TPU	Treinamento e inferência
Amazon	Trainium / Inferentia	Treinamento e inferência
Meta	MTIA	Inferência de recomendação

Isto coloca a Broadcom numa posição particularmente forte. A empresa desenha silício personalizado para gigantes como OpenAI, Google e Meta, funcionando, na leitura do Forbes, como uma espécie de “pedágio” da indústria. A empresa que estampa o nome no chip e a que captura o lucro duradouro raramente são a mesma. E há um constrangimento real: a capacidade de fabrico, sobretudo o empacotamento avançado da TSMC, continua a ser um gargalo crítico, com procura a superar largamente a oferta durante todo o 2026.

O que muda para o usuário

Na prática, a aposta da OpenAI traduz-se em benefícios concretos para quem usa os seus produtos. “A inferência é onde a IA chega às pessoas”, resume a empresa. Cada melhoria de custo, velocidade e confiabilidade pode aparecer como uma resposta do ChatGPT mais rápida, uma tarefa do Codex que dá mais passos com menos espera, uma API mais barata de construir ou um acesso mais estável quando a procura é alta.

Greg Brockman, presidente e cofundador da OpenAI, sintetiza a lógica: “Ao desenhar mais da pilha nós mesmos, podemos servir mais inteligência com maior eficiência e continuar a levar a IA avançada para um acesso mais amplo”. O ciclo é o que a empresa chama de “flywheel” — melhor infraestrutura gera mais eficiência de computação, que permite melhor treinamento e serviço, que gera modelos melhores, que viram produtos melhores, que geram mais uso e mais receita para reinvestir na próxima geração.

O relatório técnico detalhado de desempenho do Jalapeño será apresentado nos próximos meses. Até lá, a mensagem é clara: a guerra da IA deixou de ser apenas sobre modelos — passou a ser, também, sobre silício.

Perguntas frequentes

O que é o chip Jalapeño da OpenAI?

O Jalapeño é o primeiro processador próprio de inteligência artificial da OpenAI, um ASIC desenhado em parceria com a Broadcom e a Celestica especificamente para inferência de modelos de linguagem. Ele foi apresentado oficialmente em 24 de junho de 2026 e promete desempenho por watt substancialmente superior ao estado da arte atual.

O Jalapeño substitui as GPUs da Nvidia?

Não completamente. O Jalapeño é focado em inferência (rodar modelos já treinados), enquanto tarefas mais intensivas como o pré-treinamento devem continuar a depender das GPUs da Nvidia. A estratégia é reduzir a dependência e o custo recorrente de servir modelos, não eliminar o hardware de terceiros de imediato.

Quando o Jalapeño entra em operação?

A OpenAI planeja a implantação inicial do Jalapeño em escala de gigawatt até o fim de 2026, em centros de dados com parceiros como a Microsoft. É o primeiro passo de uma plataforma de computação de várias gerações que deve expandir nos anos seguintes. Um relatório técnico detalhado de desempenho será divulgado nos próximos meses.

Quanto custa rodar inferência no Jalapeño?

O diretor-executivo da Broadcom, Hock Tan, afirmou que o chip executa inferência por aproximadamente metade do custo de uma GPU de IA típica. O Forbes ressalva que é um número da própria Broadcom, sem benchmark independente, de modo que a direção (custo menor) é mais confiável do que a percentagem exata.

Foi uma ideia