Etched Sohu: O Chip de IA Que Promete 20x Mais Que a Nvidia

A startup americana Etched saiu do sigilo em 30 de junho de 2026 com o Sohu, um chip de inteligência artificial fabricado pela TSMC que promete até 20 vezes mais desempenho que a Nvidia H100 na tarefa de inferência de modelos. Fundada em 2022 em San Jose, na Califórnia, e liderada por Gavin Uberti e Robert Wachen, a empresa já acumula US$ 1 bilhão em contratos assinados, US$ 800 milhões em investimentos e uma avaliação de US$ 5 bilhões, com endosso de nomes como Geoffrey Hinton e Andrej Karpathy.

O que é a Etched

A startup americana Etched saiu do sigilo em 30 de junho de 2026 com o Sohu, um chip de inteligência artificial fabricado pela TSMC que promete até 20 vezes mais desempenho que a Nvidia H100 na tarefa de inferência de modelos. Fundada em 2022 e sediada em San Jose, na Califórnia, a empresa já acumula US$ 1 bilhão em contratos assinados de clientes e uma avaliação de US$ 5 bilhões, segundo reportagem da TechCrunch assinada por Julie Bort.

A aposta da Etched é radical e simples ao mesmo tempo: em vez de usar GPUs de propósito geral (como as da Nvidia) para rodar modelos de linguagem, ela construiu um chip exclusivamente para a arquitetura transformer — a mesma que está por trás do ChatGPT, do Claude e do Gemini. É o equivalente a trocar uma faca suíça por uma ferramenta feita para um único corte, mas para esse corte ela é implacável.

O chip Sohu e a TSMC

O coração do lançamento é o Sohu, um ASIC (circuito integrado de aplicação específica) que endurece em silício o mecanismo de atenção do transformer — a operação matemática que processa cada palavra de um texto em relação a todas as outras dentro da janela de contexto. O chip foi fabricado com sucesso pela TSMC no nó N4P ainda no início de 2026, etapa que a startup tratou como um marco antes de se apresentar publicamente.

A diferença para uma GPU convencional é estrutural. Em uma GPU, processar a atenção exige carregar os pesos do modelo e um cache de memória, disparar um kernel CUDA e gerenciar milhares de núcleos paralelos — dos quais apenas uma parte faz trabalho útil a cada instante. O resultado, segundo a análise publicada pela TechTimes, é que GPUs tipicamente aproveitam apenas de 30% a 40% da sua capacidade teórica de cálculo em inferência transformer. Ao dedicar silício inteiramente a essa tarefa, o Sohu fecha essa lacuna de aproveitamento.

Por que 20 vezes mais rápido

A cifra de “20x mais throughput” que circula desde o lançamento não é uma melhoria incremental: é uma promessa de salto de ordem de grandeza. O raciocínio por trás dela é que, ao eliminar o desperdício de uma GPU de propósito geral, o Sohu conseguiria processar muito mais tokens por segundo com o mesmo ou menor consumo de energia. Se confirmado em produção, isso significaria inferência (a resposta que vem depois que você envia um prompt) muito mais barata e rápida.

Isso importa porque a inferência virou o maior gargalo e o maior centro de custo das empresas de IA que atendem usuários em escala. Cada vez que alguém abre o ChatGPT e envia uma mensagem, alguém precisa pagar pela computação de gerar a resposta. Reduzir esse custo em uma ordem de grandeza é o que faria agentes de IA autônomos — que rodam dezenas de chamadas em sequência — virarem negócio viável.

US$ 1 bilhão em contratos

Apesar de o chip ainda estar em teste com clientes, a Etched afirma já ter mais de US$ 1 bilhão em contratos assinados para sistemas completos baseados no Sohu. A empresa não vende apenas o processador: oferece os chamados “clusters de inferência de fronteira”, pacotes que reúnem os chips, racks sob medida, software, interconexões e refrigeração. Os primeiros racks começam a ser entregues no verão de 2026, segundo a TechTimes.

No total, a Etched levantou US$ 800 milhões em investimentos. A rodada mais recente, fechada em dezembro de 2025, foi de US$ 500 milhões a uma avaliação pós-investimento de US$ 5 bilhões — números confirmados tanto pela TechCrunch quanto pelo comunicado oficial distribuído pela GlobeNewswire. Para uma empresa que quatro anos antes operava mês a mês, à beira de ficar sem caixa, é uma virada e tanto.

MétricaEtched (Sohu)Nvidia (H100)
Tipo de chipASIC dedicado a transformersGPU de propósito geral
Aproveitamento de cálculoOtimizado30% a 40% teórico
Throughput (claim)Até 20x superiorReferência
Contratos assinadosUS$ 1 bilhãon/a
SoftwarePróprio (clusters fechados)CUDA (dominante)

Quem investiu na Etched

A lista de investidores da Etched é tão impressionante quanto os números. A rodada de US$ 500 milhões foi liderada pela Stripes, com participação da VentureTech Alliance, Jane Street, Hudson River Trading, Two Sigma e Ribbit Capital — nomes pesados do capital de risco e das finanças quantitativas. Mas são os anjos que chamam atenção: Andrej Karpathy, Geoffrey Hinton, Fei-Fei Li, Arthur Mensch e Scott Wu colocaram dinheiro próprio no projeto.

É um lineup que mistura os pioneiros do aprendizado profundo (Hinton, Prêmio Nobel; Fei-Fei Li, a “mãe” da visão computacional moderna; Karpathy, ex-Tesla e OpenAI) com fundadores de empresas de IA concorrentes (Mensch, da Mistral; Wu, da Cognition). O cap table ainda inclui bilionários como Stanley Druckenmiller e Peter Thiel, este último responsável por uma bolsa que financiou os dois fundadores a largarem Harvard. Ter esse nível de endosso técnico é um sinal de que a tese da Etched é levada a sério por quem entende do assunto.

A corrida contra a Nvidia

Desafiar a Nvidia é, hoje, uma das apostas mais ousadas do setor de tecnologia. A companhia de Jensen Huang não domina apenas o hardware: seu fosso inclui o software CUDA, o sistema de networking, os racks, a cadeia de suprimentos, os contratos com as grandes nuvens e a confiança dos desenvolvedores. Como observou o site especializado Kingy.ai, a Etched parece ter entendido que vencer não é só entregar um chip mais rápido, e por isso se posiciona como uma empresa de inferência verticalmente integrada.

Ela não está sozinha nessa corrida. A Cerebras teve o primeiro grande IPO do ano, a Groq levantou US$ 650 milhões e as próprias gigantes — Amazon, Google e Microsoft — já desenvolvem chips próprios de IA internamente. Até a OpenAI anunciou recentemente seu primeiro chip customizado, o Jalapeño, fabricado em parceria com a Broadcom. Outro sinal do movimento veio da própria Qualcomm, que ofereceu US$ 10 bilhões para comprar a Tenstorrent, startup de chips de IA. O recado de mercado é claro: o monopólio da GPU de propósito geral está sendo contestado de todos os lados.

A virada de 2023 a 2026

O contraste com o início da jornada explica por que o lançamento repercutiu tanto. Em 2023, os fundadores Gavin Uberti e Robert Wachen tinham um memorando de 30 páginas argumentando que a IA precisaria de chips especializados, não apenas de GPUs. Todos os grandes investidores que procuraram disseram não. A empresa chegou a operar mês a mês, perto de ficar sem dinheiro, segundo relataram ao podcast “Invest Like the Best”.

Três anos depois, o cenário é outro planeta. Investidores correm atrás de qualquer tecnologia que acelere a inferência, e a tese que ninguém quis financiar virou a base de um negócio avaliado em US$ 5 bilhões. É um lembrete de que, em IA, o consenso de hoje costuma ser o preconceito de amanhã — e que a diferença entre “todos passaram” e “todos querem entrar” pode ser uma única fabricação bem-sucedida na TSMC.

O que isso muda para você

Para o usuário final, a consequência prática de chips como o Sohu é uma IA mais barata e mais rápida. Se a inferência ficar realmente mais eficiente, empresas poderão oferecer modelos maiores em planos gratuitos, agentes autônomos poderão rodar mais passos sem estourar o orçamento e aplicações de IA em tempo real (tradução, voz, código) ganharão latência menor. O brasileiro que usa IA no dia a dia não verá o Sohu diretamente, mas sentirá o efeito no preço das assinaturas e na velocidade das respostas.

O alerta necessário é que boa parte desses números ainda é promessa. O chip está em teste com clientes, e a afirmação de 20x mais throughput precisa ser confirmada em condições reais de produção ao longo dos próximos meses. Mas o fato de nomes como Hinton e Karpathy estarem colocando dinheiro, e de US$ 1 bilhão em contratos já estarem assinados, sugere que a tese é levada a sério por quem aposta com o próprio bolso. Para quem acompanha inovação em IA, esse é um nome para observar de perto.

Perguntas frequentes

O que é o chip Sohu da Etched?

O Sohu é um ASIC (circuito integrado de aplicação específica) desenvolvido pela startup americana Etched e fabricado pela TSMC no nó N4P. Ao contrário das GPUs de propósito geral, ele é dedicado inteiramente à arquitetura transformer — a base de modelos como ChatGPT, Claude e Gemini —, o que reduz o desperdício de capacidade de cálculo típico dos chips genéricos.

Quanto o Sohu é mais rápido que a Nvidia?

A Etched afirma que o Sohu entrega até 20 vezes mais throughput que a Nvidia H100 em inferência transformer. A justificativa técnica é que GPUs costumam aproveitar apenas de 30% a 40% da capacidade teórica nessa tarefa, enquanto um chip dedicado elimina boa parte desse desperdício. A cifra precisa ser confirmada em condições reais de produção ao longo dos próximos meses.

Quando o chip Sohu chega ao mercado?

Os primeiros racks equipados com o Sohu começam a ser entregues no verão de 2026, segundo a empresa. O chip já foi fabricado com sucesso pela TSMC e está em teste com clientes, e a Etched afirma ter mais de US$ 1 bilhão em contratos assinados para sistemas completos de inferência.

Referências