Claude Code Banido Da Microsoft
Em maio de 2026, a Microsoft começou a cancelar as licenças internas do Claude Code em sua divisão Experiences + Devices — o grupo responsável por Windows, Microsoft 365, Outlook, Teams e Surface. A ordem veio de Rajesh Jha, vice-presidente executivo da divisão, e segundo a Space Daily, os engenheiros foram instruídos a migrar para o GitHub Copilot CLI até 30 de junho — último dia do ano fiscal da empresa.
A ironia é espessa. A Microsoft abriu acesso ao Claude Code para milhares de desenvolvedores em dezembro de 2025, convidando a usar a ferramenta em fluxos de trabalho reais. O problema? A ferramenta se tornou popular demais — a ponto de começar a deslocar o GitHub Copilot CLI no uso diário. Uma empresa que vende Copilot para o mundo inteiro não pode ter seus próprios engenheiros migrando para o concorrente em escala.
A mensagem interna de Jha, citada pelo The Verge, foi diplomática: “Claude Code foi uma parte importante desse aprendizado. Ao mesmo tempo, o Copilot CLI nos deu algo importante: um produto que podemos moldar diretamente.”
A História Do MAI-Code-1-Flash
Em 2 de junho de 2026, no evento Build em São Francisco, a Microsoft anunciou o MAI-Code-1-Flash: seu primeiro modelo de código desenvolvido internamente. Segundo o Tech Times, o modelo tem 5 bilhões de parâmetros e uma janela de contexto de 256.000 tokens — deliberadamente leve, otimizado para velocidade e custo, não para tamanho.
A Microsoft diz que treinou o MAI-Code-1-Flash diretamente no ambiente real do GitHub Copilot — não em benchmarks sintéticos. Os checkpoints foram avaliados em tarefas como refatoração, perguntas sobre repositórios e edições baseadas em telemetria. Em termos práticos: o modelo foi ajustado para a ferramenta que as pessoas realmente usam.
Os números que a Microsoft destaca são contundentes: o MAI-Code-1-Flash supera o Claude Haiku 4.5 da Anthropic em quatro benchmarks centrais de código, incluindo uma vantagem de 16 pontos no SWE-Bench Pro (51,2% contra 35,2%). A empresa também afirma que o modelo resolve algumas tarefas do SWE-Bench Verified usando até 60% menos tokens.
O Caso Uber: Orçamento Esgotado
A decisão da Microsoft não aconteceu no vácuo. Em abril de 2026, o CTO de Mobilidade e Entregas da Uber, Praveen Neppalli Naga, confirmou à The Information que a empresa havia esgotado seu orçamento anual de ferramentas de IA para código em apenas quatro meses. O mecanismo não foi um contrato gigante — foi velocidade de adoção.
A Uber liberou Claude Code e Cursor para cerca de 5.000 engenheiros em dezembro de 2025 e criou um ranking interno que classificava equipes por volume de uso. O resultado: em março, 84% dos engenheiros eram classificados como usuários de “código agentic”. O custo mensal por engenheiro pesado chegou a US$ 500 a US$ 2.000, contra uma média de US$ 150 a US$ 250. Nessa taxa, um orçamento anual inteiro evaporou antes do verão.
O COO Andrew Macdonald, no podcast Rapid Response (reportado pela Fortune em 26 de maio), foi direto sobre o desconforto: “Esse link ainda não está lá. Talvez implicitamente tenha mais coisa sendo entregue, mas é muito difícil traçar uma linha entre essas estatísticas e ‘ok, agora estamos produzindo 25% mais funcionalidades úteis para o consumidor’.”
O Problema Do Billing Por Tokens
Tanto o caso Microsoft quanto o da Uber revelam uma dificuldade estrutural que muitas empresas estão encontrando pela primeira vez. Licenças de software tradicionais são previsíveis: um número fixo de assentos a um preço fixo. Ferramentas de IA agentic com preços baseados em tokens não são.
O uso escala com a ambição da tarefa. Um engenheiro rodando uma refatoração multi-etapa em uma base de código grande gera vastamente mais tokens do que um que pede uma sugestão de função. Quando fluxos agentic se tornam padrão e desenvolvedores executam tarefas em paralelo, o custo por usuário se expande de formas que modelos orçamentários de 2025 não conseguiam prever.
A Gartner projeta que, embora os custos de inferência por token caiam cerca de 90% até 2030, as contas de IA das empresas não cairão proporcionalmente — porque fluxos agentic exigem muito mais tokens por tarefa e porque os provedores não repassarão totalmente as reduções de custo aos clientes.
Por Que a Microsoft Se Moveu
A CNBC reportou que a Microsoft revelou seus novos modelos especificamente para reduzir a dependência da OpenAI e baratear custos para desenvolvedores. O MAI-Code-1-Flash veio logo após o MAI-Thinking-1, o primeiro modelo de raciocínio interno da Microsoft — treinado, segundo a empresa, sem dados da OpenAI. Esse movimento faz parte de uma estratégia mais ampla de lançamento de modelos MAI que já abordamos por aqui.
Ter um modelo próprio dá à Microsoft três coisas que alugar não oferece: controle sobre custo, controle sobre dados de treinamento e a capacidade de ajustar especificamente para a experiência Copilot. Para um produto com centenas de milhões de interações de desenvolvedores, mesmo pequenos ganhos de eficiência se transformam em economias enormes.
A jogada estratégica é clara: distribuição mais controle de custo supera tamanho bruto de modelo. A Microsoft está apostando que ter um modelo próprio, barato e rápido onde centenas de milhões de desenvolvedores já trabalham é mais poderoso do que ter o modelo mais inteligente do mercado.
Quem Ganha a Guerra
O mercado de ferramentas de IA para código se tornou um dos campos de batalha mais ferozes da tecnologia em 2026. A Anthropic domina com o Claude Code, que segundo a Forbes comanda 54% do mercado de código com IA. A Microsoft responde com o Copilot e agora o MAI-Code-1-Flash. O OpenAI tem o Codex, que recentemente ganhou um app dedicado. Google, Cursor, Windsurf e dezenas de startups brigam pelos restantes.
| Ferramenta | Empresa | Modelo Base | Foco |
|---|---|---|---|
| Claude Code | Anthropic | Opus 4.8 / Fable 5 | Agentes autônomos |
| GitHub Copilot CLI | Microsoft | MAI-Code-1-Flash + GPT | Integração no VS Code |
| Cursor | Cursor Inc. | Multi-modelo | IDE próprio |
| Codex | OpenAI | GPT-5.5 | Automação agentic |
| Windsurf | Codeium | Multi-modelo | IDE + agentes |
O cenário para desenvolvedores brasileiros é misto. Por um lado, a competição baixa preços e melhora ferramentas. Por outro, o custo real de uso intensivo pode ser surpreendentemente alto — como a Uber descobriu. Um relatório anterior da Microsoft já mostrava que 78% mais código estava sendo gerado por IA, mas volume não é sinônimo de produtividade real. A lição prática é clara: antes de adotar ferramentas de código com IA em escala, estabeleça limites de uso e mecanismos de medição de ROI. Incentivar uso sem rastrear resultado é uma receita para estourar o orçamento.
O Que Muda Para Desenvolvedores
Para o desenvolvedor no VS Code, a mudança é silenciosa por design. O MAI-Code-1-Flash aparece no seletor de modelos e no roteador automático do Copilot, então muitos usuários vão simplesmente encontrar uma opção mais rápida e barata sem nenhuma configuração. A implantação é gradual, começando com um conjunto limitado de usuários e expandindo nas próximas semanas.
O sinal estratégico importa mais que a conveniência. A Microsoft está dizendo claramente que prefere construir a alugar. O MAI-Code-1-Flash não é o modelo mais inteligente do mercado — e não precisa ser. Ele precisa ser bom o suficiente, barato o suficiente e distribuído o suficiente para que a maioria dos desenvolvedores nunca sinta falta de alternativas.
Enquanto isso, a Anthropic lançou o Claude Opus 4.8 no dia 28 de maio, disponibilizando-o também no GitHub Copilot. Os engenheiros da divisão Experiences + Devices que estão sendo migrados do Claude Code para o Copilot CLI agora têm acesso ao Opus 4.8 pela ferramenta para a qual estão sendo direcionados. A guerra continua — mas o campo de batalha é cada vez mais o bolso.
Perguntas Frequentes
Por que a Microsoft cancelou o Claude Code internamente?
O Claude Code se tornou tão popular entre os engenheiros da Microsoft que começou a deslocar o GitHub Copilot no uso diário. Como a Microsoft vende o Copilot para o mundo, não era sustentável ter seus próprios engenheiros migrando para o concorrente.
O MAI-Code-1-Flash é melhor que o Claude Code?
A Microsoft diz que supera o Claude Haiku 4.5 (modelo leve da Anthropic) em quatro benchmarks de código, incluindo o SWE-Bench Pro. Mas a comparação é com um modelo pequeno, não com os modelos principais como Opus 4.8. Testes independentes em bases de código reais ainda são necessários.
Quanto custa usar ferramentas de IA para código?
Depende do uso. Na Uber, engenheiros pesados gastaram entre US$ 500 e US$ 2.000 por mês. A média ficou em US$ 150 a US$ 250 por engenheiro. O MAI-Code-1-Flash da Microsoft é justamente uma resposta para reduzir esses custos, consumindo até 60% menos tokens em algumas tarefas.
Referências
- Space Daily — “Microsoft is canceling Claude Code licenses” (2 jun 2026)
- Tech Times — “Microsoft’s First In-House Coding Model Beats Claude Haiku 4.5” (9 jun 2026)
- CNBC — “Microsoft and Google take on Anthropic and OpenAI in AI coding models” (1 jun 2026)
- Forbes — “Microsoft Ends Claude Code Licenses As It Shifts Developers To Copilot” (1 jun 2026)
- Enterprise DNA — “Microsoft Launches MAI-Code-1-Flash at Build 2026” (jun 2026)