O GitHub Copilot adicionou o Kimi K2.7 Code, da chinesa Moonshot AI, ao seu seletor de modelos em 1º de julho de 2026. É o primeiro modelo de inteligência artificial com pesos abertos a entrar na plataforma, permitindo que desenvolvedores inspecionem, portem e hospedem localmente a mesma IA que usam no editor de código. O modelo tem 1 trilhão de parâmetros e contexto de 256 mil tokens.
O Primeiro Modelo Aberto no Copilot
Em 1º de julho de 2026, o GitHub adicionou o Kimi K2.7 Code, da chinesa Moonshot AI, ao seletor de modelos do Copilot. Foi a primeira vez que um modelo de inteligência artificial com pesos abertos entrou na plataforma, que até então só oferecia opções proprietárias da Anthropic, OpenAI, Google e xAI. A mudança abre caminho para desenvolvedores auditarem, portarem e até hospedarem localmente a mesma IA que usam dentro do editor de código.
O anúncio foi detalhado por fontes especializadas como o AI/TLDR e o VibecodedThis, que destacam o marco de um modelo open-weight entrar numa plataforma dominada por opções fechadas de Anthropic, OpenAI, Google e xAI.
Conhecendo o Kimi K2.7 Code
O Kimi K2.7 Code é um modelo de linguagem focado em programação, desenvolvido pela Moonshot AI, startup chinesa de IA sediada em Pequim. Ele foi projetado para tarefas de engenharia de software de longa duração — refatorar bases de código inteiras, implementar funcionalidades em múltiplos arquivos e depurar bugs em sessões prolongadas de agente. A página oficial do modelo o descreve como “um modelo agentic de código aberto construído para engenharia de software de longo horizonte”.
Diferente dos modelos anteriores da família K2, o K2.7 Code escreve implementações diretamente em vez de simplesmente envolver bibliotecas existentes. Segundo a Moonshot AI, isso produz generalização mais confiável em Rust, Go e Python, abrangendo desenvolvimento frontend, DevOps e otimização de performance.
O modelo opera exclusivamente em modo de raciocínio (thinking mode) e mantém a temperatura fixa em 1.0 — equipes não podem ajustar a determinismo da saída como fariam com outros modelos, conforme reportado pelo VentureBeat.
Trilhão de Parâmetros, Mas Econômico
Por baixo do capô, o Kimi K2.7 Code usa uma arquitetura Mixture-of-Experts (MoE) com 1 trilhão de parâmetros totais, mas ativa apenas 32 bilhões por token processado. Essa abordagem permite que o modelo ofereça capacidade de raciocínio em larga escala sem o custo computacional proibitivo de um modelo denso equivalente. A janela de contexto suporta 256 mil tokens, com atenção latente multi-cabeça (MLA).
Um diferencial importante: o K2.7 Code reduz o consumo de thinking tokens em aproximadamente 30% comparado ao seu predecessor, o K2.6. Para desenvolvedores que rodam fluxos agentic em produção, essa eficiência se traduz em respostas mais rápidas, custos de API menores e mais trabalho concluído dentro do mesmo orçamento de contexto.
O modelo também inclui o MoonViT, um codificador de visão de 400 milhões de parâmetros, permitindo processar entradas visuais junto com texto. Isso o torna relevante não apenas para código, mas para tarefas multimodais como análise de screenshots de interface.
| Especificação | Valor |
|---|---|
| Arquitetura | Mixture-of-Experts (MoE) |
| Parâmetros totais | 1 trilhão |
| Parâmetros ativados por token | 32 bilhões |
| Janela de contexto | 256K tokens |
| Codificador de visão | MoonViT (400M) |
| Licença | Modified MIT (Hugging Face) |
Como Funciona no GitHub Copilot
Dentro do Copilot, o Kimi K2.7 Code aparece no seletor de modelos ao lado de GPT, Claude, Gemini e Grok. Uma vez selecionado, ele funciona em todos os lugares onde o Copilot opera: VS Code 1.127+, Visual Studio 17.14.6+, JetBrains, Xcode, Eclipse, Copilot CLI, chat no github.com e aplicativos mobile do GitHub para iOS e Android.
O modelo é hospedado na infraestrutura do Microsoft Azure e cobrado pelo preço de lista da Moonshot AI sob o sistema de cobrança por uso do Copilot. Para usuários do Copilot Pro, Pro+ e Max, o uso conta como parte da verba de requisições premium incluída no plano — não exige contrato separado.
O modelo também está disponível na plataforma Cloudflare Workers AI, com janela de 262 mil tokens, chamada de ferramentas multi-turno e saídas estruturadas para workloads agentic.
Benchmarks Próprios vs. Realidade
A Moonshot AI reporta ganhos expressivos sobre o K2.6: +21,8% no Kimi Code Bench v2 (62,0 contra 50,9), +11% no Program Bench (53,6 contra 48,3) e +31,5% no MLS Bench Lite (35,1 contra 26,7). Em benchmarks de tarefas agentic autônomas, o modelo melhora cerca de 10% sobre o predecessor.
Porém, todos esses são benchmarks proprietários da própria Moonshot AI. A comunidade técnica levantou dúvidas. O pesquisador Elliot Arledge testou o K2.7 Code no KernelBench-Hard, benchmark público de otimização de kernels de GPU, e publicou logs completos. Sua conclusão: “K2.7 é mais honesto, mas não mais capaz.” Em cinco de seis problemas, o modelo produziu kernels reais em vez de envolver bibliotecas — mas dois falharam por bugs próprios. O resultado no kernel MoE regrediu de 0,222 para 0,157.
O desenvolvedor Sugumaran Balasubramaniyan, que construiu um roteador de modelos usando o benchmark independente DeepSWE como referência, questionou publicamente a Moonshot AI: “Respeitosamente, todo modelo ‘melhora’ dois dígitos no próprio conjunto de testes.” Ele observou que o K2.6 pontuou apenas 24% no DeepSWE, indicando que os benchmarks internos podem inflar a percepção de capacidade.
| Benchmark | K2.6 | K2.7 Code | GPT-5.5 | Claude Opus 4.8 |
|---|---|---|---|---|
| Kimi Code Bench v2 | 50,9 | 62,0 | 69,0 | 67,4 |
| Program Bench | 48,3 | 53,6 | 69,1 | 63,8 |
| MLS Bench Lite | 26,7 | 35,1 | 35,5 | 42,8 |
Fonte: Moonshot AI. Benchmarks proprietários. GPT-5.5 avaliado no Codex (xhigh); Opus 4.8 no Claude Code (xhigh).
Por Que Código Aberto Importa
A maioria dos modelos no seletor do Copilot é fechada: variantes do GPT, Claude, Gemini e Grok. Nenhum desses permite que um time inspecione os pesos internos, audite como o modelo toma decisões ou o execute em infraestrutura própria para código sensível.
O Kimi K2.7 Code muda essa equação. Seus pesos estão publicados no Hugging Face sob licença Modified MIT, e pode ser implantado via vLLM ou SGLang. Para equipes em setores regulados — finanças, saúde, governo —, a capacidade de rodar o mesmo modelo offline, sem enviar código-fonte para servidores de terceiros, é um diferencial estratégico real.
Há também a questão da portabilidade. Um time que gostar do desempenho do K2.7 Code pode migrar do Copilot para hospedagem própria sem trocar de modelo, algo impossível com GPT ou Claude. Isso reduz lock-in com plataformas específicas e dá aos desenvolvedores controle sobre custo, latência e privacidade.
Para quem acompanha o movimento de IA aberta no Brasil, este é o mesmo padrão que vimos com o MiniMax M3, outra IA chinesa que bateu GPT-5.5 em código. A China está investindo pesado em modelos abertos como forma de competir com o ecossistema fechado das gigantes americanas.
Quem Pode Usar Agora
O Kimi K2.7 Code está disponível imediatamente para assinantes do GitHub Copilot Pro, Pro+ e Max. Usuários nesses planos podem selecioná-lo no seletor de modelos sem custo adicional além da verba de requisições premium já incluída.
Para clientes Business e Enterprise, o modelo chegará “nas próximas semanas”, segundo o GitHub, e virá desativado por padrão. Administradores precisam habilitá-lo explicitamente através das configurações de política do Copilot, depois de avaliar requisitos de segurança e conformidade. Essa abordagem cautelosa faz sentido: empresas precisam validar modelos abertos contra seus protocolos antes de liberar para centenas de desenvolvedores.
Quem prefere não esperar pode acessar o modelo diretamente pela API da Moonshot AI, pela plataforma da Cloudflare, ou baixar os pesos e rodar localmente. O predecessor K2.6 liderou o ranking semanal de modelos no OpenRouter quando lançado em abril de 2026 — sinal de que há demanda real por essa categoria de modelo.
O Que Esperar daqui Para Frente
A entrada do Kimi K2.7 Code no Copilot é um sinal de que o GitHub pretende abrir o seletor para mais modelos abertos no futuro. A plataforma já confirmou que avaliará outros modelos open-weight com base em demanda, custo e segurança.
Para desenvolvedores brasileiros, isso significa mais opções e pressão de preços. Cada modelo adicional no seletor força os concorrentes a justificar seu custo-benefício. O resultado tende a ser APIs mais baratas, melhor qualidade e mais flexibilidade — exatamente o que o mercado precisa.
Há riscos. Modelos abertos não são automaticamente mais seguros que fechados; a auditoria depende da comunidade identificar e corrigir problemas. E benchmarks proprietários continuam sendo um problema: sem padronização independente, fica difícil comparar modelos de forma justa. Quem trabalha com segurança em código gerado por IA sabe que a transparência dos pesos é só o primeiro passo.
Ainda assim, o movimento é positivo. Pela primeira vez, um desenvolvedor com conta Copilot Pro pode testar um modelo aberto de um trilhão de parâmetros no mesmo editor onde já usa GPT e Claude, comparar resultados lado a lado e decidir com base em experiência real — não em marketing. Isso é progresso real para a democratização da IA.
Perguntas Frequentes
O Kimi K2.7 Code é realmente gratuito?
O modelo é open-source sob licença Modified MIT, com pesos disponíveis no Hugging Face. Isso significa que você pode baixá-lo e rodá-lo localmente sem custo de licença. No GitHub Copilot, ele é cobrado por uso dentro da verba premium do plano — Pro, Pro+ e Max já têm acesso incluído. Para rodar localmente, é preciso ter hardware com VRAM suficiente para um modelo de 1 trilhão de parâmetros MoE, o que pode exigir GPUs de alto desempenho.
Como o Kimi K2.7 Code se compara ao Claude e ao GPT?
Segundo benchmarks próprios da Moonshot AI, o K2.7 Code pontua 62,0 no Kimi Code Bench v2, contra 69,0 do GPT-5.5 e 67,4 do Claude Opus 4.8. Ou seja, fica atrás dos modelos frontier proprietários em benchmarks internos da própria fabricante. Pesquisadores independentes observaram que o modelo é “mais honesto, mas não mais capaz” que o predecessor em testes públicos. O diferencial não é performance pura, mas o fato de ser aberto, auditável e portável.
Quem pode usar o Kimi K2.7 Code no Copilot?
Assinantes do GitHub Copilot Pro, Pro+ e Max têm acesso imediato ao modelo no seletor. Clientes Business e Enterprise receberão o modelo nas próximas semanas, desativado por padrão — administradores precisam habilitá-lo manualmente após avaliar requisitos de segurança. O modelo também está disponível pela API da Moonshot AI, pela plataforma Cloudflare Workers AI, e pode ser baixado do Hugging Face para execução local via vLLM ou SGLang.
Referências
- Moonshot AI — Página oficial do Kimi K2.7 Code
- AI/TLDR — Kimi K2.7-Code in GitHub Copilot: first open-weight model
- VibecodedThis — Kimi K2.7 Code Is Now in GitHub Copilot
- VentureBeat (via XMAIL) — K2.7-Code cuts thinking tokens 30%
- Cloudflare Workers AI — Kimi K2.7 Code
- Hugging Face — Modelos da Moonshot AI
- AIApps — Top AI News for July 2026