Google Cloud Next 2025: A Era da Inferência e o Futuro da IA na Nuvem

O Google Cloud Next 2025, realizado de 9 a 11 de abril em Las Vegas, consolidou-se como um marco na evolução da inteligência artificial e da computação em nuvem. Neste artigo, analisamos as principais novidades apresentadas no evento e como elas sinalizam a transição da IA de uma fase experimental para uma realidade operacional que está transformando organizações em todo o mundo.
A Era da Inferência: Um Novo Paradigma para a IA
O tema central do evento foi a entrada na chamada "Era da Inferência", um conceito que representa a evolução dos modelos de IA de sistemas puramente reativos para agentes proativos e inteligentes. Thomas Kurian, CEO do Google Cloud, enfatizou que a IA deixou de ser uma visão futurista para se tornar uma "realidade vibrante" que está ativamente gerando resultados de negócios concretos.
Esta nova era é caracterizada pela ascensão de sistemas de IA agênticos capazes de:
- Gerar proativamente insights sem intervenção humana constante
- Executar tarefas complexas de forma autônoma
- Recuperar, processar e gerar dados colaborativamente
- Fornecer respostas e executar ações complexas como verdadeiros assistentes digitais
O Google demonstrou o impacto dessa evolução com números impressionantes: um aumento de 20 vezes no uso da Vertex AI desde o evento anterior e mais de 4 milhões de desenvolvedores utilizando a família de modelos Gemini, além de 2 bilhões de assistências de IA mensais no Google Workspace.
Gemini: A Evolução dos Modelos Fundamentais
A família de modelos Gemini continua sendo um pilar central da estratégia de IA do Google Cloud, com novidades significativas:
Gemini 2.5 Pro & Flash
O Gemini 2.5 Pro, agora em disponibilidade geral na Vertex AI, traz capacidades avançadas para tarefas complexas que exigem raciocínio profundo, como desenvolvimento de código e análise de documentos na área da saúde.
A grande novidade foi a introdução do Gemini 2.5 Flash, um modelo otimizado para baixa latência e eficiência de custo. Projetado para casos de uso diários e de alto volume, como interações com clientes que exigem resumos em tempo real ou acesso rápido a documentos, o Flash permite que as organizações equilibrem capacidade de raciocínio e orçamento.
Gemini On-Premises
Reconhecendo as necessidades de ambientes regulados e com requisitos estritos de residência de dados, o Google anunciou a capacidade de executar modelos Gemini localmente através do Google Distributed Cloud (GDC). Essa capacidade, viabilizada por parcerias com a NVIDIA e a Dell, permite o uso de Gemini em ambientes on-premises, incluindo configurações totalmente isoladas (air-gapped), abrindo portas para setores como governo e finanças.
Vertex AI: A Plataforma Unificada de Desenvolvimento de IA
A Vertex AI foi posicionada como a plataforma central do Google Cloud para todo o ciclo de vida da IA, com novidades importantes:
Novos Modelos de Mídia Generativa
O Google expandiu significativamente seu portfólio de modelos generativos para mídia:
- Imagen 3: Geração de imagens a partir de texto aprimorada e capacidades superiores de inpainting/outpainting para correção e edição de imagens.
- Veo 2: O modelo de geração de vídeo a partir de texto foi atualizado com controles mais sofisticados, incluindo controle de primeiro/último frame, mais ângulos de câmera e técnicas cinematográficas.
- Chirp 3: O modelo avançado de geração de áudio agora inclui a capacidade "Instant Custom Voice", permitindo criar vozes personalizadas a partir de apenas 10 segundos de áudio.
- Lyria: Anunciado como o primeiro modelo de geração de música a partir de texto pronto para uso empresarial.
Aprimoramentos de Grounding
O Google expandiu suas capacidades de "grounding", permitindo conectar modelos não apenas ao Google Search e aos dados empresariais do cliente, mas também a fontes de terceiros confiáveis (como Cotality, Dun & Bradstreet, HG Insights, S&P Global, ZoomInfo) e ao Google Maps.
O Ecossistema de Agentes: Automatizando a Empresa
Um dos focos mais proeminentes do Next 2025 foi o desenvolvimento e a implantação de agentes de IA – sistemas autônomos projetados para executar tarefas complexas e atingir objetivos específicos.
Agentspace
Esta plataforma foi introduzida como o hub central para implantar, gerenciar e conectar um ecossistema diversificado de agentes. As novidades incluem:
- Integração com o navegador Chrome (permitindo pesquisa em dados corporativos diretamente na barra de pesquisa)
- Agent Gallery para descoberta de agentes pré-construídos
- Agent Designer no-code para criação personalizada
- Acesso a novos agentes do Google, como Deep Research e Idea Generation
Agent Development Kit (ADK)
Para acelerar a criação de agentes, o Google lançou o ADK, um framework de código aberto que cobre todo o ciclo de vida de desenvolvimento e implantação de sistemas de agentes únicos e múltiplos. A empresa destacou a simplicidade do framework, alegando que um agente pode ser criado com menos de 100 linhas de código.
Protocolo Agent2Agent (A2A)
Um dos anúncios mais estratégicos foi o protocolo A2A, um padrão aberto projetado para permitir que agentes de IA, independentemente da tecnologia ou plataforma em que foram construídos, se comuniquem, troquem informações de forma segura e coordenem ações sobre aplicações empresariais. Mais de 50 empresas, incluindo nomes como Atlassian, Box, Deloitte, MongoDB, Salesforce, ServiceNow e UiPath, já estão colaborando com o Google neste padrão.
Infraestrutura de Próxima Geração para IA
A capacidade de treinar modelos massivos e executar inferências em escala exige uma infraestrutura computacional poderosa e eficiente. O Google Cloud Next 2025 apresentou avanços significativos nesta área.
TPUs Ironwood (7ª Geração)
O anúncio mais destacado foi o Ironwood, a sétima geração dos TPUs do Google. Representando um salto significativo em relação à geração anterior (Trillium), o Ironwood oferece:
- Um desempenho de 42.5 exaflops por pod
- Um aumento de mais de 10x em relação à geração anterior
- Uma melhoria de 2x na performance por watt
- Configurações que podem escalar até 9.216 chips
- Otimizações específicas para a "Era da Inferência"
Sua disponibilidade está prevista para o final de 2025.
Parceria NVIDIA e Roadmap de GPUs
O Google Cloud reafirmou sua forte parceria com a NVIDIA, anunciando a adoção da plataforma Blackwell (GPUs B200 e GB200). As novas VMs A4 e A4X serão baseadas nessas GPUs. Além disso, o Google se comprometeu a ser um dos primeiros provedores de nuvem a oferecer as GPUs de próxima geração da NVIDIA, Vera Rubin.
Cloud Wide Area Network (Cloud WAN)
Um anúncio significativo foi o lançamento do Cloud WAN. Este serviço gerenciado torna a extensa rede privada global do Google (com mais de 2 milhões de milhas de cabos terrestres e submarinos e mais de 200 pontos de presença) acessível a empresas para modernizar suas redes WAN. O Google alega que o Cloud WAN pode proporcionar melhorias de até 40% no desempenho da rede e reduções semelhantes no custo total de propriedade.
Google Unified Security: Segurança Integrada na Era da IA
Diante de um cenário de ameaças cibernéticas cada vez mais complexo, o Google Cloud respondeu com o lançamento do Google Unified Security (GUS).
Esta plataforma convergente integra diversas capacidades de segurança do Google em uma única solução, incluindo:
- Visibilidade abrangente
- Detecção avançada de ameaças
- Operações de segurança (SecOps) potencializadas por IA
- Red-teaming virtual contínuo
- Segurança de navegador empresarial
- A expertise em inteligência de ameaças da Mandiant
Um diferencial chave do GUS é a incorporação de IA nas Operações de Segurança, com novos agentes de segurança para automatizar e aprimorar as respostas a incidentes:
- Agente de Triagem de Alertas: Realiza investigações dinâmicas sobre alertas de segurança para determinar sua criticidade e contexto.
- Agente de Análise de Malware: Investiga a segurança de códigos e arquivos suspeitos.
Google Workspace: Produtividade Potencializada por IA
O Google Workspace continua a ser um veículo chave para levar os benefícios da IA a milhões de usuários finais. A integração do Gemini se aprofundou, tornando-se um componente padrão de todas as assinaturas e gerando um volume massivo de assistências de IA (mais de 2 bilhões por mês).
Novas funcionalidades específicas potencializadas por IA incluem:
- "Help Me Analyze" no Sheets: Uma ferramenta que utiliza IA para analisar dados em planilhas, identificar tendências e gerar insights automaticamente.
- Docs Audio Overview: Capacidade de gerar automaticamente resumos em áudio ou versões em estilo podcast de documentos do Google Docs.
- Google Workspace Flows: Introdução de fluxos de trabalho agênticos que permitem aos usuários automatizar tarefas repetitivas e otimizar processos envolvendo múltiplos aplicativos do Workspace.
- Melhorias no Vids: O aplicativo de criação de vídeo receberá integração com a geração de imagens do Veo 2, permitindo incorporar elementos visuais gerados por IA nos vídeos de trabalho.
Conclusão: O Futuro da IA na Nuvem
O Google Cloud Next 2025 marcou um ponto de inflexão na evolução da inteligência artificial e da computação em nuvem. A transição para a "Era da Inferência", caracterizada por agentes de IA autônomos e proativos, sinaliza uma nova fase de maturidade para esta tecnologia.
Para as empresas, estas inovações representam oportunidades sem precedentes para:
- Automatizar processos complexos através de agentes de IA especializados
- Desenvolver aplicações multimídia avançadas com os novos modelos generativos
- Melhorar a segurança cibernética com detecção e resposta potencializadas por IA
- Aumentar a produtividade dos colaboradores com as novas capacidades do Workspace
- Otimizar a infraestrutura de TI com as soluções de computação e rede de próxima geração
À medida que avançamos em 2025, a visão do Google de uma IA operacionalizada e integrada em todos os aspectos dos negócios está se tornando realidade. As organizações que conseguirem adotar estas tecnologias de forma estratégica estarão bem posicionadas para liderar a próxima onda de transformação digital.