By Mauro Mequelussi in News — 09 Abr 2025

Google Cloud Next 2025: A Era da Inferência e o Futuro da IA na Nuvem

O Google Cloud Next 2025, realizado de 9 a 11 de abril em Las Vegas, consolidou-se como um marco na evolução da inteligência artificial e da computação em nuvem. Neste artigo, analisamos as principais novidades apresentadas no evento e como elas sinalizam a transição da IA de uma fase experimental para uma realidade operacional que está transformando organizações em todo o mundo.

A Era da Inferência: Um Novo Paradigma para a IA

O tema central do evento foi a entrada na chamada "Era da Inferência", um conceito que representa a evolução dos modelos de IA de sistemas puramente reativos para agentes proativos e inteligentes. Thomas Kurian, CEO do Google Cloud, enfatizou que a IA deixou de ser uma visão futurista para se tornar uma "realidade vibrante" que está ativamente gerando resultados de negócios concretos.

Esta nova era é caracterizada pela ascensão de sistemas de IA agênticos capazes de:

Gerar proativamente insights sem intervenção humana constante
Executar tarefas complexas de forma autônoma
Recuperar, processar e gerar dados colaborativamente
Fornecer respostas e executar ações complexas como verdadeiros assistentes digitais

O Google demonstrou o impacto dessa evolução com números impressionantes: um aumento de 20 vezes no uso da Vertex AI desde o evento anterior e mais de 4 milhões de desenvolvedores utilizando a família de modelos Gemini, além de 2 bilhões de assistências de IA mensais no Google Workspace.

Gemini: A Evolução dos Modelos Fundamentais

A família de modelos Gemini continua sendo um pilar central da estratégia de IA do Google Cloud, com novidades significativas:

Gemini 2.5 Pro & Flash

O Gemini 2.5 Pro, agora em disponibilidade geral na Vertex AI, traz capacidades avançadas para tarefas complexas que exigem raciocínio profundo, como desenvolvimento de código e análise de documentos na área da saúde.

A grande novidade foi a introdução do Gemini 2.5 Flash, um modelo otimizado para baixa latência e eficiência de custo. Projetado para casos de uso diários e de alto volume, como interações com clientes que exigem resumos em tempo real ou acesso rápido a documentos, o Flash permite que as organizações equilibrem capacidade de raciocínio e orçamento.

Gemini On-Premises

Reconhecendo as necessidades de ambientes regulados e com requisitos estritos de residência de dados, o Google anunciou a capacidade de executar modelos Gemini localmente através do Google Distributed Cloud (GDC). Essa capacidade, viabilizada por parcerias com a NVIDIA e a Dell, permite o uso de Gemini em ambientes on-premises, incluindo configurações totalmente isoladas (air-gapped), abrindo portas para setores como governo e finanças.

Vertex AI: A Plataforma Unificada de Desenvolvimento de IA

A Vertex AI foi posicionada como a plataforma central do Google Cloud para todo o ciclo de vida da IA, com novidades importantes:

Novos Modelos de Mídia Generativa

O Google expandiu significativamente seu portfólio de modelos generativos para mídia:

Imagen 3: Geração de imagens a partir de texto aprimorada e capacidades superiores de inpainting/outpainting para correção e edição de imagens.
Veo 2: O modelo de geração de vídeo a partir de texto foi atualizado com controles mais sofisticados, incluindo controle de primeiro/último frame, mais ângulos de câmera e técnicas cinematográficas.
Chirp 3: O modelo avançado de geração de áudio agora inclui a capacidade "Instant Custom Voice", permitindo criar vozes personalizadas a partir de apenas 10 segundos de áudio.
Lyria: Anunciado como o primeiro modelo de geração de música a partir de texto pronto para uso empresarial.

Aprimoramentos de Grounding

O Google expandiu suas capacidades de "grounding", permitindo conectar modelos não apenas ao Google Search e aos dados empresariais do cliente, mas também a fontes de terceiros confiáveis (como Cotality, Dun & Bradstreet, HG Insights, S&P Global, ZoomInfo) e ao Google Maps.

O Ecossistema de Agentes: Automatizando a Empresa

Um dos focos mais proeminentes do Next 2025 foi o desenvolvimento e a implantação de agentes de IA – sistemas autônomos projetados para executar tarefas complexas e atingir objetivos específicos.

Agentspace

Esta plataforma foi introduzida como o hub central para implantar, gerenciar e conectar um ecossistema diversificado de agentes. As novidades incluem:

Integração com o navegador Chrome (permitindo pesquisa em dados corporativos diretamente na barra de pesquisa)
Agent Gallery para descoberta de agentes pré-construídos
Agent Designer no-code para criação personalizada
Acesso a novos agentes do Google, como Deep Research e Idea Generation

Agent Development Kit (ADK)

Para acelerar a criação de agentes, o Google lançou o ADK, um framework de código aberto que cobre todo o ciclo de vida de desenvolvimento e implantação de sistemas de agentes únicos e múltiplos. A empresa destacou a simplicidade do framework, alegando que um agente pode ser criado com menos de 100 linhas de código.

Protocolo Agent2Agent (A2A)

Um dos anúncios mais estratégicos foi o protocolo A2A, um padrão aberto projetado para permitir que agentes de IA, independentemente da tecnologia ou plataforma em que foram construídos, se comuniquem, troquem informações de forma segura e coordenem ações sobre aplicações empresariais. Mais de 50 empresas, incluindo nomes como Atlassian, Box, Deloitte, MongoDB, Salesforce, ServiceNow e UiPath, já estão colaborando com o Google neste padrão.

Infraestrutura de Próxima Geração para IA

A capacidade de treinar modelos massivos e executar inferências em escala exige uma infraestrutura computacional poderosa e eficiente. O Google Cloud Next 2025 apresentou avanços significativos nesta área.

TPUs Ironwood (7ª Geração)

O anúncio mais destacado foi o Ironwood, a sétima geração dos TPUs do Google. Representando um salto significativo em relação à geração anterior (Trillium), o Ironwood oferece:

Um desempenho de 42.5 exaflops por pod
Um aumento de mais de 10x em relação à geração anterior
Uma melhoria de 2x na performance por watt
Configurações que podem escalar até 9.216 chips
Otimizações específicas para a "Era da Inferência"

Sua disponibilidade está prevista para o final de 2025.

Parceria NVIDIA e Roadmap de GPUs

O Google Cloud reafirmou sua forte parceria com a NVIDIA, anunciando a adoção da plataforma Blackwell (GPUs B200 e GB200). As novas VMs A4 e A4X serão baseadas nessas GPUs. Além disso, o Google se comprometeu a ser um dos primeiros provedores de nuvem a oferecer as GPUs de próxima geração da NVIDIA, Vera Rubin.

Cloud Wide Area Network (Cloud WAN)

Um anúncio significativo foi o lançamento do Cloud WAN. Este serviço gerenciado torna a extensa rede privada global do Google (com mais de 2 milhões de milhas de cabos terrestres e submarinos e mais de 200 pontos de presença) acessível a empresas para modernizar suas redes WAN. O Google alega que o Cloud WAN pode proporcionar melhorias de até 40% no desempenho da rede e reduções semelhantes no custo total de propriedade.

Google Unified Security: Segurança Integrada na Era da IA

Diante de um cenário de ameaças cibernéticas cada vez mais complexo, o Google Cloud respondeu com o lançamento do Google Unified Security (GUS).

Esta plataforma convergente integra diversas capacidades de segurança do Google em uma única solução, incluindo:

Visibilidade abrangente
Detecção avançada de ameaças
Operações de segurança (SecOps) potencializadas por IA
Red-teaming virtual contínuo
Segurança de navegador empresarial
A expertise em inteligência de ameaças da Mandiant

Um diferencial chave do GUS é a incorporação de IA nas Operações de Segurança, com novos agentes de segurança para automatizar e aprimorar as respostas a incidentes:

Agente de Triagem de Alertas: Realiza investigações dinâmicas sobre alertas de segurança para determinar sua criticidade e contexto.
Agente de Análise de Malware: Investiga a segurança de códigos e arquivos suspeitos.

Google Workspace: Produtividade Potencializada por IA

O Google Workspace continua a ser um veículo chave para levar os benefícios da IA a milhões de usuários finais. A integração do Gemini se aprofundou, tornando-se um componente padrão de todas as assinaturas e gerando um volume massivo de assistências de IA (mais de 2 bilhões por mês).

Novas funcionalidades específicas potencializadas por IA incluem:

"Help Me Analyze" no Sheets: Uma ferramenta que utiliza IA para analisar dados em planilhas, identificar tendências e gerar insights automaticamente.
Docs Audio Overview: Capacidade de gerar automaticamente resumos em áudio ou versões em estilo podcast de documentos do Google Docs.
Google Workspace Flows: Introdução de fluxos de trabalho agênticos que permitem aos usuários automatizar tarefas repetitivas e otimizar processos envolvendo múltiplos aplicativos do Workspace.
Melhorias no Vids: O aplicativo de criação de vídeo receberá integração com a geração de imagens do Veo 2, permitindo incorporar elementos visuais gerados por IA nos vídeos de trabalho.

Conclusão: O Futuro da IA na Nuvem

O Google Cloud Next 2025 marcou um ponto de inflexão na evolução da inteligência artificial e da computação em nuvem. A transição para a "Era da Inferência", caracterizada por agentes de IA autônomos e proativos, sinaliza uma nova fase de maturidade para esta tecnologia.

Para as empresas, estas inovações representam oportunidades sem precedentes para:

Automatizar processos complexos através de agentes de IA especializados
Desenvolver aplicações multimídia avançadas com os novos modelos generativos
Melhorar a segurança cibernética com detecção e resposta potencializadas por IA
Aumentar a produtividade dos colaboradores com as novas capacidades do Workspace
Otimizar a infraestrutura de TI com as soluções de computação e rede de próxima geração

À medida que avançamos em 2025, a visão do Google de uma IA operacionalizada e integrada em todos os aspectos dos negócios está se tornando realidade. As organizações que conseguirem adotar estas tecnologias de forma estratégica estarão bem posicionadas para liderar a próxima onda de transformação digital.

Google Cloud Next 2025: A Era da Inferência e o Futuro da IA na Nuvem

A Era da Inferência: Um Novo Paradigma para a IA