Google explica como usou o Gemini para produzir o I/O 2026: vídeo, design e interatividade

2/junho/2026

O Google detalhou os bastidores de como sua equipe utilizou o Gemini e outras ferramentas próprias para conceber e executar o Google I/O 2026 de ponta a ponta. Do curta-metragem exibido na abertura à identidade visual do evento, passando por instalações musicais e experiências jogáveis em tempo real, a companhia mostrou um pipeline criativo moldado por modelos generativos e fluxos de trabalho multimodais.

A divulgação evidencia uma mudança prática: a IA deixou de ser apenas tema de conferência e passou a ser motor de produção. Equipes de design, vídeo, música e engenharia operaram em conjunto com modelos como Gemini Omni, Lyria 3 e soluções experimentais internas, acelerando iterações e ampliando o leque de possibilidades sem abrir mão de curadoria humana.

O resultado é um panorama concreto de como ferramentas generativas podem atuar no ciclo criativo: ideação, prototipagem, produção e acabamento, com integrações que vão do desktop ao hardware embarcado, e do estúdio ao campus do evento.

Filmagem e pós-produção: o curta “TPU Training Day”

Para o filme “TPU Training Day”, a equipe adotou um processo híbrido que combinou manipulação física (puppetry) e 3D simples com uma etapa de estilização e acabamento conduzida por modelos. Os fotogramas foram estilizados com o modelo interno Nano Banana, enquanto o Gemini Omni e outros modelos experimentais auxiliaram na composição e polimento final.

Essa abordagem uniu direção de arte tradicional e inferência gerativa para transformar cenas brutas em material final com consistência estética. O uso de modelos na etapa de pós-produção permitiu testar variações visuais de maneira mais rápida, mantendo a direção criativa como norte.

Identidade visual e diretrizes de marca do I/O 2026

A identidade do I/O 2026 — marcada por um degradê de quatro cores e iconografia evolutiva — também passou por ciclos de iteração com modelos do ecossistema Gemini e o Nano Banana. A prática de gerar múltiplas versões com consistência de linguagem facilitou a convergência para um sistema visual coeso, aplicável a palcos, telões, materiais editoriais e ativos digitais.

Ao testar composições, paletas e formas com suporte generativo, a equipe ganhou agilidade para validar hipóteses de design e produzir insumos prontos para diferentes formatos, mantendo uma assinatura gráfica reconhecível ao longo de toda a experiência do evento.

Experiências imersivas e conteúdo ao vivo

“Jellectronica”: medusas que viram música

Na instalação “Jellectronica”, o movimento de medusas-lua foi convertido em som em tempo real. Para isso, a detecção foi realizada por um modelo YOLO8 rodando em Coral NPU. Os dados alimentaram uma trilha musical construída com Flow Music e Lyria 3 Pro, num exemplo de pipeline que atravessa visão computacional, processamento local e geração de áudio.

O resultado é uma performance sensorial em que o comportamento orgânico das criaturas marinhas guia a música, reforçando a ideia de que modelos generativos podem reagir a sinais do mundo físico para compor experiências audiovisuais ao vivo.

“Infinite Scaler”: jogo com níveis gerados na hora

Outra peça do pré-show, o “Infinite Scaler”, levou a geração procedural a um contexto jogável. Os níveis eram criados on the fly combinando o Nano Banana com a Gemini API/Canvas, enquanto a trilha sonora foi produzida pelo Lyria 3. A integração reforça o uso de múltiplos modelos para coordenar conteúdo visual e sonoro responsivo, mantendo ritmo e estética coerentes.

Do app ao copo: o pop-up Antigravity Coffee Co.

No campus, o Antigravity Coffee Co. apresentou um aplicativo de latte com interface generativa, criado com Flutter, A2UI, Gemini Enterprise Agent Platform e infraestrutura Firebase/Cloud. Participantes puderam desenhar bebidas e até montar suas próprias versões do app, explorando fluxos de UI que se adaptam ao contexto e às preferências.

O projeto mostra uma via prática para agentes e interfaces que se moldam a tarefas, combinando componentes de front-end multiplataforma com serviços de nuvem e modelos de linguagem/ação. Além da experiência lúdica, a configuração ilustra como times de produto podem prototipar rapidamente interações centradas no usuário.

Artefatos criativos e “delight” para o público

Os cards de palestrantes foram gerados a partir de um pipeline que envolveu Nano Banana Pro, Gemini Omni e Google Flow (incluindo Veo), resultando em peças consistentes e personalizadas para cada sessão. No local, um jogo de prompts com tempo criava adesivos que eram impressos na hora para os participantes, unindo engajamento e recordação física.

Esse conjunto de microexperiências ilustra a aplicação de modelos generativos tanto na produção de ativos institucionais quanto em momentos de surpresa e diversão, mantendo a identidade do evento presente em diferentes pontos de contato.

O que muda para equipes criativas e de produto

Os exemplos reunidos apontam para alguns padrões que tendem a se consolidar em pipelines criativos:

Coautoria humano-modelo: direção e critérios editoriais seguem no centro, enquanto modelos aceleram variações e refinam acabamentos.
Multimodalidade real: texto, imagem, vídeo, áudio e sinais do mundo físico (como movimento capturado) se combinam em experiências unificadas.
Iteração rápida com consistência: sistemas visuais e sonoros podem ser explorados em larga escala sem perder a assinatura do projeto.
Do laboratório ao evento: modelos rodam em nuvem, desktop e hardware dedicado, permitindo peças reativas e ao vivo.

Para desenvolvedores, designers e produtores, o caso do I/O 2026 funciona como prova de conceito abrangente: é possível integrar modelos e ferramentas em trilhas paralelas — audiovisual, identidade, jogos, instalações e apps — e convergir tudo em uma narrativa coerente. O foco passa a ser orquestrar bem as etapas, definir critérios de qualidade e garantir que a curadoria humana direcione as decisões finais.

No conjunto, o material divulgado demonstra que modelos generativos já podem atuar como infraestrutura criativa. Quando combinados a frameworks de interface, serviços de nuvem e execução local, eles abrem espaço para experiências responsivas e personalizadas, com ganhos reais de velocidade e controle de versão.

Ao compartilhar esse bastidor, o Google oferece um mapa prático de como alinhar ferramentas de linguagem, visão, áudio e vídeo em um mesmo ecossistema de produção. É um roteiro útil para times que buscam trazer conteúdo generativo para o centro do processo, sem perder diretriz editorial e identidade de marca.

Fonte: https://blog.google/innovation-and-ai/technology/ai/io-2026-google-ai/