O Google revelou sua mais recente ferramenta de IA de geração de vídeo, chamada Veo, em seu evento ao vivo Google I/O 2024 . O Veo é descrito como oferecendo “consistência, qualidade e resolução de saída aprimoradas” em comparação com os modelos anteriores – e é um dos anúncios mais intrigantes do programa Google I/O deste ano .
Gerar conteúdo de vídeo com IA não é novidade; ferramentas como Synthesia, Colossyan e Lumiere já existem há algum tempo, aproveitando a onda da popularidade atual da IA generativa. Veo é apenas a oferta mais recente, mas promete oferecer uma experiência de geração de vídeo mais avançada do que nunca.
Para apresentar o Veo, o Google recrutou uma gangue de engenheiros de software e criativos de filmes, liderados pelo ator, músico, escritor e diretor Donald Glover (famoso em Community e Atlanta ) para produzirem juntos um curta-metragem. O filme não foi exibido no I/O, mas o Google promete que “chegará em breve”.
Como alguém que ao mesmo tempo duvida da IA generativa nas artes e também é um grande fã do trabalho de Glover ( Awaken, My Love! está entre meus cinco melhores álbuns pessoais de todos os tempos), estou cautelosamente animado para vê-lo.
Olho espião
Glover elogia as capacidades do Veo com base na velocidade: isso não é uma exclusão de ideias humanas, mas sim uma ferramenta que pode ser utilizada por criativos para “cometer erros mais rápido”, como diz Glover.
A flexibilidade da leitura imediata do Veo é um ponto chave aqui. É capaz de entender prompts em formato de texto, imagem ou vídeo, prestando atenção a detalhes importantes como estilo cinematográfico, posicionamento da câmera (por exemplo, uma foto panorâmica ou de rastreamento rápido), tempo decorrido na câmera e iluminação tipos. Ele também possui uma capacidade aprimorada de renderizar objetos de maneira precisa e consistente e como eles interagem com o ambiente.
O CEO do Google DeepMind, Demis Hassabis, demonstrou isso com um clipe de um carro acelerando por uma cidade cyberpunk distópica.
Também pode ser usado para storyboards e edição, aumentando potencialmente o trabalho dos cineastas existentes. Enquanto trabalhava com Glover, o cientista pesquisador do Google DeepMind, Kory Mathewson, explica como a Veo permite que os criativos “visualizem coisas em uma escala de tempo dez ou cem vezes mais rápida do que antes”, acelerando o processo criativo usando IA generativa para fins de planejamento.
Veo será lançado como parte de uma nova ferramenta experimental chamada VideoFX, que estará disponível em breve para testadores beta no Google Labs.