No momento, você está visualizando O modelo de IA da Odyssey transforma o vídeo em mundos interativos

O modelo de IA da Odyssey transforma o vídeo em mundos interativos

A AI Lab, com sede em Londres, a Odyssey lançou uma prévia de pesquisa de um modelo de transformação de vídeo em mundos interativos. Inicialmente, concentrando -se nos modelos mundiais de produção de filmes e jogos, a equipe Odyssey tropeçou em um meio de entretenimento potencialmente completamente novo.

O vídeo interativo gerado pelo modelo de IA da Odyssey responde às entradas em tempo real. Você pode interagir com ele usando o teclado, telefone, controlador ou, eventualmente, comandos de voz. O pessoal da Odyssey está cobrando como uma “versão inicial do holodeck”.

A IA subjacente pode gerar quadros de vídeo de aparência realista a cada 40 milissegundos. Isso significa que, quando você pressiona um botão ou faz um gesto, o vídeo responde quase instantaneamente: criando a ilusão de que você está realmente influenciando esse mundo digital.

“A experiência hoje parece explorar um sonho falhado – cheio, instável, mas inegavelmente novo”, de acordo com Odyssey. Não estamos falando de visuais polidos e de qualidade de jogo AAA aqui, pelo menos ainda não.

Não é a sua tecnologia de vídeo padrão

Vamos ficar um pouco técnicos por um momento. O que torna essa tecnologia de vídeo interativa gerada pela IA diferente de, digamos, um videogame padrão ou CGI? Tudo se resume a algo que a Odyssey chama de “modelo mundial”.

Ao contrário dos modelos de vídeo tradicionais que geram clipes inteiros de uma só vez, os modelos mundiais de trabalho de quadro a quadro para prever o que deve vir a seguir com base no estado atual e em qualquer entrada do usuário. É semelhante ao que os grandes modelos de linguagem prevêem a próxima palavra em uma sequência, mas infinitamente mais complexos, porque estamos falando de quadros de vídeo de alta resolução, em vez de palavras.

“Um modelo mundial é, em sua essência, um modelo de dinâmica condicionado à ação”, como a Odyssey coloca. Cada vez que você interage, o modelo leva o estado atual, sua ação e a história do que aconteceu, gera o próximo quadro de vídeo de acordo.

O resultado é algo que parece mais orgânico e imprevisível do que um jogo tradicional. Não há lógica pré-programada dizendo “Se um jogador faz x, então você acontece”-em vez de a IA, está dando melhor palpite no que deve acontecer a seguir, com base no que aprendeu ao assistir a inúmeros vídeos.

Odyssey enfrenta desafios históricos com vídeo gerado pela IA

Construir algo assim não é exatamente uma caminhada no parque. Um dos maiores obstáculos com o vídeo interativo gerado pela IA é mantê-lo estável ao longo do tempo. Quando você gera cada quadro com base nos anteriores, pequenos erros podem se compor rapidamente (um fenômeno AI pesquisadores chamam de “deriva”.)

Para enfrentar isso, a Odyssey usou o que eles denominam um “modelo de distribuição estreita”-pré-treinamento essencialmente sua IA em imagens gerais de vídeo e, em seguida, ajustá-lo em um conjunto menor de ambientes. Essa troca significa menos variedade, mas melhor estabilidade, para que tudo não se torne uma bagunça bizarra.

A empresa diz que já está fazendo “progresso rápido” em seu modelo de próxima geração, que aparentemente mostra “uma gama mais rica de pixels, dinâmicos e ações”.

Correr toda essa tecnologia de IA sofisticada em tempo real não é barato. Atualmente, a infraestrutura que alimenta essa experiência custa entre 0,80 e 1,60 £ (1-2) por hora do usuário, contando com aglomerados de GPUs H100 espalhados pelos EUA e da UE.

Isso pode parecer caro para transmitir vídeo, mas é notavelmente barato em comparação com a produção de conteúdo tradicional de jogos ou filmes. E a Odyssey espera que esses custos caam ainda mais à medida que os modelos se tornem mais eficientes.

Vídeo interativo: o próximo meio de narrativa?

Ao longo da história, as novas tecnologias deram à luz a novas formas de narrativa – de pinturas de cavernas a livros, fotografia, rádio, cinema e videogames. O Odyssey acredita que o vídeo interativo gerado pela IA é o próximo passo nesta evolução.

Se eles estiverem certos, podemos estar olhando para o protótipo de algo que transformará entretenimento, educação, publicidade e muito mais. Imagine vídeos de treinamento em que você pode praticar as habilidades sendo ensinadas ou experiências de viagem onde você pode explorar destinos do seu sofá.

A visualização da pesquisa disponível agora é obviamente apenas um pequeno passo em direção a essa visão e mais uma prova de conceito do que um produto acabado. No entanto, é um vislumbre intrigante com o que pode ser possível quando os mundos gerados pela IA se tornarem playgrounds interativos, em vez de apenas experiências passivas.

Você pode experimentar a visualização da pesquisa aqui.

Veja também: Telegram e Xai Forge Grok AI Deal

Deseja aprender mais sobre IA e Big Data dos líderes do setor? Confira Ai & Big Data Expo Ocorrendo em Amsterdã, Califórnia e Londres. O evento abrangente é co-localizado com outros eventos principais, incluindo Conferência de Automação InteligenteAssim, BlockxAssim, Semana de Transformação Digitale Cyber ​​Security & Cloud Expo.

Explore outros próximos eventos de tecnologia corporativa e webinars alimentados pela TechForge aqui.

Créditos Autor

Deixe um comentário