Craig Barritt/Getty Images
Acessibilidade
Para a maioria das pessoas, o boom da IA se desenrolou em uma tela. Ferramentas como ChatGPT, Claude e Copilot transformaram a forma como escrevemos e-mails, resumimos documentos, escrevemos códigos e nos comunicamos. Mas, embora a IA generativa tenha mudado a maneira como trabalhamos, ela ainda não remodelou o mundo físico onde ocorre a maior parte da atividade econômica.
Fei-Fei Li, conhecida como “a madrinha da inteligência artificial, acredita que isso está prestes a mudar. A professora de Stanford, e uma das vozes mais influentes em IA no mundo, argumenta que a próxima era da inteligência artificial não será definida por chatbots, e sim por sistemas que compreendem e atuam no mundo real. Li chama essa próxima geração de IA de “inteligência espacial”, e sua nova venture, a World Labs, aposta que ela irá desbloquear a próxima grande onda de valor industrial e econômico.
Quando a IA sai da tela
Uma IA com consciência espacial não espera por um comando. Ela prevê como as condições vão evoluir, inspeciona e redireciona o que for preciso. Imagine um hospital em um país com inverno rigoroso. Um modelo proposto pela World Labs antecipa gargalos, simula cenários de escala de profissionais, reorganiza leitos e direciona robôs autônomos que entregam medicamentos. Não se trata apenas de análise de dados; é coordenação em tempo real.
Esse é o tipo de cenário que Li vislumbra, e a base da missão da World Labs. Ao lado dos cofundadores Justin Johnson, Christoph Lassner e Ben Mildenhall, todos nomes influentes no setor de tecnologia, ela está desenvolvendo modelos que compreendem objetos, movimento, causa e efeito e restrições físicas. Em outras palavras, os ingredientes da realidade.
O primeiro produto da empresa, Marble, oferece um vislumbre inicial de como a inteligência espacial funciona. Basta fornecer uma curta descrição em texto e ele gera um ambiente 3D explorável. A experiência se parece menos com “comandar” uma IA e mais com entrar em um mundo criado sob demanda.
Máquinas com intuição?
Os LLMs (Large Language Models, ou grandes modelos de linguagem em português) dominam as manchetes, mas a maior parte da economia global opera em locais que os modelos de linguagem não conseguem ver — fábricas, armazéns, campos, hospitais, redes de energia e canteiros de obras.
Esses ambientes são regidos pela física, pelo tempo e pela incerteza. Os humanos compreendem isso de forma intuitiva porque passamos a vida navegando nesses espaços. As máquinas não. Como Li costuma destacar, os humanos são “agentes incorporados” — aprendemos por meio do movimento, da interação e das consequências. Sistemas de IA treinados apenas em texto carecem desse vínculo com o mundo físico, criando uma lacuna entre o que podem descrever e o que realmente conseguem fazer.
Os modelos de mundo criados por Li buscam fechar essa lacuna ao dar às máquinas uma intuição sobre como o mundo funciona.
Como os modelos de mundo realmente funcionam
Nesse novo paradigma, a IA não é definida pela linguagem, mas pelo espaço. Pense na diferença assim: modelos de linguagem leem textos e preveem a próxima palavra. Modelos de mundo observam vídeos e imagens e aprendem a recriar espaços 3D completos a partir de qualquer ângulo. Eles são treinados com imagens, vídeos e dados sobre profundidade, iluminação, materiais e o comportamento físico dos objetos.
A principal inovação é que esses modelos não achatam informações 3D em 2D, como faz a maioria das IAs. Em vez disso, eles mantêm uma compreensão tridimensional real do espaço, semelhante à forma como nossos próprios cérebros mapeiam o mundo ao nosso redor.
Por exemplo, quando você pede a um modelo de mundo que mostre o chão de uma fábrica sob outro ângulo ou simule o que acontece ao reorganizar equipamentos, ele preserva as leis da física e as relações espaciais. Essa consistência é o que os torna ferramentas confiáveis para planejamento, simulação e tomada de decisão no mundo real, e não apenas demonstrações tecnológicas impressionantes.
Como isso transforma os negócios
As implicações para as empresas são significativas. As companhias poderão modelar decisões antes de colocá-las em prática, reduzindo riscos e acelerando a execução. Uma linha de produção pode ser redesenhada digitalmente antes que qualquer equipamento seja movido. Uma rede logística pode ser testada virtualmente antes que caminhões ou contêineres sejam redirecionados. Hospitais podem simular o fluxo de pacientes antes de ajustar equipes ou capacidade. Construtoras podem explorar centenas de variações de design antes de comprometer materiais.
Em todos esses casos, a tomada de decisão se torna mais informada e menos reativa. Em vez de construir primeiro e ajustar depois, as organizações poderão explorar possibilidades em um ambiente virtual, onde erros não têm custo e os aprendizados se acumulam rapidamente.
Os mercados para essa tecnologia são gigantescos, com uma escala de oportunidade comparável aos primeiros dias da computação em nuvem, da mobilidade e da internet comercial.
Por dentro do Marble e do mundo da IA incorporada
Uma das principais aplicações dos modelos de mundo é a chamada “IA incorporada” — a camada de inteligência por trás de robôs, drones, veículos autônomos e automação industrial. Hoje, esses sistemas aprendem lentamente porque o treinamento no mundo real é caro e sujeito a erros.
Os modelos de mundo mudam essa equação ao oferecer às máquinas um ambiente seguro e rico para aprender milhares de horas de comportamento. O Marble, produto de estreia da World Labs, já está sendo usado para gerar cenários virtuais e ambientes 3D em horas, em vez de semanas.
Mas Li enxerga um precursor de capacidades muito mais amplas: modelar instalações antes da construção, testar estratégias operacionais antes da implementação, ensaiar cenários de segurança antes de incidentes e projetar experiências do cliente antes de investimentos físicos. Em cada caso, a inteligência espacial se torna a ponte entre o planejamento digital e a execução física.
Fei-Fei Li defende uso da IA a serviço da humanidade
A cada avanço em IA liderado por Fei-Fei Li, seu trabalho retorna ao mesmo princípio: inteligência só tem valor quando serve à humanidade. E, à medida que os modelos de mundo empurram a IA das palavras para o mundo físico, esse princípio se torna a verdadeira vantagem competitiva.
Na visão de Li, a próxima era da inovação não será vencida por empresas que simplesmente implementarem modelos maiores. Será vencida por líderes que compreenderem que o poder da IA (e seus riscos) cresce junto com seu alcance.
A cientista aposta que a inteligência espacial irá redefinir como as indústrias operam, como projetamos e construímos e como respondemos aos desafios mais complexos do mundo. Mas ela também é clara sobre algo que o Vale do Silício frequentemente esquece: o futuro da IA não está predeterminado. Ele depende das escolhas que fazemos.
Se os modelos de mundo cumprirem o que prometem, eles não apenas ajudarão as máquinas a entender nosso mundo. Eles nos ajudarão a redesenhá-lo com mais visão de futuro, mais capacidade e, se escolhermos com sabedoria, mais humanidade.