Please enable JavaScript.
Coggle requires JavaScript to display documents.
EgoThink - Coggle Diagram
EgoThink
Principais Capacidades
-
-
-
Raciocínio: Inclui contagem, comparação e raciocínio situado.
-
-
Experimentos
-
Resultados
GPT-4V se destacou, mas ainda há espaço para melhorias.
Principal Objetivo
Avaliar a capacidade dos modelos de visão-linguagem (VLMs) de "pensar" a partir de uma perspectiva em primeira pessoa.
Fonte de Dados
Vídeos egocêntricos do Ego4D, com imagens extraídas e anotadas manualmente.
-