Polygon MeshUma representação 3D que consiste em vértices, arestas e faces (normalmente triângulos ou quadrantes) que definem a superfície de um objeto 3D. As malhas são a representação padrão em computação gráfica e podem representar com eficiência superfícies complexas com vários níveis de detalhe.
VoxelUm pixel volumétrico – o equivalente 3D de um pixel 2D. As representações Voxel dividem o espaço 3D em uma grade regular de células cúbicas, cada uma armazenando propriedades como ocupação ou cor. Simples de processar, mas consome muita memória em altas resoluções.
UV MappingO processo de projetar uma textura de imagem 2D na superfície de um modelo 3D. As coordenadas UV (U e V são os eixos da textura 2D) definem como cada ponto na superfície 3D é mapeado para um ponto na imagem da textura 2D.
Normal VectorUm vetor perpendicular a uma superfície em um determinado ponto. As normais de superfície são essenciais para cálculos de iluminação, detecção de colisões e compreensão da orientação da superfície em geometria 3D.
Depth MapUma imagem 2D onde cada valor de pixel representa a distância da câmera ao ponto correspondente na cena. Os mapas de profundidade unem imagens 2D e geometria 3D e podem ser capturados por câmeras RGB-D ou estimados a partir de imagens padrão.
Volumetric RenderingUma técnica para renderizar dados 3D lançando raios através de um volume e acumulando valores de cor e opacidade ao longo de cada raio. Usado pelo NeRF e outros métodos de renderização neural para gerar imagens a partir de representações 3D aprendidas.
Signed Distance Function (SDF)Função matemática que retorna a distância mais curta de qualquer ponto no espaço até a superfície mais próxima, com o sinal indicando se o ponto está dentro (negativo) ou fora (positivo) do objeto. Os SDFs fornecem uma representação implícita poderosa para formas 3D.
Multi-View ReconstructionO processo de reconstrução de um modelo 3D a partir de múltiplas fotografias 2D tiradas de diferentes pontos de vista. As técnicas variam desde a clássica Estrutura do Movimento até métodos neurais modernos como NeRF.
CAD ModelModelo de design auxiliado por computador - uma representação matemática precisa de um objeto 3D criado usando software de design. Os modelos CAD utilizam superfícies paramétricas e geometria sólida, oferecendo especificações exatas utilizadas em engenharia e fabricação.
TextureUma imagem 2D aplicada à superfície de um modelo 3D para adicionar detalhes visuais, como cores, padrões ou propriedades de superfície, como rugosidade e refletividade, sem aumentar a complexidade geométrica.
LiDARLight Detection and Ranging - uma tecnologia de sensoriamento remoto que mede distâncias iluminando um alvo com luz laser e medindo os pulsos refletidos. LiDAR produz nuvens de pontos de alta resolução de ambientes do mundo real.
Implicit Neural RepresentationUm método de representação de formas ou cenas 3D como funções contínuas parametrizadas por redes neurais, em vez de estruturas de dados discretas como malhas ou voxels. A rede aprende a mapear coordenadas para propriedades como ocupação ou cor.
Shape EmbeddingUma representação vetorial compacta de uma forma 3D em um espaço de recursos aprendido, capturando as propriedades geométricas e semânticas essenciais do objeto. Os embeddings de formas permitem pesquisa, classificação e geração de similaridade de objetos 3D.
Gaussian SplattingUma técnica de representação de cena 3D que modela uma cena como uma coleção de primitivas gaussianas 3D, cada uma com posição, covariância, opacidade e cor. Ele permite a renderização de cenas complexas em tempo real e de alta qualidade por meio de rasterização eficiente.
PhotogrammetryA ciência de fazer medições a partir de fotografias para reconstruir modelos 3D de objetos ou ambientes do mundo real. A fotogrametria moderna usa algoritmos de visão computacional para combinar automaticamente recursos nas imagens e triangular posições 3D.
Marching CubesUm algoritmo para extrair uma superfície de malha poligonal de um campo escalar tridimensional (como uma função de distância com sinal ou grade de voxel). Ele processa o campo cubo por cubo, determinando quais arestas a superfície cruza e gerando triângulos de acordo.
SketchfabUma importante plataforma online para publicação, compartilhamento e descoberta de conteúdo 3D, VR e AR. O Objaverse foi obtido principalmente do Sketchfab, que hospeda milhões de modelos 3D enviados por artistas, designers e entusiastas da digitalização 3D.
Ray CastingUma técnica para determinar quais objetos em uma cena 3D são visíveis traçando raios da câmera através de cada pixel na cena. A fundição de raios é usada em NeRF e renderização volumétrica para amostrar densidade e cor ao longo de cada caminho de raio.
Text-to-3D GenerationA tarefa de criar um objeto ou cena 3D a partir de uma descrição de texto em linguagem natural. Métodos como DreamFusion, Magic3D e Point-E usam combinações de modelos de difusão condicionados por texto e representações 3D para gerar conteúdo 3D a partir de prompts de texto.
Occupancy NetworkUma representação neural implícita que mapeia uma coordenada 3D para uma probabilidade de ocupação (se o ponto está dentro ou fora de um objeto). As redes de ocupação podem representar formas complexas com resolução arbitrária sem exigir grades de voxels discretas.
Shape CompletionA tarefa de prever a forma 3D completa de um objeto a partir de uma observação parcial, como uma única varredura de profundidade ou uma nuvem de pontos parcial. Modelos de aprendizagem profunda treinados em conjuntos de dados 3D como Objaverse e ShapeNet podem aprender a inferir geometria ausente.
PointNetUma arquitetura pioneira de aprendizagem profunda projetada para processar diretamente dados não ordenados de nuvens de pontos. PointNet usa perceptrons multicamadas compartilhados e uma operação simétrica de pooling máximo para obter invariância de permutação, permitindo classificação e segmentação 3D diretamente de conjuntos de pontos.
Mesh DecimationO processo de redução do número de polígonos em uma malha 3D preservando ao mesmo tempo sua forma geral e aparência visual. Isto é importante para otimizar modelos 3D para renderização em tempo real, exibição na web e armazenamento eficiente em conjuntos de dados em grande escala.
Objaverse-XLUma versão expandida do Objaverse contendo mais de 10 milhões de objetos 3D provenientes de múltiplas plataformas, incluindo Sketchfab, Thingiverse, GitHub e Smithsonian, tornando-o o maior conjunto de dados 3D aberto.
DreamFusionUm método de geração de texto para 3D do Google que usa um modelo de difusão de texto para imagem pré-treinado para otimizar uma representação NeRF, permitindo a criação de objetos 3D a partir de descrições de texto sem dados de treinamento 3D.
Zero-1-to-3Um método para gerar novas visualizações de um objeto a partir de uma única imagem, treinada em dados do Objaverse, permitindo a reconstrução 3D a partir de apenas uma fotografia.
ShapeNetUm conjunto de dados de formas 3D em grande escala e ricamente anotado contendo 51.300 modelos 3D exclusivos cobrindo 55 categorias de objetos comuns, amplamente utilizado como referência em pesquisas de aprendizagem profunda em 3D.
Triplane RepresentationUma representação 3D compacta que codifica uma cena 3D usando três planos de recursos ortogonais (XY, XZ, YZ), permitindo geração e renderização 3D eficientes com backbones de rede neural 2D.
Multi-View StereoUma técnica para reconstruir a geometria 3D a partir de múltiplas fotografias sobrepostas, encontrando pontos correspondentes nas vistas e triangulando suas posições 3D.
Mesh SimplificationAlgoritmos que reduzem a contagem de polígonos de uma malha 3D enquanto preservam sua aparência visual, importantes para armazenamento e renderização eficientes de conjuntos de dados 3D em grande escala.
Cap3DUm método para gerar automaticamente descrições de texto detalhadas (legendas) para objetos 3D no Objaverse, permitindo pesquisa baseada em texto e treinamento de geração de texto para 3D.
Point-EUm modelo OpenAI que gera nuvens de pontos 3D a partir de descrições de texto, treinado em um grande conjunto de dados de pares texto-3D, permitindo a criação rápida de conteúdo 3D a partir de linguagem natural.
Radiance FieldUma função contínua que mapeia coordenadas 3D e direções de visualização para valores de cor e densidade, representando a aparência de uma cena de qualquer ponto de vista. NeRF é a implementação mais conhecida.
Digital TwinUma réplica virtual de um objeto físico, processo ou sistema que é atualizado em tempo real com dados do sensor. Conjuntos de dados 3D como o Objaverse ajudam a criar gêmeos digitais mais realistas e diversificados.
Implicit SurfaceUma superfície 3D definida como o conjunto de nível zero de uma função contínua, em vez de vértices e faces explícitas. Superfícies neurais implícitas como DeepSDF e redes de ocupação se enquadram nesta categoria.
3D ReconstructionO processo de criação de um modelo 3D a partir de observações 2D, como fotografias, mapas de profundidade ou dados de sensores. Os métodos variam desde a clássica estrutura do movimento até técnicas modernas de reconstrução neural.
View SynthesisGerar novas visualizações de uma cena a partir de pontos de vista que não foram capturados pelas câmeras. NeRF e Gaussian Splatting se destacam nessa tarefa, aprendendo representações contínuas de cenas 3D.
Texture SynthesisGeração automática de imagens de textura para superfícies 3D, seja estendendo amostras de texturas ou usando IA para criar texturas a partir de descrições de texto. Importante para renderização realista de objetos 3D gerados.
Watertight MeshUma malha poligonal que forma uma superfície completa e fechada, sem furos ou lacunas. Malhas estanques são necessárias para muitas operações, como impressão 3D, operações booleanas e consultas internas/externas.
Level of Detail (LOD)Uma técnica para gerenciar a complexidade usando diferentes resoluções de malha dependendo da distância de visualização. Objetos distantes da câmera usam malhas simplificadas, enquanto objetos próximos usam versões com muitos detalhes.
Scene GraphUma representação estruturada de uma cena 3D que descreve objetos, seus atributos (cor, material, forma) e relacionamentos (em cima, próximo a, dentro). Os gráficos de cena permitem a compreensão semântica e a geração de ambientes 3D.
Neural Signed Distance FunctionUma rede neural treinada para gerar a distância sinalizada de qualquer ponto 3D até a superfície mais próxima, fornecendo uma representação implícita contínua e diferenciável de formas 3D.
NeRF in the WildUma extensão do NeRF que lida com coleções de fotos irrestritas com iluminação, exposição e oclusores transitórios variados, permitindo a reconstrução 3D de fotografias turísticas.