objaverse-3d-explorer

Apa ini?

🎯 Tips Simulator

📚 Glosarium

Polygon Mesh

Representasi 3D yang terdiri dari simpul, tepi, dan permukaan (biasanya segitiga atau segi empat) yang menentukan permukaan objek 3D. Jerat adalah representasi standar dalam grafik komputer dan secara efisien dapat mewakili permukaan kompleks dengan berbagai tingkat detail.

Voxel

Piksel volumetrik - setara dengan piksel 2D dalam 3D. Representasi voxel membagi ruang 3D menjadi kotak sel kubik biasa, masing-masing menyimpan properti seperti hunian atau warna. Sederhana untuk diproses tetapi memakan banyak memori pada resolusi tinggi.

UV Mapping

Proses memproyeksikan tekstur gambar 2D ke permukaan model 3D. Koordinat UV (U dan V adalah sumbu tekstur 2D) menentukan bagaimana setiap titik pada permukaan 3D dipetakan ke suatu titik pada gambar tekstur 2D.

Normal Vector

Suatu vektor yang tegak lurus terhadap suatu permukaan pada suatu titik tertentu. Normal permukaan sangat penting untuk perhitungan pencahayaan, deteksi tabrakan, dan pemahaman orientasi permukaan dalam geometri 3D.

Depth Map

Gambar 2D yang setiap nilai pikselnya mewakili jarak dari kamera ke titik terkait dalam pemandangan. Peta kedalaman menjembatani gambar 2D dan geometri 3D dan dapat ditangkap oleh kamera RGB-D atau diperkirakan dari gambar standar.

Volumetric Rendering

Sebuah teknik untuk merender data 3D dengan mentransmisikan sinar melalui volume dan mengumpulkan nilai warna dan opasitas di sepanjang setiap sinar. Digunakan oleh NeRF dan metode rendering saraf lainnya untuk menghasilkan gambar dari representasi 3D yang dipelajari.

Signed Distance Function (SDF)

Fungsi matematika yang mengembalikan jarak terpendek dari suatu titik dalam ruang ke permukaan terdekat, dengan tanda yang menunjukkan apakah titik tersebut berada di dalam (negatif) atau di luar (positif) suatu benda. SDF memberikan representasi implisit yang kuat untuk bentuk 3D.

Multi-View Reconstruction

Proses merekonstruksi model 3D dari beberapa foto 2D yang diambil dari sudut pandang berbeda. Teknik berkisar dari Struktur-dari-Gerakan klasik hingga metode saraf modern seperti NeRF.

CAD Model

Model Desain Berbantuan Komputer - representasi matematis yang tepat dari objek 3D yang dibuat menggunakan perangkat lunak desain. Model CAD menggunakan permukaan parametrik dan geometri padat, menawarkan spesifikasi tepat yang digunakan dalam bidang teknik dan manufaktur.

Texture

Gambar 2D yang diterapkan pada permukaan model 3D untuk menambahkan detail visual seperti warna, pola, atau properti permukaan seperti kekasaran dan reflektifitas, tanpa meningkatkan kompleksitas geometris.

LiDAR

Deteksi dan Jangkauan Cahaya - teknologi penginderaan jauh yang mengukur jarak dengan menyinari target dengan sinar laser dan mengukur pulsa yang dipantulkan. LiDAR menghasilkan point cloud beresolusi tinggi di lingkungan dunia nyata.

Implicit Neural Representation

Sebuah metode yang merepresentasikan bentuk atau pemandangan 3D sebagai fungsi berkelanjutan yang diparameterisasi oleh jaringan saraf, bukan sebagai struktur data terpisah seperti mesh atau voxel. Jaringan belajar memetakan koordinat ke properti seperti hunian atau warna.

Shape Embedding

Representasi vektor kompak dari bentuk 3D dalam ruang fitur yang dipelajari, menangkap sifat geometris dan semantik penting dari objek. Penyematan bentuk memungkinkan pencarian kesamaan, klasifikasi, dan pembuatan objek 3D.

Gaussian Splatting

Teknik representasi adegan 3D yang memodelkan adegan sebagai kumpulan primitif Gaussian 3D, masing-masing dengan posisi, kovarians, opasitas, dan warna. Ini memungkinkan rendering adegan kompleks secara real-time dan berkualitas tinggi melalui rasterisasi yang efisien.

Photogrammetry

Ilmu melakukan pengukuran dari foto untuk merekonstruksi model 3D objek atau lingkungan dunia nyata. Fotogrametri modern menggunakan algoritme visi komputer untuk secara otomatis mencocokkan fitur di seluruh gambar dan melakukan triangulasi posisi 3D.

Marching Cubes

Algoritme untuk mengekstraksi permukaan jaring poligonal dari bidang skalar tiga dimensi (seperti fungsi jarak bertanda atau kisi voxel). Ini memproses bidang kubus demi kubus, menentukan sisi mana yang dilintasi permukaan dan menghasilkan segitiga yang sesuai.

Sketchfab

Platform online utama untuk menerbitkan, berbagi, dan menemukan konten 3D, VR, dan AR. Objaverse terutama bersumber dari Sketchfab, yang menampung jutaan model 3D yang diunggah oleh seniman, desainer, dan penggemar pemindaian 3D.

Ray Casting

Sebuah teknik untuk menentukan objek mana dalam pemandangan 3D yang terlihat dengan menelusuri sinar dari kamera melalui setiap piksel ke dalam pemandangan. Pengecoran sinar digunakan dalam NeRF dan rendering volumetrik untuk kepadatan sampel dan warna di sepanjang setiap jalur sinar.

Text-to-3D Generation

Tugas membuat objek atau adegan 3D dari deskripsi teks bahasa alami. Metode seperti DreamFusion, Magic3D, dan Point-E menggunakan kombinasi model difusi terkondisi teks dan representasi 3D untuk menghasilkan konten 3D dari perintah teks.

Occupancy Network

Representasi implisit saraf yang memetakan koordinat 3D ke probabilitas hunian (apakah titik tersebut berada di dalam atau di luar objek). Jaringan okupansi dapat merepresentasikan bentuk kompleks dengan resolusi sewenang-wenang tanpa memerlukan kisi voxel terpisah.

Shape Completion

Tugas memprediksi bentuk 3D lengkap suatu objek dari pengamatan parsial, seperti pemindaian kedalaman tunggal atau sebagian titik awan. Model pembelajaran mendalam yang dilatih pada kumpulan data 3D seperti Objaverse dan ShapeNet dapat belajar menyimpulkan geometri yang hilang.

PointNet

Arsitektur pembelajaran mendalam perintis yang dirancang untuk secara langsung memproses data point cloud yang tidak berurutan. PointNet menggunakan perceptron multi-layer bersama dan operasi max-pooling simetris untuk mencapai invarian permutasi, memungkinkan klasifikasi dan segmentasi 3D langsung dari kumpulan titik.

Mesh Decimation

Proses mengurangi jumlah poligon dalam jaring 3D sambil mempertahankan keseluruhan bentuk dan tampilan visualnya. Hal ini penting untuk mengoptimalkan model 3D untuk rendering real-time, tampilan web, dan penyimpanan efisien dalam kumpulan data skala besar.

Objaverse-XL

Versi Objaverse yang diperluas berisi lebih dari 10 juta objek 3D yang bersumber dari berbagai platform termasuk Sketchfab, Thingiverse, GitHub, dan Smithsonian, menjadikannya kumpulan data 3D terbuka terbesar.

DreamFusion

Metode pembuatan teks-ke-3D oleh Google yang menggunakan model difusi teks-ke-gambar yang telah dilatih sebelumnya untuk mengoptimalkan representasi NeRF, memungkinkan pembuatan objek 3D dari deskripsi teks tanpa data pelatihan 3D.

Zero-1-to-3

Sebuah metode untuk menghasilkan tampilan baru suatu objek dari satu gambar, dilatih pada data Objaverse, memungkinkan rekonstruksi 3D hanya dari satu foto.

ShapeNet

Kumpulan data bentuk 3D berskala besar dan beranotasi kaya yang berisi 51.300 model 3D unik yang mencakup 55 kategori objek umum, banyak digunakan sebagai tolok ukur dalam penelitian pembelajaran mendalam 3D.

Triplane Representation

Representasi 3D ringkas yang mengkodekan adegan 3D menggunakan tiga bidang fitur ortogonal (XY, XZ, YZ), memungkinkan pembuatan dan rendering 3D yang efisien dengan tulang punggung jaringan saraf 2D.

Multi-View Stereo

Sebuah teknik untuk merekonstruksi geometri 3D dari beberapa foto yang tumpang tindih dengan menemukan titik-titik yang sesuai di seluruh tampilan dan melakukan triangulasi posisi 3D-nya.

Mesh Simplification

Algoritma yang mengurangi jumlah poligon jaring 3D sekaligus mempertahankan tampilan visualnya, penting untuk penyimpanan yang efisien dan rendering kumpulan data 3D skala besar.

Cap3D

Sebuah metode untuk secara otomatis menghasilkan deskripsi teks rinci (keterangan) untuk objek 3D di Objaverse, memungkinkan pencarian berbasis teks dan pelatihan pembuatan teks ke 3D.

Point-E

Model OpenAI yang menghasilkan awan titik 3D dari deskripsi teks, dilatih pada kumpulan data besar pasangan teks-3D, memungkinkan pembuatan konten 3D dengan cepat dari bahasa alami.

Radiance Field

Fungsi berkelanjutan yang memetakan koordinat 3D dan arah tampilan ke nilai warna dan kepadatan, mewakili tampilan pemandangan dari sudut pandang mana pun. NeRF adalah implementasi yang paling terkenal.

Digital Twin

Replika virtual dari objek fisik, proses, atau sistem yang diperbarui secara real-time dengan data sensor. Kumpulan data 3D seperti Objaverse membantu menciptakan digital twins yang lebih realistis dan beragam.

Implicit Surface

Permukaan 3D didefinisikan sebagai himpunan tingkat nol dari fungsi kontinu, bukan berdasarkan simpul dan permukaan secara eksplisit. Permukaan implisit saraf seperti DeepSDF dan jaringan hunian termasuk dalam kategori ini.

3D Reconstruction

Proses pembuatan model 3D dari pengamatan 2D seperti foto, peta kedalaman, atau data sensor. Metode berkisar dari struktur klasik dari gerak hingga teknik rekonstruksi saraf modern.

View Synthesis

Menghasilkan tampilan baru suatu adegan dari sudut pandang yang tidak ditangkap oleh kamera. NeRF dan Gaussian Splatting unggul dalam tugas ini dengan mempelajari representasi pemandangan 3D secara berkelanjutan.

Texture Synthesis

Secara otomatis menghasilkan gambar tekstur untuk permukaan 3D, baik dengan memperluas sampel tekstur atau menggunakan AI untuk membuat tekstur dari deskripsi teks. Penting untuk rendering objek 3D yang dihasilkan secara realistis.

Watertight Mesh

Jaring poligon yang membentuk permukaan tertutup lengkap tanpa lubang atau celah. Jaring kedap air diperlukan untuk banyak operasi seperti pencetakan 3D, operasi boolean, dan kueri dalam/luar.

Level of Detail (LOD)

Sebuah teknik untuk mengelola kompleksitas dengan menggunakan resolusi mesh yang berbeda tergantung pada jarak pandang. Objek yang jauh dari kamera menggunakan jerat yang disederhanakan, sedangkan objek di dekatnya menggunakan versi dengan detail tinggi.

Scene Graph

Representasi terstruktur dari pemandangan 3D yang mendeskripsikan objek, atributnya (warna, material, bentuk), dan hubungannya (di atas, di samping, di dalam). Grafik pemandangan memungkinkan pemahaman semantik dan pembuatan lingkungan 3D.

Neural Signed Distance Function

Jaringan saraf yang dilatih untuk mengeluarkan jarak yang ditandatangani dari titik 3D mana pun ke permukaan terdekat, memberikan representasi implisit bentuk 3D yang berkelanjutan dan dapat dibedakan.

NeRF in the Wild

Perpanjangan NeRF yang menangani koleksi foto tanpa batasan dengan berbagai pencahayaan, eksposur, dan penghalang sementara, memungkinkan rekonstruksi 3D dari foto wisata.

🏆 Tokoh Utama

Matt Deitke (2023)

Peneliti utama di Allen Institute for AI (AI2) yang menciptakan Objaverse dan Objaverse-XL, membuat kumpulan data sumber terbuka terbesar dari objek 3D beranotasi yang tersedia untuk penelitian. Objaverse berisi lebih dari 800.000 objek dan Objaverse-XL berskala lebih dari 10 juta.

Ben Mildenhall (2020)

Rekan pencipta Neural Radiance Fields (NeRF) di UC Berkeley dan Google Research. NeRF memperkenalkan pendekatan revolusioner terhadap representasi pemandangan 3D menggunakan jaringan saraf untuk menyandikan properti pemandangan volumetrik, memungkinkan sintesis tampilan baru fotorealistik dari foto-foto yang jarang.

Angel Chang (2015)

Salah satu pencipta ShapeNet, salah satu repositori model 3D berskala besar paling awal dan paling berpengaruh, yang mengatur 51.300 model 3D ke dalam 55 kategori umum dengan anotasi yang kaya. Dia juga berkontribusi pada ScanNet untuk pemahaman 3D dunia nyata.

Charles Qi (2017)

Menemukan PointNet dan PointNet++ di Stanford, menciptakan arsitektur pembelajaran mendalam pertama yang mampu memproses data cloud titik 3D secara langsung untuk klasifikasi dan segmentasi

Bernhard Kerbl (2023)

Menciptakan 3D Gaussian Splatting di INRIA, memungkinkan rendering fotorealistik real-time dari adegan 3D menggunakan primitif Gaussian yang dapat dipelajari sebagai alternatif efisien untuk NeRF

Alexei Efros (2003)

Memelopori pembelajaran representasi visual di UC Berkeley, menyumbangkan karya dasar pada sintesis gambar, transfer gaya, dan pemahaman visual yang memungkinkan generasi 3D modern dari gambar 2D

🎓 Sumber Belajar

Objaverse: A Universe of Annotated 3D Objects
Makalah asli yang memperkenalkan kumpulan data Objaverse dari 800K+ objek 3D beranotasi, menjelaskan metodologi pengumpulan, statistik kumpulan data, dan evaluasi tolok ukur.
NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
Makalah inovatif yang memperkenalkan Neural Radiance Fields, mendemonstrasikan sintesis tampilan baru fotorealistik dengan merepresentasikan pemandangan sebagai fungsi volumetrik saraf berkelanjutan.
PointNet: Deep Learning on Point Sets for 3D Classification and Segmentation
Memperkenalkan arsitektur pembelajaran mendalam pertama yang secara langsung memproses titik awan, menangani sifat kumpulan titik yang tidak berurutan melalui fungsi simetris.
3D Gaussian Splatting for Real-Time Radiance Field Rendering
Memperkenalkan 3D Gaussian Splatting sebagai alternatif efisien untuk NeRF, mencapai rendering adegan 3D berkualitas tinggi secara real-time menggunakan primitif 3D Gaussian yang dapat dipelajari.
Multiple View Geometry in Computer Vision
Buku teks definitif tentang geometri berbagai tampilan, yang mencakup konsep dasar penting untuk memahami rekonstruksi 3D dari gambar.
Computer Vision: Algorithms and Applications
Buku teks komprehensif yang mencakup visi komputer mulai dari teknik dasar hingga pendekatan pembelajaran mendalam modern, termasuk rekonstruksi dan rendering 3D.
3D Deep Learning with Python
Panduan praktis untuk menerapkan model pembelajaran mendalam untuk data 3D, yang mencakup pemrosesan point cloud, analisis mesh, dan pembuatan 3D dengan PyTorch.
NeRF: Neural Radiance Fields - Explained Visually
Penjelasan visual tentang cara kerja Neural Radiance Fields, mulai dari transmisi sinar hingga rendering volumetrik, membuat konsep inti dapat diakses oleh pemula.
Stanford CS231A: Computer Vision - 3D Reconstruction
Kursus visi komputer Stanford memberikan kuliah tentang rekonstruksi 3D, yang mencakup struktur dari gerak, penglihatan stereo, dan geometri multi-tampilan.
Two Minute Papers - 3D Gaussian Splatting
Penjelasan yang mudah diakses dan visual tentang 3D Gaussian Splatting, menunjukkan bagaimana teknik ini memungkinkan rendering adegan 3D fotorealistik secara real-time.

💬 Pesan untuk Pelajar

{'encouragement': 'The world around us is three-dimensional, yet for decades, AI has primarily learned to understand it through flat, 2D images. The emergence of large-scale 3D datasets like Objaverse, combined with powerful techniques like NeRF and Gaussian Splatting, is finally enabling AI to truly perceive and create in three dimensions.', 'reminder': "Every expert was once a beginner. The most important step is the first one - and you've already taken it by being here.", 'action': "Explore the simulator! Try different settings, experiment freely, and don't be afraid to make mistakes - that's how the best learning happens.", 'dream': 'Perhaps a 3D artist in Nairobi will use AI to generate entire virtual worlds. Perhaps a student in Karachi will build AR tools that bring education to life. 3D AI is a canvas for global creativity.', 'wiaVision': 'WIA Book believes 3D creation tools should be free for everyone. From Seoul to Lagos, from Kabul to Buenos Aires - the power to build virtual worlds is yours. Free forever.'}

Mulai

Gratis, tanpa daftar

Mulai →