🔬

objaverse-3d-explorer

An interactive educational simulator that enables users to explore and understand large-scale 3D object datasets like Objaverse. Users can browse 3D models, learn about point clouds, neural radiance fields (NeRF), and modern 3D generation techniques, gaining hands-on experience with the data that powers cutting-edge 3D computer vision and generative AI research.

🔬 अभी आज़माएं

यह क्या है?

🎯 सिम्युलेटर टिप्स

📚 शब्दावली

Polygon Mesh
शीर्षों, किनारों और चेहरों (आमतौर पर त्रिकोण या चतुर्भुज) से युक्त एक 3डी प्रतिनिधित्व जो एक 3डी वस्तु की सतह को परिभाषित करता है। मेश कंप्यूटर ग्राफिक्स में मानक प्रतिनिधित्व हैं और विवरण के विभिन्न स्तरों के साथ जटिल सतहों का कुशलतापूर्वक प्रतिनिधित्व कर सकते हैं।
Voxel
एक वॉल्यूमेट्रिक पिक्सेल - 2डी पिक्सेल का 3डी समकक्ष। वॉक्सेल प्रतिनिधित्व 3डी स्पेस को क्यूबिक कोशिकाओं के एक नियमित ग्रिड में विभाजित करता है, प्रत्येक अधिभोग या रंग जैसे गुणों को संग्रहीत करता है। प्रोसेस करने में आसान लेकिन उच्च रिज़ॉल्यूशन पर मेमोरी-गहन।
UV Mapping
3डी मॉडल की सतह पर 2डी छवि बनावट को प्रक्षेपित करने की प्रक्रिया। यूवी निर्देशांक (यू और वी 2डी बनावट की धुरी हैं) परिभाषित करते हैं कि कैसे 3डी सतह पर प्रत्येक बिंदु 2डी बनावट छवि पर एक बिंदु पर मैप करता है।
Normal Vector
किसी दिए गए बिंदु पर सतह पर लंबवत एक वेक्टर। प्रकाश गणना, टकराव का पता लगाने और 3डी ज्यामिति में सतह अभिविन्यास को समझने के लिए सतही मानक आवश्यक हैं।
Depth Map
एक 2डी छवि जहां प्रत्येक पिक्सेल मान कैमरे से दृश्य में संबंधित बिंदु तक की दूरी को दर्शाता है। गहराई के नक्शे 2डी छवियों और 3डी ज्यामिति को जोड़ते हैं और इन्हें आरजीबी-डी कैमरों द्वारा कैप्चर किया जा सकता है या मानक छवियों से अनुमान लगाया जा सकता है।
Volumetric Rendering
किसी आयतन के माध्यम से किरणें डालकर और प्रत्येक किरण के साथ रंग और अस्पष्टता मान जमा करके 3डी डेटा प्रस्तुत करने की एक तकनीक। सीखे गए 3डी अभ्यावेदन से छवियां उत्पन्न करने के लिए एनईआरएफ और अन्य तंत्रिका प्रतिपादन विधियों द्वारा उपयोग किया जाता है।
Signed Distance Function (SDF)
एक गणितीय फ़ंक्शन जो अंतरिक्ष में किसी भी बिंदु से निकटतम सतह तक की सबसे छोटी दूरी लौटाता है, जिसमें संकेत होता है कि बिंदु वस्तु के अंदर (नकारात्मक) या बाहर (सकारात्मक) है। एसडीएफ 3डी आकृतियों के लिए एक शक्तिशाली अंतर्निहित प्रतिनिधित्व प्रदान करते हैं।
Multi-View Reconstruction
विभिन्न दृष्टिकोणों से ली गई कई 2डी तस्वीरों से 3डी मॉडल के पुनर्निर्माण की प्रक्रिया। तकनीकें शास्त्रीय संरचना-से-गति से लेकर एनईआरएफ जैसी आधुनिक तंत्रिका विधियों तक होती हैं।
CAD Model
कंप्यूटर-एडेड डिज़ाइन मॉडल - डिज़ाइन सॉफ़्टवेयर का उपयोग करके बनाई गई 3D ऑब्जेक्ट का सटीक गणितीय प्रतिनिधित्व। सीएडी मॉडल पैरामीट्रिक सतहों और ठोस ज्यामिति का उपयोग करते हैं, जो इंजीनियरिंग और विनिर्माण में उपयोग की जाने वाली सटीक विशिष्टताओं की पेशकश करते हैं।
Texture
ज्यामितीय जटिलता को बढ़ाए बिना रंग, पैटर्न, या सतह के गुणों जैसे खुरदरापन और परावर्तन जैसे दृश्य विवरण जोड़ने के लिए 3डी मॉडल की सतह पर लागू की गई 2डी छवि।
LiDAR
लाइट डिटेक्शन एंड रेंजिंग - एक रिमोट सेंसिंग तकनीक जो लेजर प्रकाश के साथ लक्ष्य को रोशन करके और परावर्तित दालों को मापकर दूरियों को मापती है। LiDAR वास्तविक दुनिया के वातावरण के उच्च-रिज़ॉल्यूशन बिंदु बादल पैदा करता है।
Implicit Neural Representation
3डी आकृतियों या दृश्यों को मेश या वोक्सल्स जैसी अलग डेटा संरचनाओं के बजाय तंत्रिका नेटवर्क द्वारा पैरामीटरयुक्त निरंतर कार्यों के रूप में प्रस्तुत करने की एक विधि। नेटवर्क अधिभोग या रंग जैसी संपत्तियों के निर्देशांक को मैप करना सीखता है।
Shape Embedding
सीखे गए फीचर स्पेस में 3डी आकार का एक कॉम्पैक्ट वेक्टर प्रतिनिधित्व, ऑब्जेक्ट के आवश्यक ज्यामितीय और अर्थ संबंधी गुणों को कैप्चर करता है। आकार एम्बेडिंग समानता खोज, वर्गीकरण और 3डी वस्तुओं के निर्माण को सक्षम बनाता है।
Gaussian Splatting
एक 3डी दृश्य प्रतिनिधित्व तकनीक जो एक दृश्य को 3डी गाऊसी आदिमों के संग्रह के रूप में प्रस्तुत करती है, जिनमें से प्रत्येक स्थिति, सहप्रसरण, अस्पष्टता और रंग के साथ होता है। यह कुशल रेखांकन के माध्यम से जटिल दृश्यों की वास्तविक समय, उच्च गुणवत्ता वाली प्रस्तुति को सक्षम बनाता है।
Photogrammetry
वास्तविक दुनिया की वस्तुओं या वातावरण के 3डी मॉडल के पुनर्निर्माण के लिए तस्वीरों से माप बनाने का विज्ञान। आधुनिक फोटोग्रामेट्री छवियों में सुविधाओं का स्वचालित रूप से मिलान करने और 3डी स्थितियों को त्रिकोणित करने के लिए कंप्यूटर विज़न एल्गोरिदम का उपयोग करती है।
Marching Cubes
त्रि-आयामी अदिश क्षेत्र (जैसे एक हस्ताक्षरित दूरी फ़ंक्शन या वोक्सेल ग्रिड) से बहुभुज जाल सतह निकालने के लिए एक एल्गोरिदम। यह फ़ील्ड क्यूब को क्यूब द्वारा संसाधित करता है, यह निर्धारित करता है कि सतह किन किनारों को पार करती है और तदनुसार त्रिकोण उत्पन्न करती है।
Sketchfab
3डी, वीआर और एआर सामग्री को प्रकाशित करने, साझा करने और खोजने के लिए एक प्रमुख ऑनलाइन मंच। ओब्जैवर्स मुख्य रूप से स्केचफैब से लिया गया था, जो कलाकारों, डिजाइनरों और 3डी स्कैनिंग उत्साही लोगों द्वारा अपलोड किए गए लाखों 3डी मॉडल होस्ट करता है।
Ray Casting
दृश्य में प्रत्येक पिक्सेल के माध्यम से कैमरे से किरणों का पता लगाकर यह निर्धारित करने की एक तकनीक कि 3डी दृश्य में कौन सी वस्तुएं दिखाई दे रही हैं। प्रत्येक किरण पथ के साथ घनत्व और रंग का नमूना लेने के लिए एनईआरएफ और वॉल्यूमेट्रिक प्रतिपादन में रे कास्टिंग का उपयोग किया जाता है।
Text-to-3D Generation
प्राकृतिक भाषा के पाठ विवरण से 3डी वस्तु या दृश्य बनाने का कार्य। ड्रीमफ्यूजन, मैजिक3डी और प्वाइंट-ई जैसी विधियां टेक्स्ट प्रॉम्प्ट से 3डी सामग्री उत्पन्न करने के लिए टेक्स्ट-कंडीशंड डिफ्यूजन मॉडल और 3डी अभ्यावेदन के संयोजन का उपयोग करती हैं।
Occupancy Network
एक तंत्रिका निहित प्रतिनिधित्व जो अधिभोग संभावना (चाहे बिंदु किसी वस्तु के अंदर या बाहर हो) के लिए 3डी समन्वय को मैप करता है। ऑक्यूपेंसी नेटवर्क अलग-अलग वोक्सल ग्रिड की आवश्यकता के बिना मनमाने रिज़ॉल्यूशन के साथ जटिल आकृतियों का प्रतिनिधित्व कर सकते हैं।
Shape Completion
आंशिक अवलोकन से किसी वस्तु के पूर्ण 3डी आकार की भविष्यवाणी करने का कार्य, जैसे एकल गहराई स्कैन या आंशिक बिंदु बादल। ओब्जावर्स और शेपनेट जैसे 3डी डेटासेट पर प्रशिक्षित डीप लर्निंग मॉडल लापता ज्यामिति का अनुमान लगाना सीख सकते हैं।
PointNet
एक अग्रणी गहन शिक्षण वास्तुकला जिसे अव्यवस्थित बिंदु क्लाउड डेटा को सीधे संसाधित करने के लिए डिज़ाइन किया गया है। प्वाइंटनेट क्रमपरिवर्तन अपरिवर्तनीयता प्राप्त करने के लिए साझा मल्टी-लेयर परसेप्ट्रोन और एक सममित अधिकतम-पूलिंग ऑपरेशन का उपयोग करता है, जो सीधे बिंदु सेट से 3 डी वर्गीकरण और विभाजन को सक्षम करता है।
Mesh Decimation
किसी 3डी जाल के समग्र आकार और दृश्य स्वरूप को संरक्षित करते हुए उसमें बहुभुजों की संख्या कम करने की प्रक्रिया। वास्तविक समय प्रतिपादन, वेब डिस्प्ले और बड़े पैमाने पर डेटासेट में कुशल भंडारण के लिए 3डी मॉडल को अनुकूलित करने के लिए यह महत्वपूर्ण है।
Objaverse-XL
ओब्जावर्स का एक विस्तारित संस्करण जिसमें स्केचफैब, थिंगविवर्स, गिटहब और स्मिथसोनियन सहित कई प्लेटफार्मों से प्राप्त 10 मिलियन से अधिक 3डी ऑब्जेक्ट शामिल हैं, जो इसे सबसे बड़ा खुला 3डी डेटासेट बनाता है।
DreamFusion
Google द्वारा एक टेक्स्ट-टू-3डी जेनरेशन विधि जो एनईआरएफ प्रतिनिधित्व को अनुकूलित करने के लिए पूर्व-प्रशिक्षित टेक्स्ट-टू-इमेज प्रसार मॉडल का उपयोग करती है, जो 3डी प्रशिक्षण डेटा के बिना टेक्स्ट विवरण से 3डी ऑब्जेक्ट निर्माण को सक्षम करती है।
Zero-1-to-3
एक छवि से किसी वस्तु के नए दृश्य उत्पन्न करने की एक विधि, ओब्जैवर्स डेटा पर प्रशिक्षित, केवल एक तस्वीर से 3 डी पुनर्निर्माण को सक्षम करना।
ShapeNet
3D आकृतियों का एक समृद्ध-एनोटेटेड, बड़े पैमाने पर डेटासेट जिसमें 51,300 अद्वितीय 3D मॉडल शामिल हैं, जो 55 सामान्य ऑब्जेक्ट श्रेणियों को कवर करते हैं, व्यापक रूप से 3D गहन शिक्षण अनुसंधान में एक बेंचमार्क के रूप में उपयोग किया जाता है।
Triplane Representation
एक कॉम्पैक्ट 3D प्रतिनिधित्व जो तीन ऑर्थोगोनल फ़ीचर प्लेन (XY, XZ, YZ) का उपयोग करके 3D दृश्य को एन्कोड करता है, जो कुशल 3D पीढ़ी को सक्षम करता है और 2D न्यूरल नेटवर्क बैकबोन के साथ प्रतिपादन करता है।
Multi-View Stereo
दृश्यों के बीच संगत बिंदुओं को ढूंढकर और उनकी 3डी स्थितियों को त्रिकोणित करके कई ओवरलैपिंग तस्वीरों से 3डी ज्यामिति का पुनर्निर्माण करने की एक तकनीक।
Mesh Simplification
एल्गोरिदम जो 3डी जाल की दृश्य उपस्थिति को संरक्षित करते हुए उसकी बहुभुज संख्या को कम करते हैं, बड़े पैमाने पर 3डी डेटासेट के कुशल भंडारण और प्रतिपादन के लिए महत्वपूर्ण हैं।
Cap3D
ओब्जावर्स में 3डी ऑब्जेक्ट के लिए स्वचालित रूप से विस्तृत टेक्स्ट विवरण (कैप्शन) उत्पन्न करने की एक विधि, टेक्स्ट-आधारित खोज और टेक्स्ट-टू-3डी पीढ़ी प्रशिक्षण को सक्षम करना।
Point-E
एक ओपनएआई मॉडल जो पाठ विवरण से 3डी बिंदु क्लाउड उत्पन्न करता है, पाठ-3डी जोड़े के एक बड़े डेटासेट पर प्रशिक्षित होता है, जो प्राकृतिक भाषा से तेजी से 3डी सामग्री निर्माण को सक्षम बनाता है।
Radiance Field
एक सतत फ़ंक्शन जो 3डी समन्वय और रंग और घनत्व मानों को देखने की दिशाओं को मैप करता है, जो किसी भी दृष्टिकोण से दृश्य की उपस्थिति का प्रतिनिधित्व करता है। एनईआरएफ सबसे प्रसिद्ध कार्यान्वयन है।
Digital Twin
किसी भौतिक वस्तु, प्रक्रिया या सिस्टम की एक आभासी प्रतिकृति जिसे सेंसर डेटा के साथ वास्तविक समय में अद्यतन किया जाता है। ओब्जैवर्स जैसे 3डी डेटासेट अधिक यथार्थवादी और विविध डिजिटल जुड़वाँ बनाने में मदद करते हैं।
Implicit Surface
एक 3डी सतह को स्पष्ट शीर्षों और चेहरों के बजाय एक सतत फ़ंक्शन के शून्य-स्तरीय सेट के रूप में परिभाषित किया गया है। डीपएसडीएफ और अधिभोग नेटवर्क जैसी तंत्रिका संबंधी अंतर्निहित सतहें इस श्रेणी में आती हैं।
3D Reconstruction
फोटोग्राफ, गहराई मानचित्र या सेंसर डेटा जैसे 2डी अवलोकनों से 3डी मॉडल बनाने की प्रक्रिया। विधियाँ शास्त्रीय संरचना-से-गति से लेकर आधुनिक तंत्रिका पुनर्निर्माण तकनीकों तक होती हैं।
View Synthesis
उन दृष्टिकोणों से किसी दृश्य के नए दृश्य उत्पन्न करना जो कैमरों द्वारा कैद नहीं किए गए थे। एनईआरएफ और गॉसियन स्प्लैटिंग निरंतर 3डी दृश्य प्रतिनिधित्व सीखकर इस कार्य में उत्कृष्टता प्राप्त करते हैं।
Texture Synthesis
3डी सतहों के लिए स्वचालित रूप से बनावट छवियां उत्पन्न करना, या तो नमूना बनावट का विस्तार करके या पाठ विवरण से बनावट बनाने के लिए एआई का उपयोग करना। उत्पन्न 3डी वस्तुओं के यथार्थवादी प्रतिपादन के लिए महत्वपूर्ण।
Watertight Mesh
एक बहुभुज जाल जो छेद या अंतराल के बिना एक पूर्ण, बंद सतह बनाता है। 3डी प्रिंटिंग, बूलियन ऑपरेशंस और अंदर/बाहरी प्रश्नों जैसे कई कार्यों के लिए वॉटरटाइट जाल की आवश्यकता होती है।
Level of Detail (LOD)
देखने की दूरी के आधार पर विभिन्न जाल रिज़ॉल्यूशन का उपयोग करके जटिलता को प्रबंधित करने की एक तकनीक। कैमरे से दूर की वस्तुएं सरलीकृत जाल का उपयोग करती हैं, जबकि पास की वस्तुएं उच्च-विस्तार संस्करणों का उपयोग करती हैं।
Scene Graph
वस्तुओं, उनकी विशेषताओं (रंग, सामग्री, आकार), और संबंधों (ऊपर, बगल में, अंदर) का वर्णन करने वाले 3डी दृश्य का एक संरचित प्रतिनिधित्व। दृश्य ग्राफ़ अर्थ संबंधी समझ और 3डी वातावरण तैयार करने में सक्षम बनाते हैं।
Neural Signed Distance Function
एक तंत्रिका नेटवर्क को किसी भी 3डी बिंदु से निकटतम सतह तक हस्ताक्षरित दूरी को आउटपुट करने के लिए प्रशिक्षित किया जाता है, जो 3डी आकृतियों का निरंतर और अलग-अलग अंतर्निहित प्रतिनिधित्व प्रदान करता है।
NeRF in the Wild
एनईआरएफ का एक विस्तार जो अलग-अलग प्रकाश व्यवस्था, एक्सपोज़र और क्षणिक अवरोधों के साथ अप्रतिबंधित फोटो संग्रह को संभालता है, जिससे पर्यटक तस्वीरों से 3डी पुनर्निर्माण सक्षम होता है।

🏆 प्रमुख व्यक्ति

Matt Deitke (2023)

एलन इंस्टीट्यूट फॉर एआई (एआई2) के प्रमुख शोधकर्ता, जिन्होंने अनुसंधान के लिए उपलब्ध एनोटेटेड 3डी ऑब्जेक्ट्स का सबसे बड़ा ओपन-सोर्स डेटासेट स्थापित करते हुए, ओब्जैवर्स और ओब्जावर्स-एक्सएल बनाया। ओब्जावर्स में 800,000 से अधिक ऑब्जेक्ट हैं और ओब्जावर्स-एक्सएल स्केल 10 मिलियन से अधिक हैं।

Ben Mildenhall (2020)

यूसी बर्कले और गूगल रिसर्च में न्यूरल रेडियंस फील्ड्स (एनईआरएफ) के सह-निर्माता। एनईआरएफ ने वॉल्यूमेट्रिक दृश्य गुणों को एन्कोड करने के लिए तंत्रिका नेटवर्क का उपयोग करके 3 डी दृश्य प्रतिनिधित्व के लिए एक क्रांतिकारी दृष्टिकोण पेश किया, जिससे विरल तस्वीरों से फोटोरिअलिस्टिक उपन्यास दृश्य संश्लेषण सक्षम हो गया।

Angel Chang (2015)

शेपनेट के सह-निर्माता, सबसे शुरुआती और सबसे प्रभावशाली बड़े पैमाने के 3डी मॉडल रिपॉजिटरी में से एक, जिसने 51,300 3डी मॉडल को समृद्ध एनोटेशन के साथ 55 सामान्य श्रेणियों में व्यवस्थित किया। उन्होंने वास्तविक दुनिया की 3डी समझ के लिए स्कैननेट में भी योगदान दिया।

Charles Qi (2017)

स्टैनफोर्ड में पॉइंटनेट और पॉइंटनेट++ का आविष्कार किया गया, जिससे वर्गीकरण और विभाजन के लिए 3डी पॉइंट क्लाउड डेटा को सीधे संसाधित करने में सक्षम पहला गहन शिक्षण आर्किटेक्चर बनाया गया।

Bernhard Kerbl (2023)

INRIA में सह-निर्मित 3डी गॉसियन स्प्लैटिंग, एनईआरएफ के एक कुशल विकल्प के रूप में सीखने योग्य गॉसियन प्रिमिटिव का उपयोग करके 3डी दृश्यों के वास्तविक समय के फोटोरिअलिस्टिक रेंडरिंग को सक्षम करता है।

Alexei Efros (2003)

यूसी बर्कले में दृश्य प्रतिनिधित्व सीखने में अग्रणी, छवि संश्लेषण, शैली हस्तांतरण और दृश्य समझ पर मूलभूत कार्य में योगदान दिया, जिसने 2डी छवियों से आधुनिक 3डी पीढ़ी को सक्षम किया।

🎓 शिक्षण संसाधन

💬 शिक्षार्थियों के लिए संदेश

{'encouragement': 'The world around us is three-dimensional, yet for decades, AI has primarily learned to understand it through flat, 2D images. The emergence of large-scale 3D datasets like Objaverse, combined with powerful techniques like NeRF and Gaussian Splatting, is finally enabling AI to truly perceive and create in three dimensions.', 'reminder': "Every expert was once a beginner. The most important step is the first one - and you've already taken it by being here.", 'action': "Explore the simulator! Try different settings, experiment freely, and don't be afraid to make mistakes - that's how the best learning happens.", 'dream': 'Perhaps a 3D artist in Nairobi will use AI to generate entire virtual worlds. Perhaps a student in Karachi will build AR tools that bring education to life. 3D AI is a canvas for global creativity.', 'wiaVision': 'WIA Book believes 3D creation tools should be free for everyone. From Seoul to Lagos, from Kabul to Buenos Aires - the power to build virtual worlds is yours. Free forever.'}

शुरू करें

मुफ़्त, साइनअप नहीं

शुरू करें →