Καθώς το Διαδίκτυο έχει εξελιχθεί και η συνδεσιμότητα μαζί με αυτό, τα γραφικά γίνονται όλο και περισσότερο το βασικό στοιχείο που ξεχωρίζει και τραβάει την προσοχή των χρηστών στις συνεχώς πολυάσχολες ροές κοινωνικής δικτύωσης.
Αυτό ξεκίνησε με στατικές εικόνες, στη συνέχεια μεταφέρθηκε σε GIF και τώρα το βίντεο είναι ο πιο συναρπαστικός τύπος περιεχομένου. Αλλά στην ουσία, χρειάζεστε πραγματικά ελκυστικά, ενδιαφέροντα γραφικά για να σταματήσετε τους ανθρώπους να κάνουν κύλιση, κάτι που, ως επί το πλείστον, είναι πολύ πιο αποτελεσματικό από το να προσπαθείτε να τους πιάσετε με έναν τίτλο ή ένα πνευματώδες one-liner.
Αυτός είναι ο λόγος για τον οποίο αυτό είναι ενδιαφέρον – σήμερα, η Google περιέγραψε το τελευταίο της Διαδικασία δημιουργίας τρισδιάστατης εικόνας που ονομάζεται ‘LOLNeRF(ναι, πραγματικά), το οποίο είναι σε θέση υπολογίστε με ακρίβεια τη δομή 3D από μεμονωμένες εικόνες 2D.
Υπάρχουν πολλές περιπτώσεις όπου θα ήταν χρήσιμο να γνωρίζουμε την τρισδιάστατη δομή από μία μόνο εικόνα, αλλά αυτό είναι γενικά δύσκολο ή αδύνατο. Διαβάστε σχετικά με ένα πλαίσιο που μαθαίνει να μοντελοποιεί τρισδιάστατη δομή και εμφάνιση από συλλογές εικόνων μίας προβολής → https://t.co/h4xpWBwbaA pic.twitter.com/mQnq8ZMKFM
— Google AI (@GoogleAI) 13 Σεπτεμβρίου 2022
Όπως μπορείτε να δείτε σε αυτά τα παραδείγματα, το LOLNeRF η διαδικασία μπορεί να λάβει την κανονική, 2D εικόνα σας και να τη μετατρέψει σε οθόνη 3D.
Το οποίο το Facebook προσφέρει επίσης μια έκδοση εδώ και αρκετό καιρό, αλλά η νέα διαδικασία LOLNeRF είναι ένα πολύ πιο προηγμένο μοντέλο, που επιτρέπει μεγαλύτερο βάθος και διαδραστικότητα, χωρίς την ανάγκη κατανόησης και λήψης πλήρους τρισδιάστατων μοντέλων.
Όπως εξηγείται από Google:
“Σε “LOLNeRF: Learn from One Look”, προτείνουμε ένα πλαίσιο που μαθαίνει να μοντελοποιεί τρισδιάστατη δομή και εμφάνιση από συλλογές μονής όψης εικόνες. Το LOLNeRF μαθαίνει την τυπική τρισδιάστατη δομή μιας κατηγορίας αντικειμένων, όπως αυτοκίνητα, ανθρώπινα πρόσωπα ή γάτες, αλλά μόνο από ενιαίες όψεις για οποιοδήποτε αντικείμενο, ποτέ το ίδιο αντικείμενο δύο φορές».
Η διαδικασία είναι σε θέση να προσομοιώνει το χρώμα και την πυκνότητα για κάθε σημείο του τρισδιάστατου χώρου, χρησιμοποιώντας οπτικά «ορόσημα» στην εικόνα, με βάση τη μηχανική μάθηση – ουσιαστικά αναπαράγοντας όσα γνωρίζει το σύστημα από παρόμοιες εικόνες.
«Κάθε μία από αυτές τις 2D προβλέψεις αντιστοιχεί σε ένα σημασιολογικά συνεπές σημείο στο αντικείμενο (π.χ. στην άκρη της μύτης ή στις γωνίες των ματιών). Στη συνέχεια, μπορούμε να εξαγάγουμε ένα σύνολο κανονικών τρισδιάστατων τοποθεσιών για τα σημασιολογικά σημεία, μαζί με εκτιμήσεις των θέσεων της κάμερας για κάθε εικόνα, έτσι ώστε η προβολή των κανονικών σημείων στις εικόνες να είναι όσο το δυνατόν συνεπής με τα 2D ορόσημα.”
Από αυτό, η διαδικασία είναι σε θέση να αποδώσει πιο ακριβή, πολυδιάστατα γραφικά από μια ενιαία, στατική πηγή, η οποία θα μπορούσε να έχει μια σειρά εφαρμογών, από τέχνη AR έως εκτεταμένη δημιουργία αντικειμένων σε VR και τον μελλοντικό μετασύνδρομο χώρο.
Πράγματι, εάν αυτή η διαδικασία είναι σε θέση να δημιουργήσει με ακρίβεια τρισδιάστατες απεικονίσεις ενός ευρέος φάσματος 2D εικόνων, αυτό θα μπορούσε να επιταχύνει σημαντικά την ανάπτυξη τρισδιάστατων αντικειμένων που θα βοηθήσουν στη δημιουργία μετασυμπαντικών κόσμων. Η ιδέα του μετασύμπαντος είναι ότι θα μπορεί να διευκολύνει σχεδόν κάθε αλληλεπίδραση και εμπειρία στην πραγματική ζωή, αλλά για να γίνει αυτό, χρειάζεται τρισδιάστατα μοντέλα αντικειμένων του πραγματικού κόσμου, από όλο το φάσμα, ως υλικό πηγής για να τροφοδοτήσει αυτό το νέο δημιουργική προσέγγιση.
Τι θα γινόταν αν μπορούσατε απλώς να τροφοδοτήσετε έναν κατάλογο εικόνων ιστού σε ένα σύστημα και, στη συνέχεια, να το ρίξετε σε 3D ισοδύναμα, για χρήση σε διαφημίσεις, προωθήσεις, διαδραστικές εμπειρίες κ.λπ.;
Υπάρχει μια σειρά από τρόπους που θα μπορούσε να χρησιμοποιηθεί και θα είναι ενδιαφέρον να δούμε αν η Google είναι σε θέση να μεταφράσει τη διαδικασία LOLNerf σε πιο πρακτικές, προσβάσιμες επιλογές χρήσης για τις δικές της φιλοδοξίες AR και VR.