Η Meta κάνει ένα μεγάλο βήμα προς την επόμενη γενιά τεχνητής νοημοσύνης, παρουσιάζοντας το V-JEPA 2, ένα νέο «παγκόσμιο μοντέλο» σχεδιασμένο για να βοηθά τις μηχανές να αντιλαμβάνονται, να προβλέπουν και να δρουν μέσα στον φυσικό κόσμο.

Σε αντίθεση με τα γλωσσικά μοντέλα που κυριαρχούν σήμερα, το νέο αυτό σύστημα επικεντρώνεται στην κατανόηση της κίνησης, της αλληλεπίδρασης και της λογικής του τρισδιάστατου περιβάλλοντος -μια κρίσιμη εξέλιξη για εφαρμογές όπως η ρομποτική και τα αυτόνομα οχήματα.

Ο τεχνολογικός γίγαντας, στον οποίο ανήκουν οι δημοφιλείς εφαρμογές κοινωνικής δικτύωσης Facebook και Instagram, δήλωσε ότι το νέο μοντέλο τεχνητής νοημοσύνης ανοιχτού κώδικα V-JEPA 2 μπορεί να κατανοήσει, να προβλέψει και να σχεδιάσει στον φυσικό κόσμο. Γνωστά ως μοντέλο κόσμου, τα συστήματα αυτά εμπνέονται από τη λογική του φυσικού κόσμου για να δημιουργήσουν μια εσωτερική προσομοίωση της πραγματικότητας, επιτρέποντας στην AI να μαθαίνει, να σχεδιάζει και να λαμβάνει αποφάσεις με τρόπο που μοιάζει περισσότερο με τον ανθρώπινο.

Για παράδειγμα, στην περίπτωση του νέου μοντέλου της Meta, το V-JEPA 2 μπορεί να αναγνωρίσει ότι μια μπάλα που κυλάει από ένα τραπέζι θα πέσει ή ότι ένα αντικείμενο που είναι κρυμμένο από το οπτικό πεδίο δεν έχει απλώς εξαφανιστεί.

Η τεχνητή νοημοσύνη αποτελεί στρατηγική προτεραιότητα για τον διευθύνοντα σύμβουλο της Meta, Μαρκ Ζούκερμπεργκ, καθώς η εταιρεία εντείνει τις προσπάθειές της για να ανταγωνιστεί κολοσσούς όπως η OpenAI, η Microsoft και η Google.

Τεχνητή Νοημοσύνη AI

Όπως αναφέρει το CNBC, η Meta πρόκειται να επενδύσει 14 δισεκατομμύρια δολάρια στην εταιρεία τεχνητής νοημοσύνης Scale AI και να προσλάβει τον διευθύνοντα σύμβουλό της Alexandr Wang για να ενισχύσει τη στρατηγική της για την τεχνητή νοημοσύνη.

Η Meta ανέδειξε τις δυνατότητες του νέου μοντέλου V-JEPA 2 σε εφαρμογές όπως τα ρομπότ διανομής και τα αυτοκινούμενα οχήματα, τα οποία απαιτούν σε πραγματικό χρόνο κατανόηση του περιβάλλοντός τους προκειμένου να κινούνται με ασφάλεια και ακρίβεια στον φυσικό κόσμο.

Σε αντίθεση με άλλα μοντέλα που βασίζονται σε τεράστιες ποσότητες ετικετοποιημένων δεδομένων ή βίντεο, το V-JEPA 2 λειτουργεί μέσα σε έναν απλουστευμένο “λανθάνοντα” χώρο, όπου αναλύει και κατανοεί τον τρόπο με τον οποίο τα αντικείμενα κινούνται, αλληλεπιδρούν και αντιδρούν, σύμφωνα με τη Meta.

«Το να επιτρέπουμε στις μηχανές να κατανοούν τον φυσικό κόσμο είναι πολύ διαφορετικό από το να τους επιτρέπουμε να κατανοούν τη γλώσσα», δήλωσε ο Yann LeCunn, επικεφαλής επιστήμονας Τεχνητής Νοημοσύνης της Meta.

«Ένα παγκόσμιο μοντέλο είναι κάτι σαν ένα αφηρημένο ψηφιακό δίδυμο της πραγματικότητας, στο οποίο μπορεί να ανατρέξει μια τεχνητή νοημοσύνη για να κατανοήσει τον κόσμο και να προβλέψει τις συνέπειες των ενεργειών της και επομένως θα είναι σε θέση να σχεδιάσει μια πορεία δράσης για την εκπλήρωση μιας δεδομένης εργασίας», πρόσθεσε.

Το επόμενο μεγάλο πράγμα στην Τεχνητή Νοημοσύνη;

Τεχνητή νοημοσύνη

Τα παγκόσμια μοντέλα έχουν συγκεντρώσει έντονο ενδιαφέρον στην ερευνητική κοινότητα της τεχνητής νοημοσύνης, καθώς οι επιστήμονες στρέφονται πλέον πέρα από τα μεγάλα γλωσσικά μοντέλα -όπως το ChatGPT της OpenAI και το Gemini της Google- αναζητώντας τρόπους να κατανοήσουν και να προσομοιώσουν τον φυσικό κόσμο.

Τον Σεπτέμβριο του περασμένου έτους, ο κορυφαίος ερευνητής ΤΝ Fei-Fei Li συγκέντρωσε 230 εκατομμύρια δολάρια για μια νέα startup με την ονομασία World Labs, η οποία στοχεύει στη δημιουργία αυτού που αποκαλεί «μεγάλα μοντέλα κόσμου» που μπορούν να κατανοήσουν καλύτερα τη δομή του φυσικού κόσμου.

Εντωμεταξύ, η μονάδα DeepMind της Google αναπτύσσει ένα δικό της μοντέλο κόσμου με την ονομασία Genie, το οποίο, όπως λέει, μπορεί να προσομοιώνει παιχνίδια και τρισδιάστατα περιβάλλοντα σε πραγματικό χρόνο.