Τρία μοντέλα AI κυκλοφόρησαν μέσα σε 24 ώρες με το Llama 3 της Meta να ακολουθεί
Share
Η Google, η OpenAI και η Mistral κυκλοφόρησαν νέες εκδόσεις των πρωτοποριακών μοντέλων τεχνητής νοημοσύνης τους μέσα σε μόλις 12 ώρες. Η Meta πρόκειται επίσης να συμμετάσχει στο πάρτι με το επερχόμενο μοντέλο της Llama 3, και το πολυαναμενόμενο GPT-5 της OpenAI είναι στα σκαριά. Αυτό που ξεκίνησε ως μια εξαιρετικά εξειδικευμένη κατηγορία στην οποία κυριαρχεί το ChatGPT, κατακλύζεται πλέον από εναλλακτικές λύσεις που ξεπερνούν τη Μεγάλη Τεχνολογία και το χάσμα μεταξύ ανοικτού και κλειστού κώδικα.
Google Gemini Pro 1.5
Το Gemini Pro 1.5 της Google έκανε τον πρώτο θόρυβο, εισάγοντας εξελίξεις στην κατανόηση του μακροχρόνιου πλαισίου που αμφισβητούν το Claude 3 Opus, το οποίο κατέχει την πρωτιά σε αυτή την κατηγορία.
Με τη δυνατότητα επεξεργασίας έως και 1 εκατομμυρίου tokens, το Gemini Pro 1.5 μπορεί να διαχειριστεί τεράστιες ποσότητες πληροφοριών ταυτόχρονα, συμπεριλαμβανομένων 700.000 λέξεων, μιας ώρας βίντεο ή 11 ωρών ήχου. Η αρχιτεκτονική του Mixture-of-Experts (MoE) ενισχύει την αποδοτικότητα και την απόδοση χρησιμοποιώντας εξειδικευμένα μοντέλα για συγκεκριμένες εργασίες. Το ρόστερ των μοντέλων Gemini της Google είναι αρκετά περίπλοκο, αλλά αυτό αξιολογεί το πιο ικανό μοντέλο τους για τυπικές εργασίες.
Η Google αφήνει επίσης τους προγραμματιστές να κάνουν 50 δωρεάν αιτήσεις στο API καθημερινά, κάτι που ένα άτομο στο X εκτίμησε ότι θα κόστιζε έως και 1.400 δολάρια.Επί του παρόντος, το Gemini 1.5 Pro είναι διαθέσιμο σε 180 χώρες.
Νέα έκδοση του GPT-4 Turbo
Το OpenAI κυκλοφόρησε στη συνέχεια μια νέα έκδοση, το GPT-4 Turbo, με ανώτερη επεξεργασία μαθηματικών και όρασης. Σύμφωνα με μια ανάρτηση του X, “το GPT-4 Turbo με όραμα είναι πλέον γενικά διαθέσιμο στο API. Τα αιτήματα Vision μπορούν πλέον να χρησιμοποιούν και τη λειτουργία JSON και την κλήση συναρτήσεων”.
Η OpenAI αναμένεται να κυκλοφορήσει σύντομα το GPT -5, καθώς και το μοντέλο μετατροπής κειμένου σε βίντεο Sora, το οποίο δεν έχει αξιόλογους ανταγωνιστές αυτή τη στιγμή (αν και αυτό θα αλλάξει).
Mixtral 8x22B
Ωστόσο, ίσως η μεγαλύτερη έκπληξη ήρθε από την Mistral, η οποία δημοσίευσε με τόλμη το μοντέλο Mixtral 8x22B, το οποίο μπορεί κάποιος να το κάνει λήψη ( 281GB) μέσω torrent.
Με εντυπωσιακές 176 δισεκατομμύρια παραμέτρους και μήκος πλαισίου 65.000 tokens, αυτό το μοντέλο ανοιχτού κώδικα με άδεια Apache 2.0 αναμένεται να ξεπεράσει το προηγούμενο μοντέλο Mixtral 8x7B της Mistral, το οποίο είχε ήδη ξεπεράσει ανταγωνιστές όπως το Llama 2 70B. Η προηγμένη αρχιτεκτονική MoE του Mixtral 8x22B επιτρέπει αποδοτικούς υπολογισμούς και βελτιωμένες επιδόσεις σε σχέση με τις προηγούμενες εκδόσεις.
Το Meta Llama 3 έρχεται
Οι αναφορές δείχνουν ότι η Meta θα μπορούσε να κυκλοφορήσει μια μικρή έκδοση του πολυαναμενόμενου μοντέλου Llama 3 ήδη από την επόμενη εβδομάδα, ενώ το πλήρες μοντέλο ανοιχτού κώδικα εξακολουθεί να είναι προγραμματισμένο για τον Ιούλιο. Το Llama 3 αναμένεται να κυκλοφορήσει σε διάφορα μεγέθη, από πολύ μικρά μοντέλα που θα ανταγωνίζονται το Claude Haiku ή το Gemini Nano μέχρι μεγαλύτερα, πλήρως ανταποκρινόμενα και ικανά για συλλογισμό μοντέλα που θα ανταγωνίζονται το GPT-4 ή το Claude 3 Opus.
Μοντέλο πολλαπλασιασμού
Ενώ στο παρελθον το ChatGPT ήταν ο κυρίαρχος στο χώρο της γενετικής νοημοσύνης πλεον ο χώρος είναι πλημμυρισμένος από εναλλακτικές λύσεις. Σχεδόν κάθε μεγάλη εταιρεία τεχνολογίας εμπλέκεται, είτε άμεσα είτε μέσω σημαντικών επενδύσεων. Και με κάθε παίκτη να μπαίνει στη μάχη, κάθε ελπίδα για μια παράταξη να κυριαρχήσει στην αγορά εξανεμίζεται.
Βλέπουμε τώρα επίσης να κλείνει η ψαλίδα μεταξύ των μοντέλων κλειστού κώδικα των OpenAI, Anthropic, Google κ.λπ. και των εναλλακτικών λύσεων κλειστού κώδικα των Mistral, Meta και άλλων. Τα μοντέλα ανοιχτού κώδικα είναι ακόμα αρκετά απρόσιτα στον ευρύτερο πληθυσμό, αλλά και αυτό είναι πιθανό να αλλάξει.
Και το ερώτημα που τίθεται είναι αν κάποιο από αυτά τα μοντέλα αντιπροσωπεύει πραγματική πρόοδο στη μηχανική μάθηση ή απλώς είναι όλα τα ίδια. Εξαρτάται από το ποιον θα ρωτήσετε. Ορισμένοι, όπως ο Elon Musk, προβλέπουν ότι η τεχνητή νοημοσύνη θα ξεπεράσει την ανθρώπινη νοημοσύνη μέσα σε ένα χρόνο.
Άλλοι, όπως ο επικεφαλής επιστήμονας της Meta, Yann LeCun, υποστηρίζουν ότι η τεχνητή νοημοσύνη έχει δρόμο μπροστά της. Ο LeCun εξήγησε τον Φεβρουάριο σχετικά με τα τρέχοντα LLMs: “Ότι τα τρέχοντα μοντέλα δεν μπορούν να εφεύρουν νέα πράγματα. Θα αναμασούν περίπου ό,τι εκπαιδεύτηκαν από δημόσια δεδομένα, που σημαίνει ότι μπορείτε να τα βρείτε από το Google. Οι άνθρωποι λένε: “Θεέ μου, πρέπει να ρυθμίσουμε τα LLM γιατί θα είναι τόσο επικίνδυνα”. Αυτό απλά δεν είναι αλήθεια”.
Ο διευθύνων σύμβουλος της OpenAI, Brad Lightcap, δήλωσε επίσης ότι η εταιρεία του εστιάζει στη βελτίωση της ικανότητας της τεχνητής νοημοσύνης να σκέφτεται και να χειρίζεται πιο σύνθετες εργασίες.
“Θα αρχίσουμε να βλέπουμε τεχνητή νοημοσύνη που μπορεί να αναλάβει πιο σύνθετες εργασίες με πιο εξελιγμένο τρόπο”, δήλωσε σε πρόσφατη εκδήλωση, “Νομίζω ότι με την πάροδο του χρόνου… θα δούμε τα μοντέλα να πηγαίνουν προς πιο μακροχρόνιες, κατά κάποιο τρόπο πιο σύνθετες εργασίες, και αυτό προϋποθέτει τη βελτίωση της ικανότητάς τους να συλλογίζονται”.
Καθώς το 2024 οδεύει προς το καλοκαίρι, η κοινότητα της Τεχνητής Νοημοσύνης και η κοινωνία στο σύνολό της θα παρακολουθούν στενά για να δουν ποιες πρωτοποριακές εξελίξεις θα προκύψουν από τα εργαστήρια αυτών των τεχνολογικών κολοσσών.