Δύο νέα AI μοντέλα ανοιχτού κώδικα αποκάλυψε η META στο πλαίσιο του Llama 4, τα οποία σε πολλές περιστάσεις υπερβαίνουν τις επιδόσεις του Chatgpt, του Gemini και του R1.
Η Meta διεύρυνε πρόσφατα το χαρτοφυλάκιο Τεχνητής Νοημοσύνης της με την παρουσίαση δύο νέων μοντέλων της σειράς Llama 4: Llama 4 Scout και Llama 4 Maverick. Τα μοντέλα αυτά αντιπροσωπεύουν σημαντικά άλματα στην ΤΝ, με κάθε ένα να στοχεύει σε συγκεκριμένες εφαρμογές και επίπεδα απόδοσης.
Το Llama 4 Scout έχει σχεδιαστεί ως ένα ελαφρύ μοντέλο που μπορεί να λειτουργήσει σε μία μόνο GPU τύπου Nvidia H100. Διαθέτει παράθυρο συμφραζομένων 10 εκατομμυρίων tokens και υπερέχει των ανταγωνιστών του –όπως τα Gemma 3 της Google και Mistral 3.1– σε διάφορα benchmarks. Αυτή η αποδοτικότητα καθιστά το Scout ιδανικό για εφαρμογές που απαιτούν υψηλές επιδόσεις με περιορισμένους υπολογιστικούς πόρους.
Αντίθετα, το Llama 4 Maverick είναι ένα πιο ισχυρό μοντέλο σχεδιασμένο για σύνθετα καθήκοντα. Η απόδοσή του συγκρίνεται με εκείνη των GPT-4o και DeepSeek-V3 της OpenAI, ιδίως σε τομείς όπως ο προγραμματισμός και η λογική σκέψη, χρησιμοποιώντας λιγότερες ενεργές παραμέτρους. Αυτή η αποδοτικότητα το καθιστά ανταγωνιστικό για απαιτητικές εφαρμογές ΤΝ.
Στο άμεσο μέλλον, η Meta αναπτύσσει το Llama 4 Behemoth, ένα φιλόδοξο μοντέλο με 288 δισεκατομμύρια ενεργές παραμέτρους και συνολικά 2 τρισεκατομμύρια παραμέτρους. Οι πρώτες εκτιμήσεις δείχνουν ότι το Behemoth ξεπερνά τα GPT-4.5 και Claude Sonnet 3.7 σε δοκιμασίες STEM, κάτι που υποδηλώνει την ικανότητά του για πολύπλοκες υπολογιστικές εφαρμογές.
Ένα σημαντικό αρχιτεκτονικό χαρακτηριστικό της σειράς Llama 4 είναι η υιοθέτηση του πλαισίου “mixture of experts” (MoE). Αυτή η σχεδίαση βελτιστοποιεί τη χρήση των πόρων ενεργοποιώντας μόνο τα απαραίτητα μέρη του μοντέλου για κάθε συγκεκριμένη εργασία, ενισχύοντας την αποδοτικότητα και την απόδοση.
Παρότι τα μοντέλα Llama 4 παρουσιάζονται ως ανοιχτού κώδικα, υπάρχουν περιορισμοί αδειοδότησης. Οι εμπορικοί οργανισμοί με πάνω από 700 εκατομμύρια μηνιαίους ενεργούς χρήστες πρέπει να λάβουν έγκριση από τη Meta για να τα χρησιμοποιήσουν. Αυτή η απαίτηση έχει προκαλέσει αντιδράσεις από τον οργανισμό Open Source Initiative, ο οποίος υποστηρίζει ότι οι περιορισμοί αυτοί δεν συνάδουν με τις αρχές του πραγματικού ανοιχτού κώδικα.
Ο CEO της Meta, Mark Zuckerberg, έχει διατυπώσει με σαφήνεια το όραμα του για την πορεία της εταιρείας στην ΤΝ. Τονίζει τη σημασία των μοντέλων ανοιχτού κώδικα, δηλώνοντας ότι είναι πιο ασφαλή, προάγουν την ταχύτερη καινοτομία και εξασφαλίζουν κοινή ευημερία. Ο Zuckerberg έχει επίσης επισημάνει τη μεγάλη υπολογιστική απαίτηση για την εκπαίδευση προηγμένων μοντέλων όπως το Llama 4, η οποία είναι σχεδόν δέκα φορές μεγαλύτερη από εκείνη του προκατόχου του.
Για την κάλυψη αυτών των αναγκών, η Meta σχεδιάζει να επενδύσει 60 έως 65 δισεκατομμύρια δολάρια σε κεφαλαιουχικές δαπάνες φέτος, κυρίως για την ενίσχυση των υποδομών ΤΝ.
Επιπλέον, ο Zuckerberg οραματίζεται την ενσωμάτωση βοηθών ΤΝ σε όλες τις πλατφόρμες της Meta, όπως το WhatsApp, το Messenger και το Instagram, στοχεύοντας να φτάσει πάνω από ένα δισεκατομμύριο χρήστες. Υπογραμμίζει τη σημασία της προσωποποίησης στην ΤΝ, υποστηρίζοντας ότι οι χρήστες επιθυμούν τεχνητή νοημοσύνη που να ανταποκρίνεται στο προσωπικό τους πλαίσιο, στα ενδιαφέροντα και τις πολιτισμικές τους αναφορές.
Η σειρά Llama 4 της Meta, που περιλαμβάνει τα μοντέλα Scout, Maverick και το επερχόμενο Behemoth, αντικατοπτρίζει τη στρατηγική δέσμευση της εταιρίας για την προώθηση της τεχνολογίας τεχνητής νοημοσύνης. Μέσω εκτεταμένων επενδύσεων και με έμφαση στην ανοιχτή ανάπτυξη, η Meta φιλοδοξεί να βρεθεί στην πρωτοπορία της καινοτομίας στην ΤΝ, προσφέροντας αποδοτικές και εξατομικευμένες λύσεις σε ένα παγκόσμιο κοινό.
Σύγκριση των AI μοντέλων
Ο Διευθύνων Σύμβουλος της Meta, Μαρκ Ζούκερμπεργκ, έχει αναφερθεί εκτενώς στα ανταγωνιστικά πλεονεκτήματα του μοντέλου τεχνητής νοημοσύνης Llama 4 σε σύγκριση με άλλα μοντέλα. Τα κύρια σημεία που έχει επισημάνει περιλαμβάνουν:
- Προηγμένες Ικανότητες και Πολυτροπικότητα: Το Llama 4 σχεδιάζεται ως ένα “omni-model” με εγγενείς πολυτροπικές δυνατότητες, επιτρέποντας την επεξεργασία και μετάφραση διαφόρων μορφών δεδομένων, όπως κείμενο, βίντεο, εικόνες και ήχος. Αυτή η πολυτροπικότητα το διαφοροποιεί από άλλα μοντέλα που μπορεί να επικεντρώνονται σε έναν μόνο τύπο δεδομένων. citeturn0news18
- Ανοιχτός Κώδικας και Κοινότητα Ανάπτυξης: Η στρατηγική της Meta να διαθέτει το Llama 4 ως ανοιχτού κώδικα μοντέλο επιτρέπει σε ερευνητές και προγραμματιστές να το χρησιμοποιούν και να το βελτιώνουν, προάγοντας την καινοτομία και τη συνεργασία. Αυτό το διακρίνει από κλειστά μοντέλα άλλων εταιρειών, τα οποία περιορίζουν την πρόσβαση και την προσαρμογή. citeturn0news17
- Επενδύσεις σε Υποδομές: Η Meta επενδύει σημαντικά σε υποδομές για την υποστήριξη του Llama 4, συμπεριλαμβανομένης της ανάπτυξης ενός κέντρου δεδομένων ισχύος 2 γιγαβάτ, το οποίο θα φιλοξενήσει πάνω από 1,3 εκατομμύρια GPUs. Αυτή η επένδυση υποδηλώνει τη δέσμευση της εταιρείας να παρέχει ένα μοντέλο υψηλής απόδοσης και κλίμακας. citeturn0search10
- Αυξημένες Υπολογιστικές Απαιτήσεις και Απόδοση: Ο Ζούκερμπεργκ έχει δηλώσει ότι η εκπαίδευση του Llama 4 απαιτεί δεκαπλάσια υπολογιστική ισχύ σε σύγκριση με το Llama 3, υπογραμμίζοντας την πολυπλοκότητα και τις προηγμένες δυνατότητες του νέου μοντέλου. Αυτή η αυξημένη υπολογιστική απαίτηση αναμένεται να αποδώσει σε βελτιωμένη απόδοση και ικανότητες. citeturn0search7
- Συγκριτική Απόδοση: Παρόλο που το Llama 4 είναι ακόμα υπό ανάπτυξη, οι πρώτες εκτιμήσεις δείχνουν ότι μπορεί να ανταγωνιστεί ή και να ξεπεράσει υπάρχοντα μοντέλα όπως το GPT-4.5 και το Claude Sonnet 3.7 σε συγκεκριμένα benchmarks, ιδιαίτερα σε τομείς όπως η κωδικοποίηση και η λογική σκέψη. citeturn0news17
Συνολικά, ο Ζούκερμπεργκ προβάλλει το Llama 4 ως ένα μοντέλο που συνδυάζει προηγμένες τεχνικές δυνατότητες, ανοιχτή πρόσβαση για την κοινότητα ανάπτυξης και ισχυρή υποδομή, προσφέροντας έτσι σημαντικά ανταγωνιστικά πλεονεκτήματα έναντι άλλων μοντέλων τεχνητής νοημοσύνης.