Τα μεγάλα επιχειρηματικά μοντέλα (LAM) φέρνουν επανάσταση στον κόσμο της τεχνητής νοημοσύνης σε σύγκριση με τα παραδοσιακά μοντέλα.
Η εμφάνιση γενεσιουργών chatbot με τεχνητή νοημοσύνη οδήγησε στην ιδέα ενός «μεγάλου γλωσσικού μοντέλου» (LLM), μιας προηγμένης τεχνολογίας AI που αναλύει και κατανοεί τη φυσική γλώσσα για να δημιουργήσει ουσιαστικές απαντήσεις με βάση τα ερωτήματα των χρηστών. Τα μεγάλα γλωσσικά μοντέλα μπορούν να παράγουν συνεπές περιεχόμενο που μοιάζει με άνθρωπο, δίνοντας την εντύπωση ότι η τεχνητή νοημοσύνη έχει κάποιο είδος δικής της «σκέψης».
Ωστόσο, τα γλωσσικά μοντέλα δεν είναι η μόνη τεχνολογία που συμβάλλει στην ανάπτυξη της τεχνητής νοημοσύνης. Τα μεγάλα επιχειρηματικά μοντέλα (LAM) μπορεί να είναι το επόμενο βήμα. Αυτά τα μοντέλα επικεντρώνονται στην ενίσχυση των αναλυτικών δυνατοτήτων και των δυνατοτήτων λήψης αποφάσεων σε πρακτικά πλαίσια, δυνητικά μεταμορφώνοντας τομείς όπως η αυτοματοποίηση και η διαχείριση επιχειρήσεων. Σε αυτό το άρθρο, θα μάθουμε πώς λειτουργούν τόσο τα LLM όσο και τα LAM και ο αυξανόμενος αντίκτυπός τους στη βελτίωση των εφαρμογών τεχνητής νοημοσύνης και στην επέκταση του πεδίου εφαρμογής του.

Τι είναι ένα Μεγάλο Μοντέλο Δράσης (LAM);
Το Large Action Model (LAM) είναι ένα μοντέλο τεχνητής νοημοσύνης που είναι σε θέση να κατανοεί την ανθρώπινη συμβολή και να εκτελεί την αντίστοιχη δράση, καθιστώντας το ικανό να αλληλεπιδρά με τον κόσμο με τρόπο που μοιάζει με τον άνθρωπο. Αυτή είναι μια ελαφρώς διαφορετική προσέγγιση από τα μοντέλα τεχνητής νοημοσύνης που επικεντρώνονται αποκλειστικά στη δημιουργία αποκρίσεων. Ο όρος «μεγάλο επιχειρηματικό μοντέλο» εισήχθη για πρώτη φορά από την Rabbit Inc, την εταιρεία ανάπτυξης του Rabbit R1. Στο βίντεο παρουσίασης του Rabbit R1 της εταιρείας, λέει ότι το LAM είναι ένα νέο θεμελιώδες μοντέλο που βοηθά στη μετακίνηση της τεχνητής νοημοσύνης από τα λόγια στη δράση.
Τα LAM εκπαιδεύονται σε μεγάλα σύνολα δεδομένων ενεργειών χρήστη. Ως εκ τούτου, μαθαίνουν μιμούμενοι ανθρώπινες πράξεις ή μέσω επίδειξης. Μέσω της επίδειξης, το μοντέλο LAM μπορεί να κατανοήσει και να πλοηγηθεί στις διεπαφές χρήστη διαφορετικών ιστοτόπων ή εφαρμογών για κινητά και να εκτελέσει συγκεκριμένες ενέργειες με βάση τις οδηγίες σας. Σύμφωνα με Κουνέλι,Το LAM μπορεί να το επιτύχει ακόμα κι αν η διεπαφή έχει αλλάξει ελαφρώς.
Μπορείτε να σκεφτείτε τα LAM ως επέκταση των υφιστάμενων δυνατοτήτων των LLM. Ενώ οι εξόδους δημιουργίας κειμένου ή πολυμέσων στα LLM βασίζονται στην εισαγωγή του χρήστη προβλέποντας την επόμενη λέξη ή διακριτικό (κάνετε μια ερώτηση και το μοντέλο LLM παρέχει εξόδους κειμένου ή πολυμέσων), τα LAM το προχωρούν περαιτέρω προσθέτοντας τη δυνατότητα εκτέλεσης σύνθετων ενεργειών για λογαριασμό σας.
Τι μπορούν να κάνουν τα LAM;
Τα LAM αφορούν την εκτέλεση σύνθετων ενεργειών για λογαριασμό σας. Ωστόσο, το κρίσιμο σημείο που πρέπει να σημειωθεί είναι η ικανότητα εκτέλεσης πολύπλοκων διαδικασιών. Αυτό κάνει τα LAM πιο χρήσιμα για προηγμένες εργασίες, αλλά αυτό δεν σημαίνει ότι δεν μπορούν να εκτελέσουν απλούστερες διαδικασίες.
Θεωρητικά, αυτό σημαίνει ότι θα μπορούσατε, για παράδειγμα, να ζητήσετε από το μοντέλο LAM να κάνει κάτι για λογαριασμό σας, όπως να παραγγείλετε έναν καφέ από το τοπικό σας καφέ ή μια βόλτα με το Uber, ακόμη και να κάνετε κράτηση ξενοδοχείου. Επομένως, είναι διαφορετικό από το να εκτελείτε απλές εργασίες, όπως να ζητάτε από το Google Assistant, το Siri ή την Alexa να ανάψει την τηλεόραση ή τα φώτα του σαλονιού.
Κάτω από την κουκούλα, σύμφωνα με το όραμα που μοιράζεται η Rabbit Inc., το μοντέλο LAM μπορεί να αποκτήσει πρόσβαση σε έναν σχετικό ιστότοπο ή εφαρμογή όπως η Uber και να περιηγηθεί στη διεπαφή του για να προβεί σε μια ενέργεια, όπως να ζητήσει μια διαδρομή ή να την ακυρώσει εάν αλλάξετε γνώμη.
Τα LAM θα έχουν καλύτερη απόδοση από τα LLM, αλλά δεν είναι έτοιμα (ακόμα)
Η έννοια των LAM είναι συναρπαστική, ίσως περισσότερο από τα LLM. Τα Μεγάλα Μοντέλα Δράσης (LAMs) θα είναι το μέλλον μετά τη γενετική τεχνητή νοημοσύνη, επιτρέποντάς μας να μπορούμε να αντισταθμίσουμε τις εγκόσμιες εργασίες και να επικεντρωθούμε σε άλλες ικανοποιητικές δραστηριότητες. Ωστόσο, όσο συναρπαστικό κι αν ακούγεται, τα LAM δεν είναι ακόμα έτοιμα.
Το πρώτο εμπορικό προϊόν που υποσχέθηκε να αξιοποιήσει το LAM (Rabbit r1) δεν τήρησε πλήρως την υπόσχεση μάρκετινγκ να εκτελέσει ενέργειες για λογαριασμό των χρηστών του. Η συσκευή απέτυχε τόσο άσχημα στο βασικό της σημείο πώλησης που πολλές κριτικές από πρώτο χέρι την περιέγραψαν ως αρκετά άχρηστη.
Ακόμη χειρότερα, μια έρευνα από τον YouTuber Coffeezilla, σε συνεργασία με μια επιλεγμένη ομάδα μηχανικών λογισμικού με πρόσβαση σε μέρος της βάσης Rabbit r1, διαπίστωσε ότι ο Rabbit χρησιμοποιούσε σενάρια Playwright για να εκτελέσει ενέργειες αντί για LAM. Έτσι, αντί για ένα μηχάνημα που εκτελούσε ένα μοναδικό μοντέλο τεχνητής νοημοσύνης, στην πραγματικότητα έτρεχε απλώς ένα σωρό δηλώσεις If > then. Πολύ μακριά από το υποσχεμένο μοντέλο LAM.
Αν υπάρχει κάτι που μπορείτε να αφαιρέσετε από το Rabbit r1, είναι ότι ναι, το όραμα είναι εκεί. Ωστόσο, η δουλειά πρέπει να γίνει πριν από την εφαρμογή, οπότε μην ενθουσιαστείτε ακόμα.