Ο ανταγωνισμός στην τεχνητή νοημοσύνη και συγκεκριμένα στην αγορά συμπερασμάτων μπορεί να μειώσει την τιμή, ωφελώντας τους κατασκευαστές αλλά προκαλώντας τις επιχειρήσεις cloud
Ο Τζάρεντ Κουίνσι Ντέιβις και η startup εταιρεία υπολογιστών ειδικά για την τεχνητή νοημοσύνη Foundry πωλούν συμπεράσματα. Δεν φτιάχνουν μικροτσίπ ούτε φτιάχνουν μεγάλα μοντέλα γλώσσας. Το Foundry έχει μια μοναδική μέθοδο για να κάνει το cloud computing πιο αποτελεσματικό. Αντί να πουλήσει την τεχνολογία της σε παρόχους cloud, η ομάδα του Foundry αποφάσισε να γίνει η ίδια τέτοια εταιρεία και να χρησιμοποιήσει την τεχνολογία της για να λειτουργήσει ένα πιο αποτελεσματικό cloud.
Μόλις οι εταιρείες που θέλουν να αξιοποιήσουν και να πουλήσουν ένα προϊόν για τεχνητή νοημοσύνη που έχουν εκπαιδεύσει τα μοντέλα τους και γνωρίζουν ότι έχουν απόδοση, αναζητούν ευκολία, ταχύτητα και αξία κάθε φορά που παράγουν αποτελέσματα. Οι πάροχοι υπηρεσιών Inference-as-a-service, όπως η Foundry, στοχεύουν στην απλοποίηση της διαδικασίας δημιουργίας αυτών των αποτελεσμάτων.
Η Foundry προσφέρει επίσης εκπαίδευση και λεπτομέρεια, όπως κάνουν πολλοί πάροχοι cloud, αλλά αυτές τις μέρες, φαίνεται ότι οποιοσδήποτε με τεχνολογία ενίσχυσης υπολογιστών AI προσπαθεί να δημιουργήσει έσοδα πουλώντας συμπεράσματα — ή πιο συγκεκριμένα, token, τη βασική μονάδα δεδομένων στην τεχνητή νοημοσύνη, σημειώνει ο Business Insider.
H Cerebras πουλάει επίσης συμπεράσματα. Η βασική τεχνογνωσία της εταιρείας είναι ο σχεδιασμός τσιπ για εκπαίδευση και εξαγωγή συμπερασμάτων, αλλά πρόσφατα άρχισε να πουλά τα τελευταία ως υπηρεσία. Το ίδιο και η Groq, μια εταιρεία τσιπ που ιδρύθηκε από δύο πρώην υπαλλήλους της Google, οι οποίοι αναγνώρισαν νωρίς ότι το συμπέρασμα επρόκειτο να πάρει το μεγαλύτερο μερίδιο της αγοράς πληροφορικής. Η SambaNova Systems, μια άλλη πλατφόρμα υλικού, πουλά επίσης την εξαγωγή συμπερασμάτων ως υπηρεσία.
Εταιρείες όπως η Lambda, η CoreWeave, η Together AI και η Crusoe, όλες στενοί συνεργάτες της Nvidia, διαχειρίζονται κέντρα δεδομένων κατάλληλα για φόρτους εργασίας AI και προσφέρουν υπηρεσίες συμπερασμάτων. Και μετά υπάρχουν οι υπερκλιμακωτές όπως το AWS και το Microsoft Azure.
Με τόσες πολλές εταιρείες που ειδικεύονται στην εξαγωγή συμπερασμάτων στην τεχνητή νοημοσύνη, αυξάνονται οι υποψίες ότι το κόστος της εξαγωγής συμπερασμάτων πρόκειται να πέσει κατακόρυφα.
«Μία αιτία που το συμπέρασμα είναι λίγο εμπορευματοποιήσιμο είναι ότι οι πελάτες πληρώνουν κάπως για tokens στο τέλος της ημέρας, ανέφερε στο Business Insider ο Ντέιβις. Η τρέχουσα αγορά συμπερασμάτων μοιάζει με την την αγορά ηλεκτρικής ενέργειας, ξεκαθάρισε ο Ντέιβις. Υπάρχουν πολλές εξειδικευμένες πηγές στις οποίες μπορείτε να έχετε πρόσβαση αν κάνετε πραγματικά αγορές, αλλά δεν το κάνουν όλοι. Οι περισσότεροι θέλουν απλώς να γυρίσουν τον διακόπτη του ηλεκτρικού ρεύματος.
Υπάρχουν όμως πολλές αποχρώσεις για όσους θέλουν. Για ορισμένους πελάτες, η ταχύτητα είναι υψίστης σημασίας. Η ταχύτητα έχει επίσης διακρίσεις, όπως ο χρόνος για το πρώτο token και τα tokens ανά δευτερόλεπτο. Υπάρχει συνολικός χρόνος ολοκλήρωσης της εργασίας και υπάρχουν διάφορα είδη φόρτου εργασίας συμπερασμάτων που προσφέρονται για διαφορετικές ρυθμίσεις υπολογιστών.
Η ενεργειακή απόδοση του υποκείμενου υλικού και της δικτύωσης είναι ένας μεγάλος καθοριστικός παράγοντας του κόστους. Και το κόστος στον υπολογισμό συμπερασμάτων είναι ακόμη πιο σημαντικό από ό,τι στην εκπαίδευση, δήλωσε πρόσφατα στο Business Insider ο συνιδρυτής της Groq, Τζόναθαν Ρος. Η εκπαίδευση είναι ένα γενικό κόστος, ενώ το συμπέρασμα είναι ένα λειτουργικό κόστος.
Κάντε σμίκρυνση από όλες τις περιπλοκές και το συμπέρασμα γίνεται το εμπόρευμα της εποχής της τεχνητής νοημοσύνης. «Ορισμένες εταιρείες θέλουν απλώς παραγωγή και δεν τους νοιάζει η υποδομή», είπε στο Business Insider ο Μιτές Αγκραβάλ, επικεφαλής του cloud για τη Lambda.
Τεχνητή νοημοσύνη και εμπορευματοποίηση
Η Lambda βρίσκεται στα πρώτα στάδια μιας προσφοράς συμπερασμάτων ως υπηρεσίας στην τεχνητή νοημοσύνη, αλλά ο Αγκραβάλ είπε ότι η εταιρεία το κάνει προσεκτικά, εστιάζοντας στην παροχή ολιστικών υπολογιστικών υπηρεσιών, και όχι μόνο διακριτικών.
Τα περιθώρια κέρδους συμπερασμάτων μπορεί να ποικίλλουν ευρέως, είπε ο Αγκραβάλ. Με τη γενική υπολογιστική — όπου ο πελάτης νοικιάζει σταθερή χωρητικότητα — τα περιθώρια είναι ευκολότερο να διαχειριστούν. Όταν χρεώνετε τη χρήση ή την είσοδο και την έξοδο ενός μοντέλου, η απόδοση είναι λιγότερο προβλέψιμη.
Η οργάνωση πολλών χρηστών σε έναν πεπερασμένο αριθμό διακομιστών απαιτεί… φινέτσα. Το αν το κόστος λειτουργίας του υλικού καλύπτεται πράγματι με περιθώρια κέρδους εξαρτάται από το πόσο καλά γίνεται αυτή η οργάνωση, εξήγησε ο Αγκραβάλ.
Γιατί λοιπόν τα neocloud να προσφέρουν την πιο επικίνδυνη υπηρεσία;
Ο Agrawal είπε ότι πρόκειται για την είσοδο πιθανών πελατών. Οι πελάτες του συμπερασμάτων ως υπηρεσίας μπορούν να μετατραπούν σε πιο παραδοσιακούς πελάτες υπολογιστών και καθώς μεγαλώνει η λίστα των ανταγωνιστών, οι σχέσεις και η ιστορία αποκτούν σημασία.
Τα οικονομικά μοντέλα της Lambda υποθέτουν ότι οι περικοπές τιμών θα έρθουν σύντομα καθώς περισσότεροι παίκτες εισέρχονται στο χώρο των συμπερασμάτων και τα τσιπ γίνονται πιο αποτελεσματικά.
Κούρσα προς τα κάτω;
Το πόσο γρήγορα αυξάνεται η ζήτηση για συμπεράσματα είναι αντικείμενο συζήτησης, αλλά σε πρόσφατες δημόσιες δηλώσεις, ο Διευθύνων Σύμβουλος της Nvidia, Τζένσεν Χουάνγκ, έχει πει πολλές φορές ότι τα νέα μοντέλα, όπως το o1 της OpenAI, απαιτούν περισσότερους υπολογισμούς για να δημιουργήσουν τον ίδιο αριθμό απαντήσεων, επειδή εκτελούν πολλαπλά μοντέλα για να ελέγξουν τη δική τους δουλειά ή «λόγο». Η ακρίβεια, αποδεικνύεται, απαιτεί περισσότερους υπολογισμούς.
Τα φορτία συμπερασμάτων πρόκειται να αυξηθούν, αλλά οι πάροχοι υπηρεσιών εξακολουθούν να αναμένουν πτώση της τιμής από την εισροή νέων παικτών. Ωστόσο, ο Ντέιβις δεν ανησυχεί.
Υπενθύμισε το παράδοξο του Jevon – μια οικονομική αρχή στην οποία η πτώση της τιμής ή η αύξηση της απόδοσης οδηγεί σε μεγαλύτερη συνολική κατανάλωση – όπως όταν διαπλατύνετε έναν αυτοκινητόδρομο και η κυκλοφορία γίνεται χειρότερη.
«Αν κάνω κάτι 10 φορές φθηνότερο, οι άνθρωποι δεν θα ξοδέψουν 10 φορές λιγότερα, ούτε καν θα κρατήσουν τον προϋπολογισμό τους το ίδιο. Θα ξοδέψουν περισσότερα», είπε ο Ντέιβις. «Αυτό είναι λογικό γιατί αυτό που κάνετε όταν κάνετε κάτι 10 φορές φθηνότερο, βελτιώνετε την απόδοση της επένδυσης».
Με άλλα λόγια, «αποδεικνύεται ότι όταν κάνετε τα συμπεράσματα φθηνότερα, οι άνθρωποι αποφασίζουν να κάνουν πολύ περισσότερα συμπεράσματα», είπε ο Ντέιβις.
Η πορεία που θα ακολουθήσει θα μπορούσε να είναι «ανώμαλη» ωστόσο και δεν είναι πιθανό όλοι οι παίκτες να επιβιώσουν από τις στιγμές αναντιστοιχίας μεταξύ προσφοράς και ζήτησης.
«Όπως έλεγε το παλιό μου αφεντικό στην Intel, Άντι Γκρόουβ, “αφήστε το χάος να βασιλέψει και μετά να βασιλέψτε στο χάος», δήλωσε ο Σιράμ Βισβαναθάν, ιδρυτικός συνεργάτης της Celesta Capital και επενδυτής στη SambaNova Systems.
Συμφωνεί ότι τα επόμενα χρόνια θα είναι εξαιρετικά ανταγωνιστικά για τους παρόχους συμπερασμάτων, αλλά πιστεύει ότι οι νικητές θα κριθούν βάσει αξίας. «Η βασική καινοτομία δεν μπορεί να βρίσκεται στην αγορά, αλλά στην απόδοση και τη δύναμη της υποκείμενης αρχιτεκτονικής», είπε ο Βισβαναθάν.
Πολλές από τις εταιρείες που πωλούν tokens για να μπουν στην αγορά της τεχνητής νοημοσύνης φιλοδοξούν να αποκτήσουν περισσότερα. Οι σχεδιαστές τσιπ τελικά θέλουν να πουλήσουν τσιπ σε υπερκλιμακωτές αντί να συνάγουν συμπεράσματα σε νεοφυείς επιχειρήσεις τεχνητής νοημοσύνης. Η απόλυτη έκδοση της τεχνολογίας του Foundry είναι επίσης μεγαλύτερη.
«Αν κάνουμε τη δουλειά μας, σωστά, ξέρετε, θα είμαστε βασικό μέρος του τρόπου λειτουργίας κάθε GPU», είπε ο Ντέιβις. Όλοι οι δρόμοι, φαίνεται, περνούν από τα συμπεράσματα.
Πηγή: ΟΤ - In.gr