Η NVIDIA Nemotron 3 Super Φτάνει στην Together AI με Παράθυρο Περιβάλλοντος 1M Tokens
Jessie A Ellis 11 Μαρ 2026 21:43
Το μοντέλο NVIDIA Nemotron 3 Super με 120B παραμέτρους διατίθεται τώρα στην Together AI, προσφέροντας 5x αύξηση απόδοσης για συστήματα AI πολλαπλών πρακτόρων και εταιρικά φορτία εργασίας.
Η Together AI ανακοίνωσε τη διαθεσιμότητα του NVIDIA Nemotron 3 Super στην πλατφόρμα Dedicated Inference της στις 11 Μαρτίου, παρέχοντας στους εταιρικούς προγραμματιστές πρόσβαση σε ένα μοντέλο συλλογισμού 120 δισεκατομμυρίων παραμέτρων βελτιστοποιημένο για συστήματα AI πολλαπλών πρακτόρων. Η μετοχή της NVIDIA διαπραγματεύτηκε στα $186,03, με άνοδο 0,66% με τα νέα.
Ο χρόνος έχει σημασία. Το Nemotron 3 Super αντιπροσωπεύει το δεύτερο μοντέλο ανοιχτών βαρών της NVIDIA στην οικογένεια Nemotron 3, μετά την κυκλοφορία του Nano τον Δεκέμβριο, και στοχεύει σε ένα συγκεκριμένο σημείο πόνου στην παραγωγική AI: το υπολογιστικό κόστος εκτέλεσης πολύπλοκων ροών εργασίας πρακτόρων σε κλίμακα.
Γιατί η Αρχιτεκτονική Έχει Σημασία
Να τι κάνει αυτό το μοντέλο διαφορετικό από τον τυπικό αγώνα αριθμού παραμέτρων. Παρά τις 120B συνολικές παραμέτρους του, μόνο 12B είναι ενεργές κατά τη συμπερασματολογία. Ο υβριδικός σχεδιασμός—συνδυάζοντας την προσοχή Transformer με την επεξεργασία ακολουθιών Mamba—παρέχει αυτό που η NVIDIA ισχυρίζεται ότι είναι 5x υψηλότερη απόδοση από το προηγούμενο μοντέλο Nemotron Super.
Το παράθυρο περιβάλλοντος 1 εκατομμυρίου tokens αντιμετωπίζει αυτό που οι προγραμματιστές αποκαλούν "έκρηξη περιβάλλοντος". Οι εφαρμογές πολλαπλών πρακτόρων μπορούν να καταναλώσουν 15x περισσότερα tokens από τις τυπικές αλληλεπιδράσεις συνομιλίας, και τα περισσότερα μοντέλα αδυνατούν με αυτό το φορτίο. Το Nemotron 3 Super χειρίζεται ολόκληρες βάσεις κώδικα, μεγάλα αποθετήρια εγγράφων και εκτεταμένες τροχιές πρακτόρων χωρίς την πτώση απόδοσης.
Η εκπαίδευση Multi-Token Prediction επιτρέπει στο μοντέλο να δημιουργεί πολλά tokens ταυτόχρονα ανά προς τα εμπρός πέρασμα. Για τη δημιουργία κώδικα ή τις δομημένες εξόδους, η NVIDIA αναφέρει 50% ταχύτερη δημιουργία tokens σε σύγκριση με τα κορυφαία ανοιχτά μοντέλα.
Η Κίνηση της Together AI
Η εκτέλεση ενός υβριδικού μοντέλου 120B με περιβάλλον εκατομμυρίου tokens απαιτεί συνήθως κατανεμημένο υπολογισμό σε πολλαπλούς κόμβους. Η προσφορά Dedicated Inference της Together AI απλοποιεί την ανάπτυξη σε μεμονωμένες GPU NVIDIA H200 ή H100—χωρίς να απαιτείται προμήθεια GPU από την πλευρά του προγραμματιστή.
Η πλατφόρμα υπόσχεται 99,9% SLA χρόνου λειτουργίας και συμμόρφωση SOC 2, τοποθετώντας αυτό ως έτοιμη για επιχειρήσεις υποδομή παρά πειραματισμό ερευνητικού επιπέδου.
Εφαρμογές Παραγωγής
Οι στοχευόμενες περιπτώσεις χρήσης περιλαμβάνουν βοηθούς προγραμματιστών που αναλύουν βάσεις κώδικα, συστήματα επεξεργασίας εταιρικών εγγράφων, ταξινόμηση ευπαθειών κυβερνοασφάλειας και επίπεδα ενορχήστρωσης που δρομολογούν εργασίες σε εξειδικευμένους πράκτορες.
Η προσέγγιση ανοιχτών βαρών—που κυκλοφόρησε υπό την άδεια NVIDIA Nemotron Open Model License—επιτρέπει στις ομάδες να προσαρμόσουν για συγκεκριμένα περιβάλλοντα και να αναπτύξουν εντός εγκαταστάσεων, μια κρίσιμη εκτίμηση για επιχειρήσεις με απαιτήσεις κυριαρχίας δεδομένων.
Η NVIDIA ανακοίνωσε επίσης το NemoClaw στις 10 Μαρτίου, μια πλατφόρμα ανοιχτού κώδικα για πράκτορες AI που θα μπορούσε να συμπληρώσει τις αναπτύξεις Nemotron 3 Super. Οι προγραμματιστές μπορούν να αποκτήσουν πρόσβαση στο μοντέλο μέσω του επιπέδου αποκλειστικής συμπερασματολογίας της Together AI αμέσως.
Πηγή εικόνας: Shutterstock- nvidia
- υποδομή ai
- nemotron
- together ai
- εταιρική ai


