บริษัท AI สำหรับองค์กร Cohere ได้ประกาศเปิดตัว Command A+ โมเดลภาษาแบบ mixture-of-experts โอเพนซอร์สที่ออกแบบมาสำหรับงาน agentic ระดับองค์กร โดยมีความต้องการด้านการประมวลผลค่อนข้างต่ำ
บริษัทกล่าวว่าโมเดลนี้สร้างขึ้นบนพื้นฐานงานหนึ่งปีภายใน North ซึ่งเป็น enterprise workspace ของ Cohere สำหรับการพัฒนาและปรับใช้ระบบ AI แบบ agentic และรวมความสามารถจากทั่วทั้งตระกูล Command เข้าไว้ในโมเดลเดียวที่มุ่งหมายสำหรับการใช้งานแบบขยายขนาดได้ในสภาพแวดล้อมการทดลอง การปรับใช้ และการผลิต
Command A+ พร้อมให้ใช้งานภายใต้ใบอนุญาต Apache 2.0 เปิดโอกาสให้นักพัฒนาเข้าถึงโมเดลที่ Cohere ระบุว่ามุ่งหมายสนับสนุนการปรับใช้ AI แบบมีอำนาจอธิปไตย รวมถึงสภาพแวดล้อมที่องค์กรต้องการควบคุมโครงสร้างพื้นฐานและพฤติกรรมของโมเดลโดยตรง การเปิดตัวนี้รวมถึง weights ที่ดาวน์โหลดได้บน Hugging Face พร้อมคำแนะนำการใช้งานและตัวเลือกการปรับใช้ผ่าน Model Vault ของ Cohere
ตามข้อมูลจำเพาะที่บริษัทเผยแพร่ โมเดลใช้สถาปัตยกรรม sparse MoE มีพารามิเตอร์รวม 218 พันล้านตัวและพารามิเตอร์ที่ใช้งานอยู่ 25 พันล้านตัว รองรับบริบทอินพุต 128,000 โทเคน และสามารถสร้างได้สูงสุด 64,000 โทเคน ออกแบบสำหรับอินพุตประเภทข้อความ รูปภาพ และการใช้เครื่องมือ และสามารถสร้างเอาต์พุตประเภทข้อความ การใช้เหตุผล และการใช้เครื่องมือใน 48 ภาษา
Cohere กล่าวว่า Command A+ ได้รับการปรับให้เหมาะสมสำหรับการใช้เหตุผล การสร้างเสริมด้วยการดึงข้อมูล งานหลายภาษา การประมวลผลเอกสารแบบหลายรูปแบบ และ agentic workflows บริษัทยังเน้นย้ำถึงประสิทธิภาพด้านฮาร์ดแวร์ โดยระบุว่าโมเดลพร้อมใช้งานในรูปแบบ quantization หลายแบบ ได้แก่ BF16, FP8 และ W4A4 และสามารถรันได้บน GPU ระดับสูงจำนวนน้อย โมเดลนี้ยังถูกนำเสนอเป็นการเปิดตัวที่เร็วที่สุดของ Cohere จนถึงปัจจุบัน โดยบริษัทอ้างถึงการปรับปรุงความเร็วของเอาต์พุต เวลาตอบสนองที่ต่ำลง และประสิทธิภาพโทเคนที่ดีขึ้นเมื่อเปรียบเทียบกับโมเดล Command รุ่นก่อนหน้า Cohere กล่าวว่า speculative decoding ได้รับการปรับให้เข้ากับสถาปัตยกรรมของโมเดลเพื่อเพิ่มความเร็วในการอนุมานโดยไม่กระทบต่อคุณภาพเอาต์พุต
บริษัทอธิบาย Command A+ ว่าเป็นผู้สืบทอดที่รวมเป็นหนึ่งเดียวของ Command A รุ่นก่อนหน้า โดยระบุว่าสามารถเหนือกว่ารุ่นก่อนหน้าในงานที่เน้นองค์กร เช่น การใช้เหตุผลในบริบทยาว ความเข้าใจแบบหลายรูปแบบ การดึงข้อมูล และการสร้างโค้ด Cohere ยังเน้นถึงคะแนน benchmark ที่ดีขึ้นเมื่อเทียบกับ Command A Reasoning รวมถึงผลลัพธ์ที่แข็งแกร่งขึ้นในการประเมิน agentic ที่เกี่ยวข้องกับโทรคมนาคม งานเขียนโค้ดผ่าน terminal และมาตรการภายในที่ใช้ใน North โมเดลนี้ยังกล่าวว่าปรับปรุงประสิทธิภาพในการวิเคราะห์สเปรดชีต การตอบคำถามแบบ agentic และ workflows ที่ใช้หน่วยความจำ
ความสามารถหลายภาษาเป็นอีกส่วนสำคัญของการเปิดตัวนี้ Cohere กล่าวว่า Command A+ ขยายการรองรับจาก 23 ภาษาเป็น 48 ภาษา พร้อมทั้งปรับปรุงประสิทธิภาพการแปลและการใช้เหตุผลหลายภาษา บริษัทยังรายงานความก้าวหน้าในภาษาที่ไม่ใช่ยุโรป รวมถึงการปรับปรุงประสิทธิภาพ tokenization สำหรับภาษาอาหรับ เกาหลี และญี่ปุ่น ในการทดสอบ benchmark แบบหลายรูปแบบ โมเดลนี้กล่าวว่าแสดงผลลัพธ์ที่แข็งแกร่งขึ้นในงานการใช้เหตุผลเกี่ยวกับเอกสารและรูปภาพ รวมถึงการประเมิน MathVista, MMMU และที่เกี่ยวข้องกับ CharXiv
ความสนใจของอุตสาหกรรมต่อการเปิดตัวนี้สะท้อนออกมาในความคิดเห็นจาก Fujitsu ซึ่งกล่าวว่าสถาปัตยกรรมและประสิทธิภาพ agentic ของโมเดลสอดคล้องกับกลยุทธ์ sovereign AI ของตนเอง Cohere กำหนดกรอบการเปิดตัวนี้เป็นส่วนหนึ่งของความพยายามที่กว้างขึ้นเพื่อรับมือกับสามลำดับความสำคัญใน AI องค์กรพร้อมกัน ได้แก่ ความสามารถ ความปลอดภัย และต้นทุน บริษัทกล่าวว่าการพัฒนาในอนาคตจะยังคงมุ่งเน้นที่การใช้เหตุผล ประสิทธิภาพหลายรูปแบบ และการเขียนโค้ด ในขณะที่รักษาโมเดลให้เหมาะสมสำหรับการปรับใช้ในสภาพแวดล้อมที่ลูกค้าควบคุม
Command A+ พร้อมให้ใช้งานผ่าน Hugging Face, Model Vault, API ของ Cohere และพื้นที่สาธิตออนไลน์ฟรี Cohere กล่าวว่าเอกสารและวัสดุการปรับใช้ยังพร้อมให้ใช้งานสำหรับองค์กรที่ต้องการทดสอบหรือรวมโมเดลเข้ากับ workflows ขององค์กร
The post Cohere เปิดตัว Command A+ ก้าวหน้าสู่การปรับใช้ AI องค์กรที่มีอำนาจอธิปไตยและมีประสิทธิภาพ appeared first on Metaverse Post.


