สรุปสั้น ๆ
- Google เปิดตัว Gemma 4 ซึ่งเป็นกลุ่มโมเดลแบบเปิดภายใใต้ใบอนุญาต Apache 2.0
- ไลน์อัพทั้งสี่โมเดลครอบคลุมตั้งแต่โทรศัพท์ไปจนถึงศูนย์ข้อมูล โดยโมเดล 31B อันดับ 3 ของโลกแล้ว
- AI โอเพนซอร์สของสหรัฐฯ ได้รับแรงหนุนที่จำเป็น เมื่อ Gemma 4 ซึ่งได้รับการสนับสนุนจาก DeepMind วางตำแหน่งตัวเองเป็นผู้ท้าชิงชาวอเมริกันที่แข็งแกร่งที่สุดเพื่อต่อกรกับ DeepSeek, Qwen และผู้นำจีนรายอื่น ๆ
ความทะเยอทะยานด้าน AI แบบเปิดของ Google จริงจังขึ้นมากในวันนี้ บริษัทได้ปล่อย Gemma 4 ซึ่งเป็นกลุ่มโมเดล open-weight สี่ตัวที่สร้างขึ้นจากงานวิจัยเดียวกับ Gemini 3 และได้รับใบอนุญาตภายใต้ Apache 2.0 ซึ่งเป็นการเปลี่ยนแปลงที่สำคัญจากข้อกำหนดที่เข้มงวดกว่าในเวอร์ชัน Gemma ก่อนหน้านี้
นักพัฒนาได้ดาวน์โหลด Gemma รุ่นก่อนหน้ากว่า 400 ล้านครั้ง ทำให้เกิดตัวแปรจากชุมชนมากกว่า 100,000 ตัว การเปิดตัวครั้งนี้เป็นครั้งที่ทะเยอทะยานที่สุด
ในปีที่ผ่านมา ลีดเดอร์บอร์ด AI โอเพนซอร์สส่วนใหญ่เป็นเรื่องของจีน DeepSeek, Minimax, GLM และ Qwen ครองอันดับต้น ๆ ทำให้ทางเลือกของอเมริกาต้องดิ้นรนเพื่อความเกี่ยวข้อง ตามที่ Decrypt รายงานเมื่อปีที่แล้ว โมเดลแบบเปิดของจีนเพิ่มขึ้นจากเพียง 1.2% ของการใช้งานโมเดลแบบเปิดทั่วโลกในช่วงปลายปี 2024 เป็นประมาณ 30% ภายในสิ้นปี 2025 โดย Qwen ของ Alibaba แซงหน้า Llama ของ Meta กลายเป็นโมเดล self-hosted ที่ใช้มากที่สุดในโลก
Llama ของ Meta เคยเป็นตัวเลือกเริ่มต้นสำหรับนักพัฒนาที่ต้องการโมเดลที่มีความสามารถและรันได้ในเครื่อง ชื่อเสียงนั้นเสื่อมลง—ใบอนุญาตที่ควบคุมโดย Meta ของ Llama ทำให้เกิดคำถามเกี่ยวกับสถานะโอเพนซอร์สที่แท้จริง และประสิทธิภาพตกต่ำกว่าคู่แข่งจีน ตระกูล OLMo ของ Allen Institute พยายามเติมช่องว่างแต่ไม่สามารถดึงดูดความสนใจได้อย่างมีความหมาย OpenAI ปล่อยโมเดล gpt-oss ในเดือนสิงหาคม 2025 ซึ่งมอบลมหายใจสดชื่นให้กับระบบนิเวศ แต่พวกมันไม่เคยถูกออกแบบให้เป็นคู่แข่งระดับแนวหน้า
และเมื่อวานนี้ สตาร์ทอัพของสหรัฐฯ ที่มีพนักงาน 30 คนชื่อ Arcee AI ได้ปล่อย Trinity ซึ่งเป็นโมเดลแบบเปิดขนาด 400 พันล้านพารามิเตอร์ที่สร้างกรณีที่น่าสนใจว่าฉากอเมริกันยังไม่ตายสนิท Gemma 4 ตามโมเมนตัมนั้น คครั้งนี้ด้วยน้ำหนักเต็มของ Google DeepMind เบื้องหลัง เปลี่ยนมันให้กลายเป็นโมเดลอเมริกันที่ดีที่สุดในฉาก AI โอเพนซอร์ส
โมเดลนี้ "สร้างจากงานวิจัยและเทคโนโลยีระดับโลกเดียวกับ Gemini 3" Google กล่าวในประกาศ Gemma 4 มาในสี่ขนาด: Effective 2B และ 4B สำหรับโทรศัพท์และอุปกรณ์ edge โมเดล Mixture of Experts ขนาด 26B ที่เน้นความเร็ว และโมเดล Dense ขนาด 31B ที่ปรับให้เหมาะสมสำหรับคุณภาพดิบ
31B Dense ปัจจุบันอันดับสามในบรรดาโมเดลแบบเปิดทั้งหมดบนลีดเดอร์บอร์ดข้อความของ Arena AI 26B MoE อยู่อันดับหก Google อ้างว่าทั้งสองเอาชนะโมเดลที่ใหญ่กว่า 20 เท่า—การอ้างที่ยืนได้ อย่างน้อยเมื่อเทียบกับตัวเลข Arena AI ที่โมเดลจีนยังคงครองสองอันดับแรก
เราทดสอบ Gemma 4 มันมีความสามารถ แต่มีข้อแม้บางประการ โมเดลใช้การใช้เหตุผลแม้กับงานที่ไม่ต้องการมัน ซึ่งอาจทำให้คำตอบรู้สึกซับซ้อนเกินไปสำหรับพรอมต์ง่าย ๆ การเขียนเชิงสร้างสรรค์ดีพอใช้—ใช้งานได้ ไม่ได้สร้างแรงบันดาลใจ—และน่าจะดีขึ้นด้วยคำแนะนำเฉพาะเจาะจงและวิศวกรรมพรอมต์มากขึ้น
ที่มันส่งมอบได้อย่างชัดเจนที่สุดคือโค้ด เมื่อขอให้สร้างเกม ผลลัพธ์ไม่ได้โดดเด่นหรือประณีตเป็นพิเศษ แต่มันรันได้โดยไม่มีข้อผิดพลาดในครั้งแรก ไม่เลวสำหรับโมเดล 41 พันล้านพารามิเตอร์ ความน่าเชื่อถือแบบ zero-shot นั้นน่าจะมีค่ามากกว่าผลลัพธ์ที่สวยกว่าแต่ต้องการการแก้จุดบกพร่อง
คุณสามารถลองเกม (พื้นฐาน แต่ใช้งานได้) ที่นี่
ตัวแปรทั้งสี่ครอบคลุมสเปกตรัมฮาร์ดแวร์ทั้งหมด โมเดล E2B และ E4B สร้างสำหรับโทรศัพท์ Android, Raspberry Pi และอุปกรณ์ edge ทำงานออฟไลน์โดยสมบูรณ์ด้วยเลเทนซีเกือบศูนย์ อินพุตเสียงแบบเนทีฟ และหน้าต่างบริบท 128K โมเดล 26B และ 31B กำหนดเป้าหมายเวิร์กสเตชันและการปรับใช้คลาวด์ ขยายบริบทเป็น 256K และเพิ่มการเรียกฟังก์ชันแบบเนทีฟและเอาต์พุต JSON ที่มีโครงสร้างสำหรับสร้างเอเจนต์อิสระ โมเดลทั้งสี่ประมวลผลภาพและวิดีโอแบบเนทีฟ น้ำหนักความแม่นยำเต็มของโมเดลที่ใหญ่กว่าพอดีกับ GPU NVIDIA H100 ขนาด 80GB เดียว เวอร์ชัน quantized รันบนฮาร์ดแวร์ผู้บริโภค
ใบอนุญาต Apache 2.0 คือพาดหัวอีกอัน การเปิดตัว Gemma ก่อนหน้าของ Google ใช้ใบอนุญาตที่กำหนดเองซึ่งสร้างความคลุมเครือทางกฎหมายสำหรับผลิตภัณฑ์เชิงพาณิชย์ Apache 2.0 กำจัดแรงเสียดทานนั้นโดยสิ้นเชิง—นักพัฒนาสามารถแก้ไข แจกจ่ายต่อ และทำให้เป็นเชิงพาณิชย์ได้โดยไม่ต้องกังวลว่า Google จะเปลี่ยนข้อกำหนดในภายหลัง Clement Delangue ผู้ร่วมก่อตั้ง Hugging Face ชื่นชม โดยกล่าวว่า "Local AI กำลังมีช่วงเวลาของมัน" และมันคืออนาคตของอุตสาหกรรม AI Demis Hassabis ซีอีโอ Google DeepMind ไปไกลกว่านั้น เรียก Gemma 4 ว่า "โมเดลแบบเปิดที่ดีที่สุดในโลกสำหรับขนาดที่เกี่ยวข้อง"
นั่นเป็นการอ้างที่แข็งแรง ระบบกรรมสิทธิ์จาก Anthropic, OpenAI และ Gemini ของ Google เองยังคงนำในเบนช์มาร์กที่ยากที่สุด แต่สำหรับโมเดล open-weight ที่คุณสามารถรันในเครื่อง แก้ไขได้อย่างอิสระ และปรับใช้บนโครงสร้างพื้นฐานของคุณเอง? การแข่งขันเพิ่งบางลงอย่างมีนัยสำคัญ คุณสามารถลอง Gemma 4 ตอนนี้ใน Google AI Studio (31B และ 26B) หรือ Google AI Edge Gallery (E2B และ E4B) น้ำหนักโมเดลยังมีใน Hugging Face, Kaggle และ Ollama
จดหมายข่าว Daily Debrief
เริ่มต้นทุกวันด้วยข่าวสารยอดนิยมตอนนี้ พร้อมฟีเจอร์ต้นฉบับ พอดแคสต์ วิดีโอ และอื่น ๆ อีกมากมาย
แหล่งที่มา: https://decrypt.co/363178/google-gemma-4-open-source-ai







