สรุปสั้นๆ
- Anthropic กำลังเตรียม Claude Opus 4.7 และเครื่องมือออกแบบ AI สำหรับเว็บไซต์และงานนำเสนอ
- Claude Mythos ยังคงเป็นโมเดลขั้นสูงสุดที่แท้จริงของ Anthropic และบริษัทจะไม่เปิดตัวให้สาธารณะ
- อุตสาหกรรมยังคงไม่สามารถวัดการปรับปรุง AI ได้อย่างน่าเชื่อถือ ทำให้การอ้างสิทธิ์เกี่ยวกับความก้าวหน้าของ Opus 4.7 ยากต่อการตรวจสอบ
Anthropic กำลังเตรียมตัวเปิดตัว Claude Opus 4.7 พร้อมกับเครื่องมือออกแบบที่ขับเคลื่อนด้วย AI ใหม่ที่ช่วยให้ผู้ใช้สร้างเว็บไซต์ งานนำเสนอ และหน้า landing page ด้วยคำสั่งภาษาอังกฤษธรรมดา—ข่าวที่ทำให้หุ้นของ Adobe, Wix และ Figma ลดลงในวันจันทร์ ตามรายงานของ The Information
ผลิตภัณฑ์เหล่านี้อาจเปิดตัวได้เร็วถึงสัปดาห์นี้ บุคคลที่รู้เกี่ยวกับแผนการบอกกับ The Information เครื่องมือออกแบบนี้มุ่งเป้าไปที่ทั้งนักพัฒนาและผู้ใช้ที่ไม่มีความรู้ด้านเทคนิค ทำให้เกิดการแข่งขันกับสตาร์ทอัพอย่าง Gamma และ Google's Stitch
Anthropic ไม่ได้ตอบสนองต่อคำขอแสดงความคิดเห็นของ Decrypt
Opus 4.7 ไม่ใช่แม้แต่โมเดลที่ทรงพลังที่สุดของ Anthropic ตำแหน่งนั้นเป็นของ Claude Mythos—โมเดลที่เน้นความปลอดภัยทางไซเบอร์ที่บริษัทกำลังส่งมอบอย่างเงียบๆ ให้กับบริษัทรักษาความปลอดภัยที่เลือกสรร ในขณะที่ป้องกันไม่ให้สาธารณะเข้าถึง
สถาบันความปลอดภัย AI ของสหราชอาณาจักรเพิ่งประเมิน Mythos Preview และพบว่าสามารถดำเนินการโจมตีทางไซเบอร์ที่ซับซ้อนได้อย่างอิสระในอัตราที่ไม่มีโมเดลอื่นเทียบได้ มันกลายเป็น AI ตัวแรกที่สำเร็จ "The Last Ones" การจำลองการโจมตีเครือข่ายองค์กร 32 ขั้นตอนที่โดยปกติใช้เวลาทีม red team มนุษย์ 20 ชั่วโมง Mythos ทำสำเร็จใน 3 จาก 10 ครั้ง โดยเฉลี่ย 22 จาก 32 ขั้นตอน—เทียบกับ 16 ขั้นตอนของ Opus 4.6
สิ่งนี้มีความสำคัญเกินกว่าความปลอดภัยขององค์กร การวัดสิ่งที่ AI สามารถทำได้จริงๆ กลายเป็นปัญหาใหญ่ทั่วทั้งอุตสาหกรรม OpenAI เพิ่งเรียกมาตรฐานการเขียนโค้ดชั้นนำว่า "ปนเปื้อน" แต่โมเดลต่างๆ ยังคงถูกเปรียบเทียบโดยใช้การทดสอบเดียวกันนั้น การประเมิน ARC-AGI-3 แยกต่างหากพบว่า Gemini ได้คะแนน 0.37% และ GPT-5.4 ได้ 0.26%—ในขณะที่มนุษย์ได้ 100% ผลลัพธ์คือภูมิทัศน์ที่มาตรฐานทั้งถูกโต้แย้งและยังคงถูกใช้เป็นหลักฐาน ทำให้ยากต่อการตีความการอ้างสิทธิ์เกี่ยวกับความก้าวหน้าของ Opus 4.7 จนกว่า Anthropic จะเปิดตัว model card โดยละเอียด
ความสัมพันธ์ระหว่าง Opus และ Mythos ใกล้ชิดกว่าที่คนส่วนใหญ่คิด Anthropic สร้างโมเดลขั้นสูงโดยการปรับแต่งบนสาย Opus—โครงสร้างพื้นฐานเดียวกันที่ขับเคลื่อนผลิตภัณฑ์ Claude สาธารณะได้รับการทดสอบความเครียดและถูกเสริมแกร่งให้เป็น Mythos Opus 4.7 เป็นรากฐานที่ในที่สุดจะได้รับการฝึกฝนด้านความปลอดภัยทางไซเบอร์
นอกจากนี้ ความพยายามของ Anthropic กำลังมุ่งไปสู่กรณีการใช้งานด้านการพัฒนา/องค์กรมากขึ้น การรั่วไหลของโค้ด Claude การเปิดตัวระบบทักษะและโปรโตคอล MCP การมุ่งเน้นที่ agentic AI และความใส่ใจในมาตรฐานการเขียนโค้ดทำให้เห็นได้ชัดเจนยิ่งขึ้น แม้ว่า Anthropic จะยังไม่ได้ประกาศอย่างเป็นทางการ การรั่วไหลเสริมการเปลี่ยนแปลงที่กว้างขึ้นจากผู้ให้บริการ LLM ไปสู่สิ่งที่คล้ายกับโมเดล "AI studio" แบบ full-stack ที่ Claude ไม่เพียงแค่สร้างข้อความแต่สร้างและปรับใช้ผลิตภัณฑ์ที่สมบูรณ์
จดหมายข่าว Daily Debrief
เริ่มต้นทุกวันด้วยข่าวสำคัญในตอนนี้ พร้อมคุณสมบัติดั้งเดิม พอดแคสต์ วิดีโอ และอื่นๆ
แหล่งที่มา: https://decrypt.co/364483/anthropic-opus-47-full-stack-ai-studio-mythos








