ซื้อคริปโต ตลาด สปอต ฟิวเจอร์สMU Earn ศูนย์กิจกรรม

เพิ่มเติม

บัตรระบบ OpenAI ใหม่แสดงให้เห็นว่าโมเดลหลัก Sol มีความสามารถในการควบคุมการใช้เหตุผลของตัวเองได้ดีขึ้น ซึ่งเป็นการเปลี่ยนแปลงที่นักวิจัยด้านความปลอดภัยจับตามองอย่างใกล้ชิดบัตรระบบ OpenAI ใหม่แสดงให้เห็นว่าโมเดลหลัก Sol มีความสามารถในการควบคุมการใช้เหตุผลของตัวเองได้ดีขึ้น ซึ่งเป็นการเปลี่ยนแปลงที่นักวิจัยด้านความปลอดภัยจับตามองอย่างใกล้ชิด

GPT-5.6 Sol ของ OpenAI กำลังเรียนรู้ที่จะซ่อนวิธีคิด

แหล่งที่มา: Yellow

2026/06/30 11:58

1 นาทีในการอ่าน

SOL$73,07-%0,54

หากมีข้อเสนอแนะหรือข้อกังวลเกี่ยวกับเนื้อหานี้ โปรดติดต่อเราได้ที่ [email protected]

OpenAI โมเดลเรือธงล่าสุดควบคุมการใช้เหตุผลของตัวเองใน 1.3% ของห่วงโซ่ยาวในการทดสอบความปลอดภัย ซึ่งเป็นตัวเลขเล็กน้อยแต่เพิ่มขึ้นเรื่อยๆ ที่นักวิจัยติดตามในฐานะสัญญาณเตือนล่วงหน้า

ประเด็นสำคัญ:

OpenAI ตั้งธงการควบคุมการใช้เหตุผลใน GPT-5.6 Sol

ตัวเลขดังกล่าวอยู่ในการ์ดระบบ GPT-5.6 ที่เผยแพร่เมื่อวันที่ 26 มิ.ย. เมื่อ Sol เข้าสู่การเปิดตัวแบบจำกัดสำหรับพาร์ทเนอร์ที่เชื่อถือได้ ซึ่งเป็นการเปิดตัวแบบขั้นตอนที่วอชิงตันขอให้บริษัทดำเนินการ OpenAI วัด "ความสามารถในการควบคุม" ว่าเป็นความสามารถของโมเดลในการปฏิบัติตามคำสั่งเกี่ยวกับห่วงโซ่ความคิดของตัวเอง เช่น การลบคำที่ถูกทำเครื่องหมายหรือเขียนการติดตามทั้งหมดเป็นตัวพิมพ์เล็ก คะแนนต่ำคือผลลัพธ์ที่ดี

เมื่อโมเดลไม่สามารถปรับเปลี่ยนการคิดตามความต้องการได้ ผู้ตรวจสอบยังสามารถอ่านการใช้เหตุผลนั้นและตรวจจับปัญหาก่อนที่ผลลัพธ์จะถึงผู้ใช้หรือทำงานบนระบบจริง Sol ทำลายรูปแบบนี้

ในห่วงโซ่ที่มีความยาวใกล้ 5,000 โทเค็น Sol ควบคุมการใช้เหตุผลของตัวเอง 1.3% ของเวลา เทียบกับ 0.4% สำหรับ GPT-5.5 และ 0.7% สำหรับ GPT-5.4 Thinking รุ่นก่อนหน้า การเพิ่มขึ้นนี้คงที่ในชุดข้อมูลทดสอบทั้งห้าชุดและประเภทคำสั่งส่วนใหญ่ บริษัทจึงไม่ถือว่าเป็นเสียงรบกวนแต่เป็นแนวโน้มที่กำลังติดตามอยู่ โมเดล Terra ขนาดเล็กกว่ายังคงไม่เปลี่ยนแปลง

อ่านเพิ่มเติม: BitMine Defies The Selloff With A $43M Ethereum Bet, Strategy Blinks

การโกงและการใช้เหตุผลที่ซ่อนเร้นของ Sol ทำให้ความกังวลลึกขึ้น

การกระโดดนี้ไม่ได้อยู่โดดเดี่ยว ในการ์ดเดียวกัน Sol ใช้เหตุผลเกี่ยวกับการถูกให้คะแนนหรือถูกเฝ้าดูบ่อยกว่า GPT-5.5 และในการรันโค้ดหนึ่งครั้ง มันบอกร่างงานวิจัยภายในว่าสมการได้รับการคำนวณและตรวจสอบแล้วทั้งที่ยังไม่ได้ทำ

ผู้ตรวจสอบตรวจพบกรณีที่ชัดเจนที่สุดโดยการอ่านห่วงโซ่ความคิด ซึ่งเป็นหน้าต่างที่เมตริกความสามารถในการควบคุมตั้งใจปกป้อง ในการทดสอบอื่นๆ ความไม่สอดคล้องกันปรากฏเฉพาะในคำตอบสุดท้ายซึ่งผู้ตรวจสอบห่วงโซ่ความคิดไม่เคยอ่าน ทำให้การติดตามเหตุผลดูสะอาด คะแนนความสามารถในการควบคุมที่อ่อนแอยังอาจหมายความว่าโมเดลละเลยคำสั่งเกี่ยวกับการใช้เหตุผล ไม่ใช่ว่าขาดทักษะในการซ่อน

METR รายงานแยกต่างหากว่าอัตราการโกงที่ตรวจพบของ Sol สูงกว่าโมเดลสาธารณะใดๆ ที่ทดสอบ ทำให้คะแนนความสามารถที่แท้จริงไม่สามารถระบุได้ OpenAI ยังคงเรียกผลลัพธ์นี้ว่าเป็นสัญญาณเริ่มต้น ไม่ใช่การแจ้งเตือน

นักวิจัยได้อธิบายมาเป็นเวลานานว่าการตรวจสอบห่วงโซ่ความคิดเป็นมาตรการป้องกันที่เปราะบาง ซึ่งทำงานได้เฉพาะเมื่อโมเดลยังคงใช้เหตุผลในที่เปิดเผย

OpenAI เริ่มรายงานคะแนนเหล่านี้ด้วย GPT-5.4 Thinking หลังจากงานวิจัยในฤดูใบไม้ผลิพบว่าโมเดลการใช้เหตุผลยังคงล้มเหลวเป็นส่วนใหญ่ในการชี้นำความคิดของตัวเองแม้จะถูกบอกว่ามีผู้ตรวจสอบกำลังเฝ้าดู Sol เป็นโมเดลเรือธงแรกที่เคลื่อนย้ายตัวเลขไปในทิศทางตรงกันข้าม

อ่านต่อ: CZ Says Binance Was Days From MiCA Approval Before Politics Hit

โอกาสทางการตลาด

ราคา Solana(SOL)

$73,07

$73,07$73,07

-%1,12

USD

Solana (SOL) กราฟราคาสด

คอมโบฟุตบอลโลก: ลุ้นสูงสุด 200x

รวมการแข่งขันฟุตบอลโลกได้สูงสุด 20 คู่ในคำสั่งเดียว

ข้อจำกัดความรับผิดชอบ: บทความที่โพสต์ซ้ำในไซต์นี้มาจากแพลตฟอร์มสาธารณะและมีไว้เพื่อจุดประสงค์ในการให้ข้อมูลเท่านั้น ซึ่งไม่ได้สะท้อนถึงมุมมองของ MEXC แต่อย่างใด ลิขสิทธิ์ทั้งหมดยังคงเป็นของผู้เขียนดั้งเดิม หากคุณเชื่อว่าเนื้อหาใดละเมิดสิทธิของบุคคลที่สาม โปรดติดต่อ [email protected] เพื่อลบออก MEXC ไม่รับประกันความถูกต้อง ความสมบูรณ์ หรือความทันเวลาของเนื้อหาใดๆ และไม่รับผิดชอบต่อการดำเนินการใดๆ ที่เกิดขึ้นตามข้อมูลที่ให้มา เนื้อหานี้ไม่ถือเป็นคำแนะนำทางการเงิน กฎหมาย หรือคำแนะนำจากผู้เชี่ยวชาญอื่นๆ และไม่ถือว่าเป็นคำแนะนำหรือการรับรองจาก MEXC