Anthropic ได้เสนอกรอบนโยบาย AI ใหม่ขณะที่ระบบขั้นสูงมีความสามารถที่แข็งแกร่งยิ่งขึ้น
บริษัทต้องการให้รัฐบาลกำหนดกฎสำหรับโมเดลชั้นแนวหน้าและเตรียมพร้อมแรงงานสำหรับผลกระทบทางเศรษฐกิจของ AI แผนดังกล่าวครอบคลุมการใช้งานที่เป็นอันตราย การทดสอบอิสระ ความปลอดภัยทางไซเบอร์ และความยืดหยุ่นของสาธารณะ
Anthropic เสนอข้อเสนอสองประการภายใต้แผน "Policy on the AI Exponential" กรอบ Advanced AI Framework มุ่งเน้นที่โมเดลที่มีประสิทธิภาพสูง ในขณะที่ Economic Policy Framework ดูแลเรื่องแรงงานและผลประโยชน์ทางการเงินร่วมกัน บริษัทโต้แย้งว่า AI ในปัจจุบันพัฒนาเร็วกว่าระบบการกำหนดนโยบายในปัจจุบัน และยังระบุว่ารัฐบาลต้องการอำนาจในการระงับหรือยับยั้งการใช้งานโมเดลที่เป็นอันตราย
ภายใต้แผนดังกล่าว โทษทางแพ่งจะผูกกับรายได้ประจำปีทั่วโลก การละเมิดซ้ำจะนำไปสู่โทษที่สูงขึ้นตามกรอบที่เสนอ กรอบดังกล่าวยังเรียกร้องให้นักพัฒนาชั้นแนวหน้าทดสอบโมเดลก่อนเปิดตัว นักพัฒนาจะเผยแพร่บทสรุป กรอบความปลอดภัย และการ์ดระบบสำหรับระบบ AI ที่มีประสิทธิภาพสูง
ผู้ประเมินอิสระจะตรวจสอบการทดสอบโมเดลและรายงานความเสี่ยง Anthropic ยังต้องการให้นักพัฒนาบำรุงรักษาโปรแกรมความปลอดภัยที่แข็งแกร่งสำหรับน้ำหนักโมเดลและระบบการฝึกอบรม ข้อเสนอสนับสนุนกฎหมายความโปร่งใสในรัฐต่างๆ เช่น แคลิฟอร์เนียและนิวยอร์ก อย่างไรก็ตาม บริษัทโต้แย้งว่าการเปิดเผยข้อมูลต่อสาธารณะเพียงอย่างเดียวไม่สอดคล้องกับความเร็วของการพัฒนา AI อีกต่อไป
กฎที่เสนอจะใช้กับระบบ AI ขั้นสูงที่สุดเท่านั้น Anthropic กำหนดเกณฑ์ที่โมเดลที่ฝึกอบรมเกิน 10²⁵ การดำเนินการทศนิยมลอยตัว กรอบดังกล่าวจะครอบคลุมบริษัทที่มีรายได้มากกว่า 500 ล้านดอลลาร์จากรายได้ที่เกี่ยวข้องกับ AI บริษัทที่ใช้จ่ายมากกว่า 1 พันล้านดอลลาร์ในการวิจัยและพัฒนา AI ก็จะอยู่ภายใต้กรอบนี้ด้วย
Anthropic ระบุพื้นที่ความเสี่ยงหลักสี่ประการในข้อเสนอ ได้แก่ ความเสี่ยงทางชีวภาพ ความเสี่ยงทางไซเบอร์ การสูญเสียการควบคุม และการวิจัย AI อัตโนมัติ สำหรับความเสี่ยงทางชีวภาพ บริษัทเตือนว่าระบบที่ไม่ปลอดภัยอาจช่วยผู้โจมตีพัฒนาไวรัสที่เป็นอันตราย และยังระบุว่าเครื่องมือ AI ที่คล้ายกันสามารถสนับสนุนการค้นพบยา
สำหรับความเสี่ยงทางไซเบอร์ โมเดลชั้นแนวหน้าสามารถค้นหาข้อบกพร่องของซอฟต์แวร์ที่ร้ายแรงในวงกว้าง Anthropic ระบุว่าความสามารถเหล่านั้นก่อให้เกิดความกังวลต่อโรงพยาบาล โครงข่ายพลังงาน และระบบสำคัญอื่นๆ บริษัทยังเน้นย้ำถึงความเสี่ยงจากระบบที่ทำงานนอกเหนือการควบคุมของนักพัฒนา การวิจัย AI อัตโนมัติอาจเพิ่มความเสี่ยงทางชีวภาพ ไซเบอร์ และการควบคุม หากมาตรการป้องกันล้มเหลว
Anthropic ต้องการให้นักพัฒนาชั้นแนวหน้าเผยแพร่รายงานความเสี่ยงเป็นประจำ รายงานเหล่านี้จะอธิบายสถานะความเสี่ยงโดยรวมของนักพัฒนาและงานด้านความปลอดภัยของโมเดล กรอบดังกล่าวยังเรียกร้องให้มีผู้ประเมินอิสระที่มีคุณสมบัติอย่างน้อยหนึ่งราย ผู้ประเมินนั้นจะตรวจสอบการประเมินของบริษัทและเผยแพร่ผลการค้นพบในรายงานความเสี่ยงของโมเดล
รัฐบาลและอุตสาหกรรมจะกำหนดมาตรฐานสำหรับผู้ประเมินเหล่านั้นด้วย ข้อเสนอระบุว่าผู้ประเมินต้องการเงินทุนและการเข้าถึงโมเดลชั้นแนวหน้า กฎความปลอดภัยเป็นส่วนสำคัญอีกส่วนหนึ่งของกรอบ นักพัฒนาจะปกป้องสภาพแวดล้อมการพัฒนาทั้งหมดจากผู้โจมตีภายนอกและภัยคุกคามจากภายใน
บริษัทจะอธิบายโปรแกรมความปลอดภัยของตนต่อสาธารณะในระดับสูง และจะแบ่งปันรายละเอียดเพิ่มเติมกับหน่วยงานรัฐบาลที่กำหนดเมื่อมีการร้องขอ Anthropic ระบุว่าผู้กำหนดนโยบายสามารถเริ่มต้นด้วยกฎที่เบากว่าและปรับเปลี่ยนตามเวลา กรอบดังกล่าวระบุว่าการกำกับดูแลควรเป็นไปตามความสามารถของโมเดลและมาตรฐานการประเมิน
ส่วนที่สองของกรอบมุ่งเน้นที่ความยืดหยุ่นของสาธารณะ Anthropic แนะนำการวางแผนที่เข้มแข็งขึ้นสำหรับความเสี่ยง AI ที่เกี่ยวข้องกับชีวภาพ ไซเบอร์ และการควบคุม สำหรับด้านชีววิทยา ข้อเสนอรวมถึงการตรวจคัดกรองการสังเคราะห์ยีนและการเฝ้าระวังทางชีวภาพแบบเตือนล่วงหน้า นอกจากนี้ยังกล่าวถึงสต็อกอุปกรณ์ป้องกันและเครื่องมือเพื่อลดการแพร่กระจายทางอากาศ
สำหรับด้านไซเบอร์ กรอบเรียกร้องให้มีซอฟต์แวร์อินเทอร์เน็ตที่แข็งแกร่งขึ้นและการสนับสนุนผู้ดำเนินการโครงสร้างพื้นฐานที่สำคัญ และแนะนำให้เปลี่ยนระบบเดิมในโครงสร้างพื้นฐานที่จำเป็น รัฐบาลควรติดตามความสามารถทางไซเบอร์ชั้นแนวหน้าผ่านฟังก์ชันเฉพาะ Anthropic เสนอการทำงานร่วมกันระหว่างรัฐบาลและอุตสาหกรรมในมาตรการป้องกันโมเดล
บริษัทระบุว่างานเกี่ยวกับความเสี่ยงจากการสูญเสียการควบคุมและการวิจัยอัตโนมัติยังพัฒนาได้น้อย เรียกร้องให้มีเครื่องมือที่ดีกว่าในการตรวจจับ ควบคุม หรือปิดระบบที่ไม่ปลอดภัย Anthropic กระตุ้นให้ผู้กำหนดนโยบายดำเนินการขณะที่ความสามารถของโมเดลยังคงพัฒนาต่อไป บริษัทระบุว่าการกำกับดูแล AI ต้องก้าวทันเทคโนโลยี


