การศึกษาใหม่จากผู้สร้าง ChatGPT ชี้ว่าการฝึกโมเดลด้วยคุณลักษณะต่างๆ เช่น ความซื่อสัตย์ สามารถเพิ่มความปลอดภัยโดยรวมและต้านทานแรงกดดันจากฝ่ายตรงข้ามได้การศึกษาใหม่จากผู้สร้าง ChatGPT ชี้ว่าการฝึกโมเดลด้วยคุณลักษณะต่างๆ เช่น ความซื่อสัตย์ สามารถเพิ่มความปลอดภัยโดยรวมและต้านทานแรงกดดันจากฝ่ายตรงข้ามได้

OpenAI ฝึก AI ให้ซื่อสัตย์ และผลกระทบแพร่กระจายไปทุกที่

2026/06/20 12:50
1 นาทีในการอ่าน
หากมีข้อเสนอแนะหรือข้อกังวลเกี่ยวกับเนื้อหานี้ โปรดติดต่อเราได้ที่ [email protected]

นักวิจัยที่ OpenAI กล่าวว่าการเรียนรู้แบบเสริมแรงที่มุ่งเป้าไปที่คุณลักษณะที่เป็นประโยชน์สามารถปรับปรุงพฤติกรรมของ AI ได้อย่างกว้างขวาง โดยผลลัพธ์ที่ได้แพร่กระจายไปยังโดเมนใหม่และคงความมั่นคงภายใต้แรงกดดันจากการโจมตี

การฝึกอบรมคุณลักษณะของ OpenAI

ผลการวิจัยปรากฏในบทความที่เผยแพร่เมื่อวันที่ 18 มิ.ย. โดยผู้เขียนฝ่ายติดต่อ ได้แก่ Akshay V. Jagadeesh และ Karan Singhal ซึ่งสร้างชุดข้อมูลสังเคราะห์จากบทสนทนาที่สมจริงเพื่อฝึกและวัดคุณลักษณะต่างๆ เช่น ความซื่อสัตย์ ความอ่อนน้อมถ่อมตนทางญาณวิทยา และความเปิดกว้างต่อการแก้ไข โดยสถานการณ์ต่างๆ ครอบคลุมด้านสุขภาพ การศึกษา วิทยาศาสตร์ กฎหมาย และวิศวกรรม

ทีมงานได้นำข้อมูลส่วนหนึ่งจากชุดข้อมูลดังกล่าวผสมเข้าไปในการฝึกอบรมที่กว้างขึ้น จากนั้นเปรียบเทียบผลลัพธ์กับโมเดลที่สร้างด้วยการประมวลผลที่เท่ากัน โมเดลที่ผ่านการฝึกอบรมมีประสิทธิภาพดีขึ้นใน 44 จาก 53 เกณฑ์มาตรฐานทั้งภายในและภายนอกที่วัดการหลอกลวง การแฮ็กรางวัล และคำแนะนำที่เป็นอันตราย

อ่านเพิ่มเติม: Elon Musk's SpaceX Wipes Out $600B As Record IPO Mania Cools

การปรับแนวทางที่สามารถนำไปใช้ได้กว้างขวาง

ผู้เขียนกล่าวว่าผลลัพธ์ที่สำคัญกว่าคือการสรุปความรู้ การฝึกโมเดลให้มีพฤติกรรมที่ดีในโดเมนเดียวอย่างด้านสุขภาพ ช่วยปรับปรุงคะแนนในงานที่ไม่เกี่ยวข้อง รวมถึงการหลอกลวงและการแฮ็กรางวัล นอกจากนี้ยังต้านทานพรอมต์ที่เป็นอันตรายและการปรับแต่งละเอียดที่เป็นอันตรายได้ดีกว่าโมเดลพื้นฐาน ในขณะที่ยังคงตอบสนองต่อคำขอที่ถูกต้องตามกฎหมาย

งานวิจัยนี้ต่อยอดจากผลการวิจัยก่อนหน้าที่ทีมงานเรียกว่า emergent misalignment ในงานวิจัยนั้น โมเดลที่ถูกสอนให้มีนิสัยที่ไม่ดีเพียงอย่างเดียว เช่น การเขียนโค้ดที่ไม่ปลอดภัย เริ่มแสดงพฤติกรรมที่ไม่ดีในสถานการณ์ที่ไม่เกี่ยวข้อง ซึ่งเป็นรูปแบบที่การศึกษานี้มุ่งหมายที่จะพลิกกลับ

อ่านต่อ: OpenAI Snags Gemini Co-Lead And Trump's AI Aide Pre-IPO

โอกาสทางการตลาด
Effect AI โลโก้
ราคา Effect AI(EFFECT)
$0.002556
$0.002556$0.002556
+0.23%
USD
Effect AI (EFFECT) กราฟราคาสด

คอมโบฟุตบอลโลก: ลุ้นสูงสุด 200x

คอมโบฟุตบอลโลก: ลุ้นสูงสุด 200xคอมโบฟุตบอลโลก: ลุ้นสูงสุด 200x

รวมการแข่งขันฟุตบอลโลกได้สูงสุด 20 คู่ในคำสั่งเดียว

ข้อจำกัดความรับผิดชอบ: บทความที่โพสต์ซ้ำในไซต์นี้มาจากแพลตฟอร์มสาธารณะและมีไว้เพื่อจุดประสงค์ในการให้ข้อมูลเท่านั้น ซึ่งไม่ได้สะท้อนถึงมุมมองของ MEXC แต่อย่างใด ลิขสิทธิ์ทั้งหมดยังคงเป็นของผู้เขียนดั้งเดิม หากคุณเชื่อว่าเนื้อหาใดละเมิดสิทธิของบุคคลที่สาม โปรดติดต่อ [email protected] เพื่อลบออก MEXC ไม่รับประกันความถูกต้อง ความสมบูรณ์ หรือความทันเวลาของเนื้อหาใดๆ และไม่รับผิดชอบต่อการดำเนินการใดๆ ที่เกิดขึ้นตามข้อมูลที่ให้มา เนื้อหานี้ไม่ถือเป็นคำแนะนำทางการเงิน กฎหมาย หรือคำแนะนำจากผู้เชี่ยวชาญอื่นๆ และไม่ถือว่าเป็นคำแนะนำหรือการรับรองจาก MEXC

คุณอาจชอบเช่นกัน

หุ้น Vertiv (VRT) พุ่งขึ้น 90% ในปี 2026 — ยังคุ้มค่าที่จะซื้อในระดับราคานี้อยู่ไหม?

หุ้น Vertiv (VRT) พุ่งขึ้น 90% ในปี 2026 — ยังคุ้มค่าที่จะซื้อในระดับราคานี้อยู่ไหม?

VRT เพิ่มขึ้น 89.65% นับตั้งแต่ต้นปี โดยซื้อขายที่ $333.05 มีมูลค่าตลาด $121.99 พันล้าน การประเมินมูลค่าที่เป็นธรรมที่ได้รับความนิยมอย่างกว้างขวางประเมิน VRT ไว้ที่ $408.64 ซึ่งบ่งชี้ว่า
แชร์
Coincentral2026/06/20 18:45
เงินเยนญี่ปุ่นใกล้แตะระดับต่ำสุดในรอบ 40 ปี ขณะที่ความแข็งแกร่งของดอลลาร์สหรัฐจุดชนวนความวิตกในตลาดโลก

เงินเยนญี่ปุ่นใกล้แตะระดับต่ำสุดในรอบ 40 ปี ขณะที่ความแข็งแกร่งของดอลลาร์สหรัฐจุดชนวนความวิตกในตลาดโลก

เยนญี่ปุ่นใกล้แตะระดับต่ำสุดในรอบ 40 ปี ขณะที่ดอลลาร์สหรัฐแข็งค่าต่อเนื่อง ส่งสัญญาณเตือนตลาดการเงินโลก ตลาดอัตราแลกเปลี่ยนทั่วโลกกำลังเผชิญกับความผันผวนที่กลับมาอีกครั้ง
แชร์
Hokanews2026/06/20 18:02
มีผู้เสียชีวิตหนึ่งรายหลังรถไฟบรรทุกสินค้าชนกันในมิวนิก

มีผู้เสียชีวิตหนึ่งรายหลังรถไฟบรรทุกสินค้าชนกันในมิวนิก

มิวนิก, 20 มิถุนายน — มีผู้เสียชีวิตหนึ่งรายหลังจากรถไฟบรรทุกสินค้าสองขบวนชนกันบนสะพานในมิวนิกใน...
แชร์
Malaymail2026/06/20 18:36

ลุ้นรับส่วนแบ่ง 50K USDT

ลุ้นรับส่วนแบ่ง 50K USDTลุ้นรับส่วนแบ่ง 50K USDT

ทำภารกิจ DEX+ ให้สำเร็จเพื่อปลดล็อกวงล้อแชมป์