OpenAI เปิดตัวโมเดล o3 โมเดลที่พยายามคิดเป็นขั้น โดยมุ่งเป้าแก้ปัญหาที่ยากมาก เช่น ปัญหาคณิตศาสตร์ระดับงานวิจัยที่แม้แต่นักคณิตศาสตร์ก็อาจจะ
ก่อนหน้านี้ GPT-3 ทำคะแนน ARC-AGI ได้ 0% GPT-4o ได้ 5% และ o1 ได้สูงสุด 32% ความพิเศษของ ARC-AGI คือมันเป็นปัญหาที่ต้องทำความเข้าใจกฎของแต่ละปัญหาโดยไม่ซ้ำกันเลยในแต่ละข้อ แต่ o3 ในโหมดคำนวณแบบไม่สนงบประมาณสามารถทำคะแนนได้สูงถึง 87.5% แซงหน้ามนุษย์ทั่วไปแล้ว ขณะที่โหมดปกติทำคะแนนได้ 75.
ทาง ARC-AGI ระบุว่าที่ผ่านมาสามารถจ้างคนมานั่งแก้ปัญหาโดยใช้เงินประมาณข้อละ 5 ดอลลาร์ ตอนนี้ต้นทุนการรัน AI จึงแพงกว่ามนุษย์อยู่ดี แต่ก็คาดว่าต้นทุนการรันจะถูกลงมากในอนาคตARC-AGI serves as a critical benchmark for detecting such breakthroughs, highlighting generalization power in a way that saturated or less demanding benchmarks cannot. However, it is important to note that ARC-AGI is not an acid test for AGI – as we've repeated dozens of times this year.
Passing ARC-AGI does not equate to achieving AGI, and, as a matter of fact, I don't think o3 is AGI yet. o3 still fails on some very easy tasks, indicating fundamental differences with human intelligence. Furthermore, early data points suggest that the upcoming ARC-AGI-2 benchmark will still pose a significant challenge to o3, potentially reducing its score to under 30% even at high compute . This demonstrates the continued possibility of creating challenging, unsaturated benchmarks without having to rely on expert domain knowledge. You'll know AGI is here when the exercise of creating tasks that are easy for regular humans but hard for AI becomes simply impossible.
ประเทศไทย ข่าวล่าสุด, ประเทศไทย หัวข้อข่าว
Similar News:คุณยังสามารถอ่านข่าวที่คล้ายกันนี้ซึ่งเรารวบรวมจากแหล่งข่าวอื่น ๆ ได้
สงคราม AI ปะทุ! OpenAI เปิดตัว 'o3' หวังท้าชน GoogleOpenAI เตรียมปล่อย 'o3' และ 'o3 mini' โมเดล AI รุ่นใหม่ ล้ำกว่า ฉลาดกว่า หวังสู้ศึก Google ชิงความเป็นหนึ่งด้าน AI
อ่านเพิ่มเติม »
OpenAI เปิดตัว o3 โมเดลที่ ‘คิดอย่างมีเหตุผล’ กว่าเดิม พร้อมแข่งกับ Gemini 2.0 ของ GoogleOpenAI ประกาศเปิดตัว o3 และ o3-mini ตระกูลโมเดลที่บริษัทอ้างว่ามีการ ‘คิดอย่างมีเหตุผล’ ซึ่งปัจจุบันบริษัทกำลังทดสอบประสิทธิภาพและความปลอดภัย
อ่านเพิ่มเติม »
จับผู้ต้องหา 2 คน ที่กระทำความผิดฐานค้ามนุษย์เจ้าหน้าที่ตำรวจจับกุม 2 ผู้ต้องหา น.ส.ปณิดา และ น.ส.นลัทพร ที่กระทำความผิดฐานค้ามนุษย์ หลังชักชวนและนำพาหญิงสาวอายุต่ำกว่า 18 ปี ไปขายบริการทางเพศให้กลุ่มนายทุนจีนเทา ซึ่งผู้เสียหายจะได้รับค่าตอบแทน 120,000 บาท
อ่านเพิ่มเติม »
สำนักงานสลากกินแบ่งรัฐบาลจัดกิจกรรมประกวดคลิปสั้นเพื่อสังคมสำนักงานสลากกินแบ่งรัฐบาล (GLO) จัดกิจกรรมประกวดคลิปสั้นเพื่อส่งเสริมการมีส่วนร่วมในสังคม ภายใต้หัวข้อ 'ส่งต่อการให้… รับพลังแห่งความสุข Give hope, get happiness.!' ชิงเงินรางวัลรวมกว่า 120,000 บาท
อ่านเพิ่มเติม »
ต้านสุดแรง! อีลอน มัสก์ ยื่นร้องศาล ขวาง OpenAI ไม่ให้เปลี่ยนรูปแบบธุรกิจไปเป็น ‘บริษัทแสวงหาผลกำไร’อีลอน มัสก์ ร้องต่อศาลรัฐบาลกลางสหรัฐฯ ช่วยห้าม OpenAI ไม่ให้เปลี่ยนรูปแบบธุรกิจไปเป็นบริษัทแสวงหาผลกำไรอย่างสมบูรณ์ (For-Profit) หลังกล่าวหาว่า OpenAI ...
อ่านเพิ่มเติม »
xAI ของอีลอน มัสก์ อาจเปิดตัว Grok ในเดือนธ.ค.นี้xAI อาจเปิดตัว Grok ในเดือนธ.ค.นี้ ผู้คนมองว่ามัสก์ตั้ง xAI เพื่อเป็นทางเลือกแทน OpenAI เนื่องจากมัสก์ไม่เห็นด้วยกับการที่ OpenAI กลายเป็นองค์กรที่แสวงผลกำไรและไม่สามารถควบคุมทิศทางการพัฒนา AI ได้เต็มที่ในระยะยาว
อ่านเพิ่มเติม »