Sentient mengumpulkan kohort global dari para pembangun dan pendukung, termasuk Founders Fund, Pantera, Franklin Templeton, alphaXiv, Fireworks, dan OpenRouter, untuk menyelesaikanSentient mengumpulkan kohort global dari para pembangun dan pendukung, termasuk Founders Fund, Pantera, Franklin Templeton, alphaXiv, Fireworks, dan OpenRouter, untuk menyelesaikan

Founders Fund, Pantera, Dan Franklin Templeton Bergabung dengan 'Arena' Sentient Untuk Menguji Tekanan Agen AI Perusahaan

2026/02/27 22:00
durasi baca 4 menit
Untuk memberikan masukan atau menyampaikan kekhawatiran terkait konten ini, silakan hubungi kami di [email protected]
Founders Fund, Pantera, Dan Franklin Templeton Bergabung dengan 'Arena' Sentient Untuk Menguji Tekanan Agen AI Perusahaan

Perusahaan telah menghabiskan dua tahun terakhir berlomba memasukkan agen AI ke dalam alur kerja nyata, dari dukungan pelanggan dan operasi back-office hingga proses pengambilan keputusan yang berat di bidang keuangan dan kepatuhan. Sekarang sistem-sistem tersebut semakin terintegrasi ke dalam alur kerja nyata, masalah baru muncul: agen dapat mengambil informasi, tetapi mereka sering kesulitan memberikan penalaran yang konsisten dan dapat dijelaskan ketika pekerjaan menjadi rumit, multi-langkah, atau berisiko tinggi.

Hari ini, laboratorium AI open-source Sentient meluncurkan Arena, lingkungan tingkat produksi langsung di mana ribuan pengembang AI melakukan uji tekanan terhadap pendekatan yang bersaing untuk masalah penalaran tersulit perusahaan. Kelompok pertama yang berpartisipasi dalam fase awal Arena mencakup Founders Fund, Pantera, dan Franklin Templeton ($1,5T+ AUM) — menandakan minat institusional awal dalam evaluasi terstruktur agen AI sebelum penerapan produksi.
"Saat perusahaan ingin menerapkan agen AI di seluruh riset, operasi, dan alur kerja yang menghadap klien, pertanyaannya bukan lagi apakah sistem ini kuat... tetapi apakah mereka dapat diandalkan dalam alur kerja nyata," kata Julian Love, Managing Principal, Franklin Templeton Digital Assets.

Love menambahkan bahwa lingkungan terstruktur seperti Arena akan membantu memisahkan ide-ide yang menjanjikan dari kemampuan yang siap produksi.

"Agen AI bukan lagi eksperimen di dalam perusahaan; mereka dimasukkan ke dalam alur kerja yang menyentuh pelanggan, uang, dan hasil operasional," kata Himanshu Tyagi, co-founder di Sentient. "Pergeseran itu mengubah apa yang penting. Tidak cukup bagi sistem untuk mengesankan dalam demo. Perusahaan perlu tahu apakah agen dapat bernalar dengan andal dalam produksi, di mana kegagalan mahal, dan kepercayaan rapuh. Mereka memerlukan komparabilitas, repeatabilitas, dan cara untuk melacak peningkatan keandalan dari waktu ke waktu – terlepas dari model atau tooling apa yang mereka gunakan di bawahnya."

Arena mereplikasi realitas yang berantakan dari alur kerja perusahaan: informasi yang tidak lengkap, konteks panjang, instruksi yang ambigu, dan sumber yang bertentangan. Alih-alih menilai apakah agen mendapat "jawaban yang benar," Arena merekam jejak penalaran lengkap sehingga tim teknik dapat men-debug kegagalan dan memverifikasi peningkatan dari waktu ke waktu.

Ini menyediakan tolok ukur netral dan vendor-agnostic untuk mengevaluasi penalaran di seluruh model dan stack. Dengan fokus pada kinerja tingkat produksi daripada demo, Arena menciptakan kemampuan agen yang dapat diverifikasi dan berisiko tinggi yang dapat diadaptasi perusahaan ke data pribadi dan alat internal mereka sendiri.

Dalam tantangan pertamanya, pengembang yang bergabung dengan Arena akan fokus pada hambatan perusahaan fundamental: penalaran dokumen. Agen AI akan diberi tugas untuk bernalar dan menghitung atas data kompleks yang tidak terstruktur – jenis pekerjaan yang mendasari analisis keuangan, investigasi akar masalah, memo investasi, dan layanan pelanggan.

Peserta tambahan dalam fase awal termasuk alphaXiv, Fireworks, Openhands, dan OpenRouter, dengan lebih banyak yang diharapkan saat Arena berkembang di seluruh tugas, industri, dan integrasi model.

Survei terbaru menggarisbawahi kesenjangan yang ditargetkan Arena. 85% bisnis mengatakan mereka ingin menjadi "perusahaan agentic" dan hampir tiga dari empat berencana menerapkan agen otonom, namun kurang dari seperempat melaporkan tata kelola yang matang, dan banyak yang kesulitan bergerak dari pilot ke produksi dalam skala besar. Perusahaan sudah menjalankan, rata-rata, selusin agen, sering kali dalam silo, dan banyak yang menyebutkan bahwa menambahkan lebih banyak agen akan menciptakan lebih banyak kompleksitas daripada nilai tanpa orkestrasi yang lebih baik.
"Di OpenHands, kami selalu bersemangat mendukung pembuat yang menggunakan agen untuk memecahkan masalah praktis," kata Graham Neubig, Chief Scientist dan co-founder OpenHands. "Kami senang mendukung peserta yang menggunakan OpenHands Software Agent SDK untuk menavigasi tantangan kompleks ini."

"Arena adalah jenis inisiatif yang mendorong AI open-source ke depan – mereka memungkinkan peneliti untuk bersaing, beritasi, dan berinovasi di depan umum. Kami bersemangat untuk memperdalam kemitraan kami dengan Sentient dan menyediakan infrastruktur yang membuat eksperimen lebih cepat dan lebih mudah untuk ditingkatkan," kata Alex Atallah, Co-founder & CEO, OpenRouter.

Arena akan diluncurkan secara global, mengundang ribuan pengembang AI untuk mendaftar untuk kelompok eksklusif pertama, dengan acara langsung yang berpusat di San Francisco dimulai dari Maret 2026.

Postingan Founders Fund, Pantera, Dan Franklin Templeton Bergabung dengan 'Arena' Sentient Untuk Menguji Tekanan Agen AI Perusahaan muncul pertama kali di Metaverse Post.

Peluang Pasar
Logo Franklin
Harga Franklin(FRANKLIN)
$0.00019994
$0.00019994$0.00019994
-23.05%
USD
Grafik Harga Live Franklin (FRANKLIN)
Penafian: Artikel yang diterbitkan ulang di situs web ini bersumber dari platform publik dan disediakan hanya sebagai informasi. Artikel tersebut belum tentu mencerminkan pandangan MEXC. Seluruh hak cipta tetap dimiliki oleh penulis aslinya. Jika Anda meyakini bahwa ada konten yang melanggar hak pihak ketiga, silakan hubungi [email protected] agar konten tersebut dihapus. MEXC tidak menjamin keakuratan, kelengkapan, atau keaktualan konten dan tidak bertanggung jawab atas tindakan apa pun yang dilakukan berdasarkan informasi yang diberikan. Konten tersebut bukan merupakan saran keuangan, hukum, atau profesional lainnya, juga tidak boleh dianggap sebagai rekomendasi atau dukungan oleh MEXC.