\ Pergeseran terjadi lebih cepat dari yang diprediksi siapa pun. Suatu hari, AI melengkapi kalimat kita secara otomatis. Keesokan harinya, AI bergabung dalam rapat kita, merangkum percakapan kita, dan menyusun pesan tindak lanjut atas nama kita. Sekarang AI membuat keputusan.
Saya telah menghabiskan bertahun-tahun meneliti bagaimana tim berkolaborasi melalui platform cerdas, dan apa yang saya saksikan saat ini merupakan transformasi paling signifikan dalam dinamika tempat kerja sejak diperkenalkannya email. Agen AI bukan lagi alat yang kita gunakan. Mereka adalah peserta yang bekerja bersama kita.
Perbedaan ini sangat penting bagi peneliti UX. Metode yang kami kembangkan untuk mengevaluasi fitur perangkat lunak tidak berlaku ketika perangkat lunak tersebut mulai berperilaku seperti anggota tim.
Penelitian UX tradisional mengajukan pertanyaan seperti: Apakah fitur ini dapat ditemukan? Apakah interaksinya intuitif? Apakah mengurangi gesekan dalam alur kerja?
Pertanyaan-pertanyaan ini mengasumsikan AI bersifat pasif, menunggu input pengguna sebelum merespons. Tetapi agen AI beroperasi secara berbeda. Mereka mengamati, menafsirkan, memutuskan, dan bertindak. Menurut penelitian MIT Sloan Management Review dan Boston Consulting Group tahun 2025, 35% organisasi telah mulai menggunakan AI agentic, dengan 44% lainnya berencana untuk mengadopsinya segera. Namun 47% menunjukkan mereka tidak memiliki strategi untuk apa yang akan mereka lakukan dengan AI. Kesenjangan antara adopsi dan pemahaman ini justru di mana penelitian UX harus masuk.
Ketika agen AI bergabung dengan platform kolaborasi, itu mengubah dinamika sosial tim. Ini memengaruhi siapa yang berbicara, kapan mereka berbicara, dan apa yang mereka rasa nyaman untuk dikatakan. Mengevaluasi pergeseran ini membutuhkan metode yang jauh melampaui pengujian kegunaan.
\ 
Dalam pekerjaan saya memimpin penelitian UX untuk platform kolaborasi cerdas, saya telah mengembangkan kerangka evaluasi yang dirancang khusus untuk agen AI yang beroperasi di lingkungan perusahaan. Pekerjaan ini berada di persimpangan strategi produk, pengembangan AI, dan penelitian faktor manusia.
Evaluasi AI dalam konteks ini secara fundamental berbeda dari benchmarking model tradisional. Ketika agen AI beroperasi dalam platform kolaborasi, kita tidak bisa hanya mengukur akurasi atau kualitas respons secara terpisah. Kita harus mengevaluasi bagaimana agen tersebut berkinerja dalam dinamika sosial dan operasional yang kompleks dari tim nyata.
Saya mendekati evaluasi AI untuk kolaborasi perusahaan melalui tiga lapisan yang saling terhubung. Lapisan pertama memeriksa kinerja fungsional: apakah agen dengan benar mengidentifikasi item tindakan, merangkum diskusi secara akurat, dan menampilkan informasi yang relevan pada saat yang tepat? Lapisan kedua menilai kualitas integrasi: seberapa mulus agen beroperasi dalam alur kerja yang ada tanpa menciptakan gesekan atau memerlukan perubahan perilaku dari pengguna? Lapisan ketiga, dan yang paling sering diabaikan, mengevaluasi dampak sistemik: bagaimana kehadiran agen memengaruhi dinamika tim, kualitas keputusan, dan efektivitas kolaborasi dari waktu ke waktu?
Penelitian Harvard Business Review dari Mei 2025 menggambarkan agen AI sebagai "rekan tim digital" yang mewakili kategori bakat yang sedang berkembang. Kerangka ini menuntut agar kita mengevaluasi agen AI tidak hanya pada penyelesaian tugas, tetapi pada seberapa baik mereka berfungsi sebagai peserta tim. Protokol evaluasi saya menggabungkan pengamatan perilaku, pelacakan longitudinal, dan analisis hasil yang sepenuhnya terlewatkan oleh benchmark AI tradisional.
Organisasi yang mencapai hasil terkuat adalah mereka yang menanamkan penelitian UX langsung ke dalam siklus evaluasi AI mereka, menggunakan metrik berpusat pada manusia bersama dengan ukuran kinerja teknis.
\
Frontier berikutnya untuk platform kolaborasi perusahaan adalah agen AI yang sangat dipersonalisasi yang beradaptasi dengan pengguna individu, budaya tim, dan konteks organisasi. Di sinilah penelitian UX menjadi tidak hanya evaluatif tetapi generatif, secara langsung membentuk bagaimana agen ini dirancang dan digunakan.
Saya telah memimpin inisiatif penelitian yang menginformasikan pengembangan strategis agen AI yang dipersonalisasi untuk platform kolaborasi. Pekerjaan ini melibatkan pemahaman pola spesifik tentang bagaimana berbagai jenis pengguna berinteraksi dengan AI, bagaimana gaya komunikasi tim bervariasi di seluruh fungsi dan geografi, dan bagaimana budaya organisasi memengaruhi apa yang diharapkan pengguna dari bantuan AI.
Penelitian McKinsey November 2025 tentang kemitraan AI mencatat bahwa mewujudkan potensi AI memerlukan perancangan ulang alur kerja sehingga orang, agen, dan robot dapat bekerja sama secara efektif. Dari perspektif strategi produk, ini berarti agen AI tidak bisa satu ukuran untuk semua. Mereka harus menyesuaikan gaya komunikasi, frekuensi intervensi, dan tingkat otonomi berdasarkan preferensi pengguna dan faktor kontekstual.
Penelitian saya telah mengidentifikasi beberapa dimensi personalisasi yang paling penting dalam konteks kolaborasi perusahaan. Pencocokan gaya komunikasi memastikan agen mencerminkan bagaimana pengguna secara alami mengekspresikan diri mereka, baik formal atau santai, detail atau ringkas. Kalibrasi waktu intervensi mempelajari kapan pengguna individu lebih memilih bantuan proaktif versus kapan mereka ingin bekerja tanpa gangguan. Penyesuaian ambang kepercayaan mengakui bahwa pengguna yang berbeda memiliki tingkat kenyamanan yang berbeda dengan otonomi AI dan mengkalibrasi sesuai dengan itu.
Implikasi strategisnya signifikan. Tim produk yang membangun agen AI untuk platform kolaborasi membutuhkan input penelitian UX yang berkelanjutan untuk memahami bagaimana fitur personalisasi berkinerja di seluruh populasi pengguna yang beragam. Tanpa dasar penelitian ini, upaya personalisasi berisiko menciptakan agen yang terasa mengganggu bagi beberapa pengguna sementara tampak tidak membantu bagi yang lain.
Melalui penelitian lapangan yang ekstensif dengan tim lintas fungsi yang mengadopsi agen AI dalam alur kerja kolaborasi mereka, saya telah mengembangkan kerangka evaluasi yang dibangun di sekitar empat dimensi yang diabaikan oleh metode tradisional.
Saya baru-baru ini melakukan studi delapan minggu dengan tim produk terdistribusi yang mengimplementasikan agen AI di seluruh platform kolaborasi mereka. Agen tersebut dirancang untuk menghadiri rapat, menghasilkan ringkasan, melacak keputusan, dan secara proaktif menampilkan informasi yang relevan.
Metrik awal terlihat sangat baik: 94% akurasi item tindakan, peringkat kepuasan 4,2 dari 5. Tetapi pengamatan perilaku mengungkapkan masalah yang tidak terlihat oleh dasbor. Durasi rapat turun 18% karena anggota tim mempercepat diskusi, sadar bahwa setiap kata direkam. Pada minggu ketiga, kesalahan atribusi memicu beban verifikasi yang menghabiskan lebih banyak waktu daripada dokumentasi yang digantikannya. Anggota tim juga mengembangkan apa yang saya sebut "sindrom ketergantungan ringkasan," hanya mengandalkan ringkasan AI dan kehilangan konteks penting.
Berdasarkan temuan ini, tim mengkonfigurasi ulang agen AI, mengurangi ruang lingkup fungsionalnya sebesar 60%. Mereka menghapus fitur proaktif sambil mempertahankan tugas dokumentasi di mana akurasi tinggi. Metrik adopsi tradisional akan menandai ini sebagai kegagalan. Tetapi ukuran efektivitas tim menceritakan kisah yang berbeda: kualitas keputusan meningkat, partisipasi rapat menjadi lebih adil, dan beban verifikasi turun ke tingkat yang berkelanjutan.
Temuan paling signifikan muncul dari wawancara. Beberapa anggota tim menggambarkan perasaan "diawasi" selama fase otonomi penuh. Efek mendinginkan pada komunikasi otentik ini tidak pernah muncul dalam metrik dasbor mana pun.
\ 
\
Berdasarkan penelitian ini dan studi serupa, saya merekomendasikan metode berikut untuk mengevaluasi agen AI dalam pengaturan kolaboratif.
Agen AI akan menjadi di mana-mana dalam kolaborasi perusahaan. Pertanyaan penelitian bukan apakah organisasi akan mengadopsi mereka, tetapi bagaimana mereka akan mengintegrasikannya secara efektif.
Peneliti UX memiliki peran penting dalam membentuk integrasi ini. Kami memiliki metode untuk memahami perilaku manusia dan kerangka kerja untuk mengevaluasi kualitas pengalaman. Organisasi yang melakukan ini dengan benar akan membangun sistem kolaborasi di mana manusia dan agen AI benar-benar saling melengkapi. Mereka yang memperlakukan agen AI hanya sebagai fitur lain akan menemukan tim mereka bekerja kurang efektif daripada sebelum teknologi tersebut tiba.
\


