Artificial intelligence telah mencapai lonjakan dramatik dalam tahun 2023 dan 2024. Model-model semakin besar, hasilnya semakin lancar, dan demo-demo yang ditunjukkan semakin mengagumkan. Namun, banyak produk AI masih terus berjuang untuk melampaui status “sekadar kebaruan”. Walaupun hasilnya menarik perhatian, produk tersebut jarang benar-benar sesuai dengan alur kerja kreatif atau organisasi yang sebenarnya. Teknik pengoptimuman petunjuk (prompt engineering) berkembang pesat, tetapi ketekunan, kesinambungan, dan kolaborasi jangka panjang masih sukar dicapai.
Kesenjangan antara kemampuan model dan kegunaan sebenar inilah yang menjadi fokus dalam kerja Yi Luo.

Bukan sekadar memandang AI sebagai mesin yang menghasilkan output secara terpisah, Luo mendekati AI sebagai rakan kongsi yang harus dirancang secara sengaja. Fokus kerjanya adalah membina sistem interaksi yang membolehkan kreativiti AI bertahan lama, berskala luas dalam pelbagai konteks dan modality, serta terintegrasi secara semula jadi ke dalam cara orang bekerja.
Pendekatan ini membawa kepada apa yang beliau namakan Kerangka Interaksi Multimodal Berpusat pada Watak.
Asal Usul Akademik di Universiti Carnegie Mellon
Yi Luo mula mengembangkan Kerangka Interaksi Multimodal Berpusat pada Watak semasa menyiapkan tesis sarjana di Universiti Carnegie Mellon. Penyelidikannya meneliti bagaimana kolaborasi manusia-AI terputus apabila interaksi dianggap sebagai sesuatu yang sementara—di mana identiti terhapus, konteks hilang, dan keberlanjutan kreatif terputus selepas setiap sesi.
Melalui penyelidikan ini, Luo mengenal pasti satu kelemahan utama dalam sistem AI berdasarkan petunjuk: mereka tidak mempunyai sifat kekal. Setiap interaksi berdiri sendiri, menjadikan sukar untuk membina kepercayaan, ingatan, atau momentum kreatif yang berterusan.
Kerangka ini lahir sebagai jawapan. Alih-alih bergantung pada petunjuk yang sementara, kerangka ini menyusun interaksi berdasarkan watak AI yang kekal, mempertahankan identiti, ingatan, dan kestabilan tingkah laku sepanjang sesi dan projek.
Mendefinisikan Kerangka Interaksi Multimodal Berpusat pada Watak
Pada asasnya, kerangka ini mengatur kolaborasi manusia-AI berdasarkan watak AI yang tahan lama, bukan sekadar petunjuk seketika. Watak-watak ini berfungsi sebagai rangka kreatif yang boleh digunakan semula. Mereka mengekalkan ingatan konteks, memelihara kestabilan tingkah laku, dan menyokong kerja kreatif atau operasi yang berpanjangan.
Kerangka ini secara semula jadi bersifat multimodal. Ia mengintegrasikan teks, imej, dan keadaan konteks, membolehkan pengguna bekerja dengan AI dengan cara yang lebih kaya dan ekspresif berbanding hanya menggunakan teks. Dengan mengekalkan konteks bersama di antara pelbagai modality, sistem ini menyokong eksplorasi yang lebih mendalam dan komitmen yang berterusan dari masa ke masa.
Secara penting, ini bukan sekadar satu ciri atau pola antara muka. Ini ialah sebuah sistem interaksi yang direka bentuk untuk disepadukan, digunakan semula, dan dipercayai dalam pelbagai produk, persekitaran latihan, dan platform.
Definisi rasmi:
Kerangka Interaksi Multimodal Berpusat pada Watak menyusun kolaborasi manusia-AI berdasarkan watak AI yang kekal, mengintegrasikan identiti, konteks, dan input multimodal ke dalam rangka interaksi yang boleh digunakan semula. Berbeza daripada penggunaan AI berdasarkan petunjuk seketika, kerangka ini membolehkan kolaborasi kreatif yang berterusan, yang boleh disepadukan ke dalam alur kerja, sistem latihan, dan platform pengguna berskala besar.
Mengapa Ini Merupakan Sumbangan Asli
Yi Luo mula secara sistematik mengembangkan kerangka ini pada awal tahun 2024, berasaskan penyelidikan pasca siswazahnya, sebelum interaksi AI berdasarkan watak atau agen menjadi popular di seluruh industri. Pada masa itu, kebanyakan produk AI dioptimumkan untuk engagement jangka pendek, bukan kolaborasi jangka panjang.
Apa yang membezakan pendekatan Luo ialah perubahan konsep. Beliau tidak lagi memandang AI sebagai sekumpulan output, tetapi sebagai infrastruktur kreatif—sesuatu yang boleh dirancang secara sengaja, dinilai, dan diperluas untuk menyokong kerja manusia yang sebenar. Perubahan pandangan ini mengalihkan tumpuan daripada prestasi model mentah kepada sistem interaksi yang menyokong keberlanjutan, kepercayaan, dan kegunaan.
Pengesahan Skala Korporat
Kerangka ini pertama kali dikaji dalam persekitaran AI skala korporat yang dicirikan oleh jangkauan global, ketegasan operasi, dan keperluan ketepatan yang tinggi. Semasa bekerja pada inisiatif reka bentuk berkaitan AI dalam konteks latihan dan operasi yang besar serta teragih di Apple, Luo menyedari bahawa interaksi AI perlu kekal konsisten di sepanjang sesi, rantau, dan pasukan, sambil terintegrasi dengan lancar ke dalam alur kerja yang sedia ada.
Persekitaran ini meletakkan tuntutan yang sangat tinggi terhadap sistem interaksi: hasilnya mesti dapat diramal, tingkah laku mesti kekal sepanjang masa dan konteks, serta corak interaksi mesti boleh digunakan semula di bawah tekanan organisasi. Dalam batasan ini, corak yang selaras dengan prinsip-prinsip yang kemudian dirumuskan dalam Kerangka Interaksi Multimodal Berpusat pada Watak—terutamanya kekekalan, identiti, dan penggunaan semula—terbukti amat penting untuk mengekalkan kepercayaan dan ketahanan sepanjang masa.
Ekosistem saluran global Apple merupakan salah satu persekitaran operasi paling kompleks dalam sektor teknologi. Dokumen yang didedahkan secara terbuka menunjukkan bahawa kira-kira 60% daripada jualan bersih tahunan Apple dilakukan melalui rakan kongsi saluran, yang menekankan skala dan ketegasan konteks korporat tempat corak interaksi ini dikaji. Penafsiran ini adalah hasil analisis reka bentuk bebas, bukan pandangan rasmi syarikat.
Pengesahan Skala Pengguna
Sistem interaksi yang sama kemudian dikaji dalam konteks yang sangat berbeza: interaksi AI skala pengguna.
Dalam Character.AI, fungsi chat menjadi permukaan produk utama. Dalam persekitaran ini, prinsip-prinsip berpusat pada watak yang dibawa oleh Luo—kekekalan, identiti, dan konteks multimodal—amat selaras dengan corak interaksi yang diamati dalam sistem chat pengguna yang direka bentuk untuk cerita panjang, keberlanjutan emosi, dan komitmen yang berterusan.
Angka yang dilaporkan secara terbuka menunjukkan bahawa Character.AI melayani kira-kira 20 juta pengguna aktif bulanan, dengan purata penggunaan harian hampir dua jam setiap pengguna—jauh melebihi corak penggunaan biasa bot chat umum seperti ChatGPT. Tahap penggunaan yang berterusan ini mencerminkan dinamik interaksi yang berpusat pada kolaborasi kreatif jangka panjang, bukan sekadar pertukaran ringkas yang berorientasikan tugasan.
Bersama-sama, penemuan ini menunjukkan bahawa kerangka interaksi yang sama boleh kekal berkesan dalam kedua-dua persekitaran korporat yang terkawal dengan ketat dan juga dalam suasana pengguna yang terbuka dan penuh variasi. Penafsiran ini adalah hasil analisis reka bentuk bebas.
Mengapa Ini Penting
Hanya sedikit sistem interaksi AI yang berfungsi dalam skala yang begitu ekstrem. Dalam Kerangka Interaksi Multimodal Berpusat pada Watak, watak AI berfungsi sebagai bekas kolaborasi yang kekal. Interaksi multimodal menjadi infrastruktur kreatif yang boleh digunakan semula, bukan sekadar lapisan kebaruan.
Dengan menukar kemampuan model mentah menjadi sistem interaksi yang stabil dan boleh berskala, kerja Luo turut menyumbang kepada evolusi AI yang berpusat pada manusia. Apabila AI berdasarkan watak menjadi medium baharu dalam pendidikan, hiburan, dan perisian korporat, kerangka seperti ini membantu memastikan bahawa sistem AI kekal mudah digunakan, boleh dipercayai, dan memberi kuasa kreatif sepanjang masa.
Dalam landskap yang didominasi oleh kemajuan model yang pantas, infrastruktur kreatif yang berkekalan masih jarang ditemui. Kerangka Yi Luo menangani kekosongan tersebut.
Pautan rujukan
- Statistik Penglibatan Character AI
- https://sqmagazine.co.uk/character-ai-statistics/
- Statistik penggunaan ChatGPT
- https://elfsight.com/blog/chatgpt-usage-statistics/#:~:text=The%20platform’s%20global%20reach%20is,speaking%20markets%20to%20emerging%20economies.


