Штучний інтелект зробив драматичні стрибки у 2023 та 2024 роках. Моделі стали більшими, результати більш вправними, а демонстрації більш вражаючими. Проте багато продуктів ШІ все ще мали труднощі з виходом за межі новизни. Вони генерували привабливі результати, але рідко вписувались у реальні творчі чи організаційні робочі процеси. Інженерія промтів процвітала, але наполегливість, послідовність та довгострокова співпраця залишались недосяжними.
Цей розрив між можливостями моделі та реальною зручністю використання став фокусом роботи Yi Luo.

Замість того, щоб розглядати ШІ як машину, яка виробляє ізольовані результати, Luo підійшла до ШІ як до співробітника, який має бути навмисно спроектований. Її робота зосереджена на побудові систем взаємодії, які дозволяють творчості ШІ зберігатись з часом, масштабуватись у різних контекстах і модальностях та природно інтегруватись у те, як працюють люди.
Цей підхід привів до того, що вона називає мультимодальною системою взаємодії, зосередженою на персонажах.
Академічне походження в Carnegie Mellon University
Yi Luo почала розробляти мультимодальну систему взаємодії, зосереджену на персонажах, під час своєї магістерської дисертації в Carnegie Mellon University. Її дослідження вивчало, як співпраця людини та ШІ руйнується, коли взаємодія розглядається як одноразова — де ідентичність скидається, контекст руйнується, а творча безперервність втрачається після кожної сесії.
Через цю роботу Luo визначила основне обмеження систем ШІ, заснованих на промтах: їм бракує наполегливості. Кожна взаємодія стоїть окремо, що ускладнює побудову довіри, пам'яті чи стійкого творчого імпульсу.
Система з'явилась як відповідь. Замість покладатись на тимчасові промти, вона структурує взаємодію навколо стійких персонажів ШІ, які зберігають ідентичність, пам'ять та поведінкову безперервність протягом сесій та проектів.
Визначення мультимодальної системи взаємодії, зосередженої на персонажах
В основі система організовує співпрацю людини та ШІ навколо довговічних персонажів ШІ, а не одноразових промтів. Ці персонажі функціонують як багаторазові творчі каркаси. Вони зберігають контекстну пам'ять, зберігають поведінкову послідовність та підтримують тривалу творчу чи операційну роботу.
Система є за своєю природою мультимодальною. Вона інтегрує текст, зображення та контекстний стан, дозволяючи користувачам працювати з ШІ більш багатими, більш виразними способами, ніж лише текст. Підтримуючи спільний контекст між модальностями, система підтримує глибше дослідження та стійке залучення з часом.
Важливо, що це не окрема функція чи шаблон інтерфейсу. Це система взаємодії, розроблена для вбудовування, повторного використання та покладання на неї в різних продуктах, навчальних середовищах та платформах.
Канонічне визначення:
Мультимодальна система взаємодії, зосереджена на персонажах, структурує співпрацю людини та ШІ навколо стійких персонажів ШІ, інтегруючи ідентичність, контекст та мультимодальні входи в багаторазові каркаси взаємодії. На відміну від одноразового використання ШІ на основі промтів, система дозволяє стійку творчу співпрацю, яку можна вбудовувати в робочі процеси, навчальні системи та великомасштабні споживчі платформи.
Чому це був оригінальний внесок
Yi Luo почала систематично розробляти цю систему на початку 2024 року, будуючи безпосередньо на своїх дослідженнях для випускників, до того, як взаємодія з ШІ на основі персонажів чи агентів стала широко прийнятою в галузі. На той час більшість продуктів ШІ оптимізувались для короткострокового залучення, а не довгострокової співпраці.
Те, що відрізняло підхід Luo, був концептуальний зсув. Вона розглядала ШІ не як потік результатів, а як творчу інфраструктуру — щось, що можна навмисно спроектувати, оцінити та масштабувати для підтримки реальної людської роботи. Це переосмислення перенесло увагу з необробленої продуктивності моделі на системи взаємодії, які підтримують безперервність, довіру та зручність використання.
Валідація на рівні підприємства
Система була вперше досліджена в середовищах ШІ рівня підприємства, що характеризуються глобальним охопленням, операційною суворістю та суворими вимогами до надійності. Під час роботи над ініціативами дизайну, пов'язаними з ШІ, в великих, розподілених контекстах навчання та операцій в Apple, Luo спостерігала умови, де взаємодії ШІ повинні були залишатись послідовними в різних сесіях, регіонах та командах, інтегруючись чисто в усталені робочі процеси.
Ці середовища висувають незвично високі вимоги до систем взаємодії: результати повинні залишатись передбачуваними, поведінка повинна зберігатись у часі та контексті, а шаблони взаємодії повинні бути багаторазовими під організаційним тиском. В межах цих обмежень шаблони, узгоджені з принципами, пізніше формалізованими в мультимодальній системі взаємодії, зосередженій на персонажах, — зокрема наполегливість, ідентичність та повторне використання, — виявились важливими для підтримки надійності та довіри з часом.
Глобальна екосистема каналів Apple являє собою одне з найскладніших операційних середовищ у технологічному секторі. Публічно розкриті документи вказують, що приблизно 60% річного чистого продажу Apple проводиться через канальних партнерів, підкреслюючи масштаб та суворість контексту підприємства, в якому ці шаблони взаємодії були досліджені. Ці інтерпретації відображають незалежний аналіз дизайну, а не офіційні позиції компанії.
Валідація на споживчому рівні
Та сама система взаємодії була пізніше досліджена в зовсім іншому контексті: споживчій взаємодії з ШІ.
В Character.AI чат функціонує як основна поверхня продукту. В цьому середовищі принципи Luo, зосереджені на персонажах, — наполегливість, ідентичність та мультимодальний контекст, — тісно узгоджувались зі шаблонами взаємодії, спостережуваними в споживчих системах чату, призначених для довготривалого розповідання історій, емоційної безперервності та стійкого залучення.
Публічно повідомлені цифри вказують, що Character.AI обслуговує приблизно 20 мільйонів щомісячних активних користувачів, з повідомленим щоденним використанням, що наближається до двох годин на користувача, — значно перевищуючи шаблони залучення, типові для чатботів загального призначення, таких як ChatGPT. Цей рівень стійкого використання відображає динаміку взаємодії, зосереджену на довготривалій творчій співпраці, а не на коротких, орієнтованих на завдання обмінах.
Разом узяті, ці спостереження свідчать про те, що та сама система взаємодії може залишатись ефективною як у жорстко контрольованих середовищах підприємства, так і у відкритих, високоваріантних споживчих налаштуваннях. Ці інтерпретації відображають незалежний аналіз дизайну.
Чому це важливо
Небагато систем взаємодії з ШІ функціонують у таких крайнощах. В мультимодальній системі взаємодії, зосередженій на персонажах, персонажі ШІ служать стійкими посудинами для співпраці. Мультимодальна взаємодія стає багаторазовою творчою інфраструктурою, а не шаром новизни.
Перекладаючи необроблені можливості моделі в стабільні, масштабовані системи взаємодії, робота Luo сприяє еволюції орієнтованого на людину ШІ. Оскільки ШІ на основі персонажів стає новим медіумом в освіті, розвагах та корпоративному програмному забезпеченні, такі системи, як ця, допомагають забезпечити, щоб системи ШІ залишались зручними для використання, надійними та творчо надаючими можливості з часом.
В ландшафті, де домінують швидкі досягнення моделей, довготривала творча інфраструктура залишається рідкісною. Система Yi Luo усуває цей розрив.
Посилання
- Статистика залучення Character AI
- https://sqmagazine.co.uk/character-ai-statistics/
- Статистика використання ChatGPT
- https://elfsight.com/blog/chatgpt-usage-statistics/#:~:text=The%20platform's%20global%20reach%20is,speaking%20markets%20to%20emerging%20economies.


