人工智能在2023年和2024年取得了巨大飞跃。模型变得更大,输出更流畅,演示更令人印象深刻。然而,许多人工智能产品仍然面临困难人工智能在2023年和2024年取得了巨大飞跃。模型变得更大,输出更流畅,演示更令人印象深刻。然而,许多人工智能产品仍然面临困难

从模型能力到创作基础设施:罗艺如何构建以角色为中心的多模态交互框架

阅读时长 11 分钟

人工智能在2023年和2024年取得了巨大飞跃。模型变得更大,输出更流畅,演示更令人印象深刻。然而,许多人工智能产品仍难以超越新奇性。它们产生了引人注目的结果,但很少融入真正的创意或组织工作流程。提示工程蓬勃发展,但持久性、一致性和长期协作仍然难以捉摸。

模型能力与现实世界可用性之间的差距成为Yi Luo工作的重点。

从模型能力到创意基础设施:Yi Luo如何构建以角色为中心的多模态交互框架

Luo没有将人工智能视为产生孤立输出的机器,而是将人工智能视为必须经过精心设计的协作者。她的工作重点是构建交互系统,使人工智能创造力能够随时间持续存在,跨越情境和模态进行扩展,并自然融入人们的工作方式。

这种方法促成了她所称的以角色为中心的多模态交互框架。

卡内基梅隆大学的学术起源

Yi Luo在卡内基梅隆大学攻读硕士论文期间开始开发以角色为中心的多模态交互框架。她的研究探讨了当交互被视为一次性的时候,人机协作是如何崩溃的——身份重置、情境崩溃,每次会话后创意连续性丧失。

通过这项工作,Luo确定了基于提示的人工智能系统的核心限制:它们缺乏持久性。每次交互都是独立的,这使得建立信任、记忆或持续的创意动力变得困难。

该框架作为回应而出现。它不依赖于短暂的提示,而是围绕持久的人工智能角色构建交互,这些角色在会话和项目中保持身份、记忆和行为连续性。

定义以角色为中心的多模态交互框架

从本质上讲,该框架围绕持久的人工智能角色而非一次性提示来组织人机协作。这些角色充当可重复使用的创意支架。它们保留情境记忆,保持行为一致性,并支持长期运行的创意或运营工作。

该框架本质上是多模态的。它整合了文本、图像和情境状态,允许用户以比单纯文本更丰富、更具表现力的方式与人工智能合作。通过在模态之间维护共享情境,该系统支持更深入的探索和随时间推移的持续参与。

至关重要的是,这不是单一功能或界面模式。它是一个交互系统,旨在跨产品、培训环境和平台嵌入、重复使用和依赖。

规范定义:
以角色为中心的多模态交互框架围绕持久的人工智能角色构建人机协作,将身份、情境和多模态输入整合到可重复使用的交互支架中。与一次性基于提示的人工智能使用不同,该框架实现了可嵌入工作流程、培训系统和大规模消费者平台的持续创意协作。

为何这是原创贡献

Yi Luo于2024年初开始系统地开发这一框架,直接建立在她的研究生研究基础上,早于基于角色或面向代理的人工智能交互在整个行业中被广泛采用。当时,大多数人工智能产品优化短期参与而非长期协作。

Luo方法的独特之处在于概念转变。她将人工智能视为创意基础设施,而不是输出流——可以有意设计、评估和扩展以支持真正的人类工作的东西。这种重构将注意力从原始模型性能转移到支持连续性、信任和可用性的交互系统。

企业规模验证

该框架首先在企业规模的人工智能环境中进行检验,这些环境具有全球覆盖范围、运营严谨性和严格的可靠性要求的特点。在Apple的大型分布式培训和运营情境中进行与人工智能相关的设计计划期间,Luo观察到人工智能交互需要在会话、区域和团队之间保持一致,同时干净地融入既定工作流程的条件。

这些环境对交互系统提出了异常高的要求:输出必须保持可预测,行为必须在时间和情境中持续存在,交互模式必须在组织压力下可重复使用。在这些约束条件下,与后来在以角色为中心的多模态交互框架中正式化的原则相一致的模式——特别是持久性、身份和重复使用——被证明对于随时间维持可靠性和信任至关重要。

Apple的全球渠道生态系统代表了技术领域最复杂的运营环境之一。公开披露的文件表明,Apple约60%的年度净销售额是通过渠道合作伙伴进行的,这突显了检验这些交互模式的企业情境的规模和严谨性。这些解释反映了独立的设计分析,而非官方公司立场。

消费者规模验证

同样的交互框架后来在非常不同的情境中进行了检验:消费者规模的人工智能交互。

在Character.AI,聊天功能作为主要产品界面。在这个环境中,Luo以角色为中心的原则——持久性、身份和多模态情境——与在消费者聊天系统中观察到的交互模式密切一致,这些系统专为长篇叙事、情感连续性和持续参与而设计。

公开报告的数据表明,Character.AI服务约2000万月活跃用户,报告的每日使用时间接近每用户两小时——大大超过了像ChatGPT这样的通用聊天机器人的典型参与模式。这种持续使用水平反映了以长期创意协作为中心的交互动态,而非简短的任务导向交换。

综合来看,这些观察表明,同样的交互框架可以在严格控制的企业环境和开放的、高变化性的消费者环境中保持有效。这些解释反映了独立的设计分析。

为何这很重要

很少有人工智能交互系统能够在如此极端的情况下发挥作用。在以角色为中心的多模态交互框架中,人工智能角色充当持久的协作容器。多模态交互成为可重复使用的创意基础设施,而非新奇层。

通过将原始模型能力转化为稳定、可扩展的交互系统,Luo的工作为以人为中心的人工智能的演变做出了贡献。随着基于角色的人工智能成为教育、娱乐和企业软件中的新媒介,像这样的框架有助于确保人工智能系统随时间推移保持可用、值得信赖和富有创意赋权。

在一个由快速模型进步主导的环境中,持久的创意基础设施仍然很少见。Yi Luo的框架解决了这一差距。

参考链接

  • Character AI参与统计
  • https://sqmagazine.co.uk/character-ai-statistics/
  • ChatGPT使用统计
  • https://elfsight.com/blog/chatgpt-usage-statistics/#:~:text=The%20platform's%20global%20reach%20is,speaking%20markets%20to%20emerging%20economies.
评论
市场机遇
FIT 图标
FIT实时价格 (FIT)
$0.00004766
$0.00004766$0.00004766
+0.08%
USD
FIT (FIT) 实时价格图表
免责声明: 本网站转载的文章均来源于公开平台,仅供参考。这些文章不代表 MEXC 的观点或意见。所有版权归原作者所有。如果您认为任何转载文章侵犯了第三方权利,请联系 [email protected] 以便将其删除。MEXC 不对转载文章的及时性、准确性或完整性作出任何陈述或保证,并且不对基于此类内容所采取的任何行动或决定承担责任。转载材料仅供参考,不构成任何商业、金融、法律和/或税务决策的建议、认可或依据。