Trí tuệ nhân tạo đã có những bước tiến đột phá trong năm 2023 và 2024. Các mô hình ngày càng lớn hơn, đầu ra trôi chảy hơn và các bản demo ấn tượng hơn. Tuy nhiên, nhiều sản phẩm AI vẫn gặp khó khănTrí tuệ nhân tạo đã có những bước tiến đột phá trong năm 2023 và 2024. Các mô hình ngày càng lớn hơn, đầu ra trôi chảy hơn và các bản demo ấn tượng hơn. Tuy nhiên, nhiều sản phẩm AI vẫn gặp khó khăn

Từ Khả Năng Mô Hình đến Cơ Sở Hạ Tầng Sáng Tạo: Yi Luo Đã Xây Dựng Khung Tương Tác Đa Phương Thức Lấy Nhân Vật Làm Trung Tâm Như Thế Nào

Đọc trong 9 phút

Trí tuệ nhân tạo đã có những bước tiến vượt bậc trong năm 2023 và 2024. Các mô hình ngày càng lớn hơn, đầu ra trôi chảy hơn và các bản demo ấn tượng hơn. Tuy nhiên, nhiều sản phẩm AI vẫn gặp khó khăn trong việc vượt qua tính mới lạ. Chúng tạo ra kết quả bắt mắt, nhưng hiếm khi phù hợp với quy trình làm việc sáng tạo hoặc tổ chức thực tế. Kỹ thuật tạo lệnh phát triển mạnh mẽ, nhưng sự bền bỉ, nhất quán và hợp tác dài hạn vẫn khó nắm bắt.

Khoảng cách giữa khả năng của mô hình và khả năng sử dụng trong thế giới thực đã trở thành trọng tâm công việc của Yi Luo.

Từ khả năng mô hình đến cơ sở hạ tầng sáng tạo: Yi Luo đã xây dựng khung tương tác đa phương thức lấy nhân vật làm trung tâm như thế nào

Thay vì coi AI là một cỗ máy tạo ra các đầu ra riêng lẻ, Luo tiếp cận AI như một cộng tác viên phải được thiết kế có chủ ý. Công việc của cô tập trung vào việc xây dựng các hệ thống tương tác cho phép sự sáng tạo của AI tồn tại theo thời gian, mở rộng quy mô qua các ngữ cảnh và phương thức, đồng thời tích hợp tự nhiên vào cách mọi người làm việc.

Cách tiếp cận đó đã dẫn đến những gì cô gọi là Khung tương tác đa phương thức lấy nhân vật làm trung tâm.

Nguồn gốc học thuật tại Đại học Carnegie Mellon

Yi Luo bắt đầu phát triển Khung tương tác đa phương thức lấy nhân vật làm trung tâm trong luận văn thạc sĩ của mình tại Đại học Carnegie Mellon. Nghiên cứu của cô xem xét cách hợp tác giữa con người và AI bị phá vỡ khi tương tác được coi là dùng một lần—nơi danh tính được đặt lại, ngữ cảnh sụp đổ và tính liên tục sáng tạo bị mất sau mỗi phiên.

Thông qua công việc này, Luo đã xác định một hạn chế cốt lõi của các hệ thống AI dựa trên lệnh: chúng thiếu tính bền bỉ. Mỗi tương tác đứng riêng lẻ, khiến việc xây dựng niềm tin, trí nhớ hoặc động lực sáng tạo bền vững trở nên khó khăn.

Khung này xuất hiện như một phản ứng. Thay vì dựa vào các lệnh tạm thời, nó cấu trúc tương tác xung quanh các nhân vật AI bền vững duy trì danh tính, trí nhớ và tính liên tục hành vi qua các phiên và dự án.

Định nghĩa Khung tương tác đa phương thức lấy nhân vật làm trung tâm

Về cốt lõi, khung này tổ chức sự hợp tác giữa con người và AI xung quanh các nhân vật AI bền vững thay vì các lệnh một lần. Những nhân vật này hoạt động như các giàn giáo sáng tạo có thể tái sử dụng. Chúng giữ lại bộ nhớ ngữ cảnh, duy trì tính nhất quán hành vi và hỗ trợ công việc sáng tạo hoặc vận hành lâu dài.

Khung này vốn là đa phương thức. Nó tích hợp văn bản, hình ảnh và trạng thái ngữ cảnh, cho phép người dùng làm việc với AI theo những cách phong phú và biểu cảm hơn chỉ riêng văn bản. Bằng cách duy trì ngữ cảnh được chia sẻ qua các phương thức, hệ thống hỗ trợ khám phá sâu hơn và tương tác bền vững theo thời gian.

Quan trọng là, đây không chỉ là một tính năng hoặc mẫu giao diện duy nhất. Đây là một hệ thống tương tác được thiết kế để nhúng, tái sử dụng và dựa vào qua các sản phẩm, môi trường đào tạo và nền tảng.

Định nghĩa chính thức:
Khung tương tác đa phương thức lấy nhân vật làm trung tâm cấu trúc sự hợp tác giữa con người và AI xung quanh các nhân vật AI bền vững, tích hợp danh tính, ngữ cảnh và đầu vào đa phương thức vào các giàn giáo tương tác có thể tái sử dụng. Không giống như việc sử dụng AI dựa trên lệnh một lần, khung này cho phép hợp tác sáng tạo bền vững có thể được nhúng vào quy trình làm việc, hệ thống đào tạo và các nền tảng tiêu dùng quy mô lớn.

Tại sao đây là một đóng góp độc đáo

Yi Luo bắt đầu phát triển có hệ thống khung này vào đầu năm 2024, xây dựng trực tiếp dựa trên nghiên cứu sau đại học của mình, trước khi tương tác AI dựa trên nhân vật hoặc định hướng tác nhân được áp dụng rộng rãi trong ngành. Vào thời điểm đó, hầu hết các sản phẩm AI được tối ưu hóa cho tương tác ngắn hạn thay vì hợp tác dài hạn.

Điều làm nổi bật cách tiếp cận của Luo là một sự thay đổi về khái niệm. Cô coi AI không phải là một luồng đầu ra, mà là cơ sở hạ tầng sáng tạo—một thứ có thể được thiết kế, đánh giá và mở rộng quy mô một cách có chủ ý để hỗ trợ công việc thực tế của con người. Việc định hình lại này đã chuyển sự chú ý khỏi hiệu suất mô hình thô sang các hệ thống tương tác hỗ trợ tính liên tục, niềm tin và khả năng sử dụng.

Xác nhận quy mô doanh nghiệp

Khung này được kiểm tra lần đầu tiên trong các môi trường AI quy mô doanh nghiệp được đặc trưng bởi phạm vi toàn cầu, tính nghiêm ngặt vận hành và các yêu cầu độ tin cậy nghiêm ngặt. Trong quá trình làm việc về các sáng kiến thiết kế liên quan đến AI được đặt trong các bối cảnh đào tạo và vận hành phân tán quy mô lớn tại Apple, Luo đã quan sát các điều kiện mà tương tác AI cần duy trì nhất quán qua các phiên, khu vực và nhóm, đồng thời tích hợp sạch sẽ vào quy trình làm việc đã thiết lập.

Những môi trường này đặt ra các yêu cầu cao bất thường đối với các hệ thống tương tác: đầu ra phải duy trì có thể dự đoán được, hành vi phải tồn tại qua thời gian và ngữ cảnh, và các mẫu tương tác phải có thể tái sử dụng dưới áp lực tổ chức. Trong những ràng buộc này, các mẫu được sắp xếp với các nguyên tắc sau này được chính thức hóa trong Khung tương tác đa phương thức lấy nhân vật làm trung tâm—đặc biệt là tính bền bỉ, danh tính và tái sử dụng—đã được chứng minh là cần thiết để duy trì độ tin cậy và niềm tin theo thời gian.

Hệ sinh thái kênh toàn cầu của Apple đại diện cho một trong những môi trường vận hành phức tạp nhất trong lĩnh vực công nghệ. Các hồ sơ được công bố công khai cho thấy khoảng 60% doanh số bán hàng ròng hàng năm của Apple được thực hiện thông qua các đối tác kênh, nhấn mạnh quy mô và tính nghiêm ngặt của bối cảnh doanh nghiệp mà các mẫu tương tác này được kiểm tra. Những diễn giải này phản ánh phân tích thiết kế độc lập chứ không phải vị trí chính thức của công ty.

Xác nhận quy mô người tiêu dùng

Cùng một khung tương tác sau đó được kiểm tra trong một bối cảnh rất khác: tương tác AI quy mô người tiêu dùng.

Tại Character.AI, trò chuyện hoạt động như bề mặt sản phẩm chính. Trong môi trường này, các nguyên tắc lấy nhân vật làm trung tâm của Luo—tính bền bỉ, danh tính và ngữ cảnh đa phương thức—được sắp xếp chặt chẽ với các mẫu tương tác được quan sát trong các hệ thống trò chuyện tiêu dùng được thiết kế cho kể chuyện dài, tính liên tục cảm xúc và tương tác bền vững.

Các con số được báo cáo công khai cho thấy Character.AI phục vụ khoảng 20 triệu người dùng hoạt động hàng tháng, với mức sử dụng hàng ngày được báo cáo tiến đến hai giờ mỗi người dùng—vượt xa đáng kể các mẫu tương tác điển hình của chatbot mục đích chung như ChatGPT. Mức độ sử dụng bền vững này phản ánh động lực tương tác tập trung vào hợp tác sáng tạo dài hơn là các trao đổi ngắn, định hướng nhiệm vụ.

Tóm lại, những quan sát này cho thấy cùng một khung tương tác có thể duy trì hiệu quả qua cả các môi trường doanh nghiệp được kiểm soát chặt chẽ và các cài đặt người tiêu dùng mở, phương sai cao. Những diễn giải này phản ánh phân tích thiết kế độc lập.

Tại sao điều này quan trọng

Ít hệ thống tương tác AI hoạt động qua những cực đoan như vậy. Trong Khung tương tác đa phương thức lấy nhân vật làm trung tâm, các nhân vật AI phục vụ như các bình hợp tác bền vững. Tương tác đa phương thức trở thành cơ sở hạ tầng sáng tạo có thể tái sử dụng thay vì một lớp mới lạ.

Bằng cách chuyển đổi khả năng mô hình thô thành các hệ thống tương tác ổn định, có thể mở rộng quy mô, công việc của Luo đóng góp vào sự phát triển của AI lấy con người làm trung tâm. Khi AI dựa trên nhân vật trở thành một phương tiện mới qua giáo dục, giải trí và phần mềm doanh nghiệp, các khung như thế này giúp đảm bảo rằng các hệ thống AI vẫn có thể sử dụng được, đáng tin cậy và trao quyền sáng tạo theo thời gian.

Trong một bối cảnh bị chi phối bởi những tiến bộ mô hình nhanh chóng, cơ sở hạ tầng sáng tạo lâu dài vẫn còn hiếm. Khung của Yi Luo giải quyết khoảng trống đó.

Liên kết tham khảo

  • Thống kê tương tác Character AI
  • https://sqmagazine.co.uk/character-ai-statistics/
  • Thống kê sử dụng ChatGPT
  • https://elfsight.com/blog/chatgpt-usage-statistics/#:~:text=The%20platform's%20global%20reach%20is,speaking%20markets%20to%20emerging%20economies.
Bình luận
Cơ hội thị trường
Logo FIT
Giá FIT(FIT)
$0.00004762
$0.00004762$0.00004762
+0.57%
USD
Biểu đồ giá FIT (FIT) theo thời gian thực
Tuyên bố miễn trừ trách nhiệm: Các bài viết được đăng lại trên trang này được lấy từ các nền tảng công khai và chỉ nhằm mục đích tham khảo. Các bài viết này không nhất thiết phản ánh quan điểm của MEXC. Mọi quyền sở hữu thuộc về tác giả gốc. Nếu bạn cho rằng bất kỳ nội dung nào vi phạm quyền của bên thứ ba, vui lòng liên hệ [email protected] để được gỡ bỏ. MEXC không đảm bảo về tính chính xác, đầy đủ hoặc kịp thời của các nội dung và không chịu trách nhiệm cho các hành động được thực hiện dựa trên thông tin cung cấp. Nội dung này không cấu thành lời khuyên tài chính, pháp lý hoặc chuyên môn khác, và cũng không được xem là khuyến nghị hoặc xác nhận từ MEXC.