Model Context Protocol (MCP) memungkinkan AI menemukan dan menggunakan alat baru dengan cepat. Setiap server MCP menjadi pusat kecerdasan domain-spesifik yang dapat melayani beberapa agen sambil mempertahankan keamanan dan logika bisnisnya sendiri.Model Context Protocol (MCP) memungkinkan AI menemukan dan menggunakan alat baru dengan cepat. Setiap server MCP menjadi pusat kecerdasan domain-spesifik yang dapat melayani beberapa agen sambil mempertahankan keamanan dan logika bisnisnya sendiri.

Membangun Agen AI yang Sadar Pengguna dengan MCP dan Serverless

2025/11/18 03:53

\ Sesuatu yang sangat menarik terjadi ketika Anda menggabungkan agen AI, Model Context Protocol (MCP), dan komputasi serverless. Kita tidak hanya berbicara tentang chatbot yang lebih pintar yang dapat mengakses beberapa API; kita membangun sistem AI yang benar-benar dapat memahami siapa Anda, apa yang diizinkan untuk Anda lakukan, dan dapat bekerja di berbagai sistem perusahaan tanpa melanggar aturan keamanan atau mengganggu pengguna lain.

Tantangan Autentikasi dalam Sistem AI

Aplikasi AI tradisional menghadapi masalah mendasar: bagaimana Anda mempertahankan konteks dan izin pengguna ketika agen AI perlu mengakses beberapa layanan atas nama pengguna yang berbeda? Sebagian besar implementasi mengorbankan keamanan (dengan menggunakan kredensial bersama) atau pengalaman pengguna (dengan memerlukan autentikasi ulang terus-menerus).

Solusinya terletak pada pola propagasi JWT yang canggih yang mempertahankan identitas pengguna di seluruh rantai permintaan:

\ Ini menciptakan rantai kepercayaan yang aman di mana identitas pengguna tidak pernah disimpulkan dari respons AI tetapi selalu diverifikasi secara kriptografis.

MCP: Mata Rantai yang Hilang untuk Integrasi Alat AI

Anggap MCP sebagai membebaskan AI dari kandangnya. Alih-alih membangun satu aplikasi AI besar yang mencoba melakukan segalanya, Anda sekarang dapat membuat layanan AI yang lebih kecil dan khusus yang saling berkomunikasi. Daripada mengkodekan setiap alat yang mungkin dibutuhkan AI, MCP memungkinkan AI Anda menemukan dan menggunakan alat baru secara langsung, bahkan jika alat tersebut berada di server yang benar-benar berbeda.

Wawasan utamanya adalah memperlakukan alat sebagai layanan mikro daripada fungsi tertanam. Setiap server MCP menjadi pusat kecerdasan domain-spesifik yang dapat melayani beberapa agen sambil mempertahankan keamanan dan logika bisnisnya sendiri.

\

// Alat MCP menjadi sadar pengguna secara otomatis export async function getTravelPolicies(userId, userRole) { // Penegakan kebijakan terjadi di tingkat alat return policies.filter(p => p.appliesToRole(userRole)); }

\

Serverless: Runtime Sempurna untuk Agen AI

Komputasi serverless menyelesaikan tiga tantangan kritis untuk agen AI:

1. Stateless by Design: Setiap pemanggilan dimulai dari awal, menghilangkan polusi status antara pengguna dan permintaan.

2. Penskalaan Otomatis: Menangani pengguna bersamaan tanpa perencanaan kapasitas—penting ketika agen AI mungkin memicu rantai alat yang kompleks.

3. Efisiensi Biaya: Bayar hanya untuk waktu inferensi dan eksekusi alat yang sebenarnya, bukan kapasitas idle.

Arsitekturnya menjadi elegan dan sederhana:

  • API Gateway menangani routing dan autentikasi awal
  • Fungsi Lambda menyediakan konteks eksekusi yang terisolasi
  • S3 mengelola status sesi secara eksternal
  • Setiap pengguna mendapatkan instance agen logis mereka sendiri

Revolusi Status Sesi

Aplikasi web tradisional mempertahankan status sesi dalam memori atau database. Agen AI memerlukan pendekatan berbeda karena "status" mereka mencakup riwayat percakapan, hasil alat, dan konteks yang dipelajari—berpotensi gigabyte data.

Mengeksternalisasi ini ke S3 dengan Strands SDK menciptakan kemungkinan yang menarik:

# Status agen menjadi portabel dan dapat dianalisis session_manager = S3SessionManager( bucket="agent-sessions", key_prefix=f"user/{user_id}/conversations/" ) # Status dapat dibagikan, dianalisis, atau dimigrasikan agent = StrandsAgent.from_session(session_manager)

Ini memungkinkan fitur seperti penyerahan percakapan antar agen, jejak audit, dan bahkan pola kolaborasi AI-ke-AI.

Wawasan Implementasi Dunia Nyata

Membangun contoh agen perjalanan mengungkapkan beberapa pola yang tidak jelas:

Komposisi Alat: Server MCP dapat memanggil server MCP lain, menciptakan hierarki alat. Alat pemesanan mungkin memanggil alat kebijakan, alat harga, dan alat ketersediaan secara berurutan.

Isolasi Kegagalan: Ketika satu server MCP gagal, yang lain terus bekerja. Agen dengan anggun menurunkan fungsionalitas daripada gagal.

Otorisasi Dinamis: Izin pengguna dapat berubah di tengah percakapan. Pola penyegaran JWT memastikan alat selalu beroperasi dengan izin terkini.

Implikasi yang Lebih Luas

Pola arsitektur ini meluas jauh melampaui pemesanan perjalanan. Pertimbangkan:

  • AI Perusahaan: Agen yang dapat mengakses sistem HR, data keuangan, dan alat manajemen proyek sambil menghormati hierarki organisasi
  • AI Kesehatan: Agen dengan akses khusus pasien ke catatan medis, protokol perawatan, dan sistem penjadwalan
  • Layanan Keuangan: Agen yang dapat melaksanakan perdagangan, memeriksa saldo, dan menghasilkan laporan dalam batas kepatuhan yang ketat

Melihat ke Depan

Kombinasi MCP dan serverless memungkinkan kelas aplikasi AI baru yang:

  • Benar-benar multi-tenant di tingkat infrastruktur
  • Dapat disusun melintasi batas organisasi
  • Aman secara default melalui propagasi identitas kriptografis
  • Dapat diskalakan tanpa batas melalui eksekusi serverless

Kita bergerak dari "AI yang dapat menggunakan alat" menjadi "AI yang dapat mengorkestrasi proses bisnis terdistribusi sambil mempertahankan keamanan sempurna dan konteks pengguna."

Masa depan bukan hanya chatbot yang lebih pintar; ini adalah sistem cerdas yang dapat beroperasi dengan aman di seluruh spektrum aplikasi perusahaan, dengan setiap pengguna mendapatkan asisten AI mereka sendiri yang dipersonalisasi, aman, dan sadar konteks.

\

Penafian: Artikel yang diterbitkan ulang di situs web ini bersumber dari platform publik dan disediakan hanya sebagai informasi. Artikel tersebut belum tentu mencerminkan pandangan MEXC. Seluruh hak cipta tetap dimiliki oleh penulis aslinya. Jika Anda meyakini bahwa ada konten yang melanggar hak pihak ketiga, silakan hubungi [email protected] agar konten tersebut dihapus. MEXC tidak menjamin keakuratan, kelengkapan, atau keaktualan konten dan tidak bertanggung jawab atas tindakan apa pun yang dilakukan berdasarkan informasi yang diberikan. Konten tersebut bukan merupakan saran keuangan, hukum, atau profesional lainnya, juga tidak boleh dianggap sebagai rekomendasi atau dukungan oleh MEXC.