PANews a rapporté le 24 octobre que, selon simonwillison.net, des recherches ont révélé un risque systémique d'"injection de prompt indirecte" dans les navigateurs d'IA. L'équipe de Brave a démontré que le navigateur Comet de Perplexity pouvait être manipulé pour accéder automatiquement aux détails du compte et exfiltrer des données via des liens externes grâce à des commandes invisibles intégrées dans des captures d'écran. Fellou, cependant, était encore plus grave, avec du texte de page trompant le navigateur pour ouvrir Gmail et envoyer les derniers en-têtes d'e-mail vers un site externe. Les deux cas impliquaient une exécution sans confirmation de l'utilisateur et soulevaient des préoccupations concernant la sécurité des e-mails et financière. Brave n'a pas précisé si ces vulnérabilités ont été corrigées par le fournisseur.
Le Responsable de la Sécurité de l'Information d'OpenAI, Dane Stuckey, a publié un long article révélant la protection de l'agent Atlas de ChatGPT contre l'injection de prompt : grâce à des tests d'équipe rouge, des récompenses de formation pour ignorer les commandes malveillantes, des barrières de sécurité qui se chevauchent, et le blocage de détection d'attaque ; il a proposé une "défense en profondeur" et a reconnu que l'injection de prompt reste un problème de pointe non résolu.


