Un gruppo di ricercatori – composto da Ben Nassi, Stav Cohen e Ron Britton di Cornell Tech – ha creato un worm informatico, chiamato Morris II, che può diffondersi tra diverse strumenti di intelligenza artificiale (IA) generativa, installare malware e persino rubare informazioni agli utenti.
Ma oltre a queste azioni malintenzionate, il worm è stato sviluppato per dimostrare i rischi degli ecosistemi autonomi e connessi dall‘IA generativa. Inoltre, è stato dimostrato che Morris II può attaccare un assistente di posta elettronica di intelligenza artificiale generativa per estrarre dati dagli internauti e inviare messaggi spam, superando alcuni sistemi di sicurezza di ChatGPT e Gemini durante l’attacco.
Morris II può infettare database
Per testare Morris II, i ricercatori hanno creato un sistema di posta elettronica in grado di inviare e ricevere messaggi utilizzando l’IA generativa di ChatGPT e Gemini, nonché il modello di linguaggio grande (LLM) open source LLaVA. E, in questa simulazione, hanno scritto un’email in grado di infettare il database dell’assistente di posta elettronica utilizzando la generazione migliorata da recupero (RAG) – un processo che consente ai LLM di ottenere dati aggiuntivi dall’esterno.
Successivamente, una volta che il RAG recupera l’email, il worm invia questi dati a GPT-4 o Gemini Pro per elaborare una risposta e installare un software diverso da quello del produttore nel servizio GenAI.
E, alla fine, la risposta generata “contiene dati sensibili dell’utente e infetta successivamente nuovi host quando viene utilizzata per rispondere a un’email inviata a un nuovo cliente”, spiega Nassi sul giornale Wired.
In questo modo Morris II può distribuire spam
D’altra parte, il team di ingegneri ha provato a distribuire un’immagine con un messaggio malizioso incorporato, che ha fatto sì che l’assistente di posta elettronica inoltrasse l’email ad altre persone.
Ciò è stato possibile perché il messaggio è stato codificato nell’immagine, in modo che qualsiasi tipo di immagine contenente spam possa essere inoltrata ad altri utenti dopo aver inoltrato l’email originale; tenendo conto che questo processo può esporre nomi, numeri di telefono, numeri di carte di credito dei possibili interessati.