Internet è già pieno di contenuti creati dall’Intelligenza Artificiale

Ricordi i giorni in cui i post scritti da un’intelligenza artificiale erano tanto innocui quanto ovvi? È probabile che negli anni passati tutti avremmo riscontrato questo fenomeno. Ti imbatteresti in un post su un sito apparentemente informativo o in pagine di download di contenuti piene di traduzioni automatiche scritte male da un’intelligenza artificiale e che equivalevano a un avviso automatico di lasciare il luogo. Ma nel 2023 le cose sono cambiate con l’evoluzione di piattaforme come ChatGPT, Bard e simili. Dove i contenuti risultanti sono impressionanti e possono perfettamente spacciarsi per qualcosa di creato da un essere umano. Ciò su cui nessuno contava era che, quando avessero guardato l’evoluzione di questo fenomeno, gli scienziati sarebbero rimasti sorpresi dal fatto che buona parte del web fosse già infestata da contenuti, pagine e testi creati da un’intelligenza artificiale.

Internet è pieno di contenuti creati dall’intelligenza artificiale

Un nuovo studio ha rivelato che gran parte del web è già costituita da contenuti di scarsa qualità generati e tradotti da diversi tipi di intelligenza artificiale. Lo studio, condotto dai ricercatori dell’Amazon Web Services (AWS) AI Lab, ha rilevato, ad esempio, che più della metà di tutte le frasi presenti su Internet sono state tradotte in due o più lingue. La scarsa qualità e la scala sconcertante di queste traduzioni suggeriscono che per creare e tradurre il materiale siano stati utilizzati modelli di intelligenza artificiale basati su modelli linguistici di grandi dimensioni (LLM) più rudimentali delle generazioni passate.

Impatto negativo dell’Intelligenza Artificiale Generativa sul web

Il fenomeno è particolarmente evidente nelle “lingue a risorse inferiori” o nelle lingue con meno dati disponibili per addestrare i modelli di intelligenza artificiale in modo più efficace. I ricercatori ritengono che questi contenuti siano generati da una varietà di attori, tra cui truffatori, creatori di contenuti clickbait e persone che cercano semplicemente di guadagnare denaro dalla pubblicità senza generare contenuti coerenti, di qualità o addirittura reali.

L’impatto di questi contenuti di scarsa qualità sul Web è significativo in quanto può rendere difficile per gli utenti trovare informazioni accurate e utili. Può anche danneggiare la reputazione del sito web nel suo complesso come fonte affidabile di informazioni. Può anche rendere più difficile per i ricercatori di intelligenza artificiale apprendere i linguaggi con risorse inferiori. I modelli di intelligenza artificiale necessitano di grandi quantità di dati di alta qualità per essere addestrati, ma se questi dati sono contaminati da contenuti di scarsa qualità, i modelli possono apprendere cose sbagliate.

Questo studio è un segnale d’allarme che l’Intelligenza Artificiale Generativa può avere un impatto negativo sul web. È importante che gli utenti, i motori di ricerca e i ricercatori sull’intelligenza artificiale adottino misure per affrontare questo problema. Come un serpente che si mangia la coda.