Content farm
Le content farm[1], tradotto letteralmente in fabbriche di contenuti, sono aziende che impiegano numerosi scrittori freelance o utilizzano strumenti automatizzati per generare una grande quantità di contenuti testuali specificamente progettati per soddisfare gli algoritmi dei motori di ricerca, noti come ottimizzazione per i motori di ricerca (SEO).
Le content farm sono state criticate per il loro affidamento al sensazionalismo[2], alla disinformazione[1][3], e, in seguito al boom dell'IA degli anni '20, per l'affidamento all'intelligenza artificiale generativa, tutti fattori che hanno degradato l'accuratezza delle informazioni in circolazione[4].
Obiettivo
[modifica | modifica wikitesto]Il loro obiettivo principale è generare ricavi pubblicitari attirando visualizzazioni di pagine da parte dei lettori. Tuttavia, le critiche riguardano la qualità spesso scadente dei contenuti prodotti da queste aziende, che preferiscono la quantità rispetto alla rilevanza e alla qualità. Inoltre, gli articoli scritti da autori umani potrebbero mancare la conoscenza nei soggetti trattati. Le Content Farm sono considerate problematiche dai motori di ricerca, poiché spesso portano l’utente a risultati meno rilevanti e di qualità inferiore durante le ricerche sul web.
Storia
[modifica | modifica wikitesto]Storicamente, le content farm hanno esternalizzato la creazione dei loro contenuti a individui nei paesi più poveri per aumentare i margini di profitto mantenendo bassi gli stipendi dei lavoratori[3][5]. Queste operazioni sfruttano sempre più strumenti di intelligenza artificiale (IA) per generare contenuti a un ritmo accelerato[6]. Questo contenuto può essere qualsiasi cosa che circoli su Internet, ad esempio video, articoli riguardanti notizie, post sui social media o blog.
Caratteristiche
[modifica | modifica wikitesto]Alcune content farm producono migliaia di articoli ogni mese utilizzando scrittori freelance o strumenti di intelligenza artificiale. Ad esempio, nel 2009, Wired ha riferito che Demand Media, proprietaria di eHow, pubblicava un milione di articoli al mese, l'equivalente di quattro Wikipedia in lingua inglese all'anno[7]. Un altro esempio degno di nota è stato Associated Content, acquistata da Yahoo! nel 2010 per 90 milioni di dollari, che in seguito è diventata Yahoo! Voices prima di chiudere nel 2014[8][9].
Le retribuzioni degli scrittori nelle content farm sono basse rispetto agli stipendi medi. Ad esempio possono essere pagati 3,50 dollari ad articolo, sebbene alcuni collaboratori prolifici possano produrre contenuti sufficienti per guadagnarsi da vivere. Gli scrittori spesso non sono esperti negli argomenti che trattano[10].
Dall'avvento di modelli linguistici di grandi dimensioni (LLM) come ChatGPT, le content farm si sono spostate verso contenuti generati dall'intelligenza artificiale. Un rapporto di NewsGuard del 2023 ha identificato oltre 140 marchi riconosciuti a livello internazionale che supportano content farm basate sull'intelligenza artificiale[6]. Gli strumenti di intelligenza artificiale consentono a questi siti di generare centinaia di articoli al giorno, spesso con una supervisione umana minima[11].
Critiche alle content farm
[modifica | modifica wikitesto]I critici sostengono che le content farm danno priorità alla SEO e alle entrate pubblicitarie rispetto all'accuratezza e alla pertinenza dei fatti[12]. I critici evidenziano anche il potenziale di disinformazione, come teorie del complotto e false recensioni di prodotti, diffuse attraverso contenuti generati dall'intelligenza artificiale[13]. Alcuni hanno paragonato le content farm all'industria del fast food, definendole fornitori di "contenuti veloci" che inquinano il web con materiale di basso valore[14]. La parola "sponsorizzato" visualizzata durante la ricerca ha sollevato dubbi sull'affidabilità del sito, poiché è probabile che sia stato pagato per essere spinto in cima alle opzioni di ricerca[15].
Le critiche all'intelligenza artificiale e alle content farm si sono concentrate a causa del nuovo utilizzo degli strumenti di intelligenza artificiale e della sua tendenza ad "allucinare" i fatti. La permeazione di essa nel giornalismo, anche in esempi che alcuni considerano banali, come una lista di letture estive pubblicata dal Chicago Sun-Times[16] e redatta dall'intelligenza artificiale, ha creato sfiducia in essa. La sua prevalenza come supporto alla creazione di contenuti a scopo di monetizzazione è aumentata ed è diventata comune su Internet.
Anche gli account di content farm sui social media che totalizzano centinaia di migliaia[17] o milioni di follower non sono una rarità[3]. L'uso dell'IA in ambienti ad alto rischio come i casi giudiziari, così come in ambienti a basso rischio come la pubblicazione della lista dei libri estivi e i post sui social media[16], ha portato molti a interrogarsi sul ruolo dell'IA nel mondo.
Sono stati osservati effetti più ampi nella società, come l'interruzione dei casi giudiziari a causa di "allucinazioni" derivanti da strumenti di intelligenza artificiale che si occupano dell'uso tra gli avvocati nelle citazioni[18]. Un altro caso è stato un uomo di New York che ha utilizzato un avatar di intelligenza artificiale per la propria difesa in tribunale[19]. Ciò ha sollevato molte preoccupazioni basate sulla parzialità di tale strumento, sulla sua suscettibilità a fabbricare informazioni e su come commetta errori su argomenti di varia importanza come nella scrittura e nel diritto.
Anche le content farm possono essere affette da "cannibalismo" dell'intelligenza artificiale, un fenomeno in cui i modelli di IA, addestrati sull'output di modelli di IA precedenti, peggiorano progressivamente (collasso del modello)[20]. Si tratta di un processo in cui gli LLM, modelli progettati per l'interpretazione, il parlato, la traduzione e la generazione di testo, iniziano a consumare il contenuto che hanno creato. Nel tempo, questi generatori di testo possono presentare deviazioni significative dalle informazioni originali su cui sono stati addestrati i modelli. Se una content farm utilizza un LLM per generare testo e l'LLM utilizza i propri contenuti, la sua accuratezza diminuirà, portando a disinformazione e a contenuti complessivamente peggiori.
Le content farm sono state utilizzate anche per disinformare intenzionalmente il pubblico e tentare di influenzare i risultati elettorali. Nelle elezioni presidenziali negli Stati Uniti d'America del 2016, oltre 140 siti web di fake news di Veles, nella Macedonia del Nord, si sono spacciati per siti web americani e hanno scritto articoli sensazionalistici nel tentativo di ottenere più condivisioni sui social media[2]. Gli Stati Uniti sono stati presi di mira perché gli utenti statunitensi su Facebook hanno un fatturato medio per utente più elevato, circa 4 volte superiore alla media mondiale[21]. Questo potenziale di fatturato ha incentivato gli autori a creare contenuti accattivanti che sapevano sarebbero stati condivisi. Questi articoli di content farm possono spesso convincere centinaia di migliaia di persone a interagire con i post[2].
Allo stesso modo, le content farm hanno utilizzato bot per creare recensioni non autentiche di prodotti[11]. Questo traffico di siti web "fabbricato" incoraggia gli inserzionisti a offrire prezzi più alti per gli spazi pubblicitari sui siti web; la maggior parte delle aziende ha automatizzato le offerte, il che significa che gli spazi non verificati possono costare alle aziende molti soldi senza alcun ritorno. Si stima che ogni anno vengano sprecati 13 miliardi di dollari in questa pubblicità[22].
Risposte dei motori di ricerca
[modifica | modifica wikitesto]Google ha tentato di abbassare la classifica dei siti web di bassa qualità con il suo aggiornamento Panda Update nel 2011[23]. DuckDuckGo ha implementato misure per bloccare i siti di bassa qualità basati sull'intelligenza artificiale nel 2024[24].
Le content farm sono state un problema per le piattaforme di scambio di annunci e molte hanno delle policy in merito, ma l’applicazione di tali policy è rara[22]. NewsGuard ha scoperto che Google è molto più propenso a pubblicare annunci provenienti da content farm[22].
Note
[modifica | modifica wikitesto]- 1 2 Content farm e IA, la combinazione pericolosa che alimenta la disinformazione online, su la Repubblica, 20 febbraio 2024. URL consultato il 17 ottobre 2025.
- 1 2 3 (EN) Craig Silverman, Lawrence Alexander, How Teens In The Balkans Are Duping Trump Supporters With Fake News, su BuzzFeed News, 3 novembre 2016. URL consultato il 17 ottobre 2025.
- 1 2 3 (EN) ‘I was a Macedonian fake news writer’, su www.bbc.com, 29 maggio 2019. URL consultato il 17 ottobre 2025.
- ↑ (EN) Luis Prada, AI Models Are Cannibalizing Each Other—and It Might Destroy Them, su VICE, 3 giugno 2025. URL consultato il 17 ottobre 2025.
- ↑ (EN) Kate Knibbs, That Sports News Story You Clicked on Could Be AI Slop, in Wired. URL consultato il 17 ottobre 2025.
- 1 2 (EN) Maggie Harrison Dupré, People Are Spinning Up Low-Effort Content Farms Using AI, su Futurism, 2 luglio 2023. URL consultato il 17 ottobre 2025.
- ↑ (EN) » The Answer Factory: Demand Media and the Fast, Disposable, and Profitable as Hell Media Model, su WIRED. URL consultato il 17 ottobre 2025 (archiviato dall'url originale il 23 febbraio 2011).
- ↑ (EN) Yahoo Harvests “Content Farm” Associated Content for $90 Million, Report – Beet.TV, su Beet.TV - The Root to the Media Revolution, 18 maggio 2010. URL consultato il 17 ottobre 2025.
- ↑ Furthering Our Focus, in Yahoo. URL consultato il 17 ottobre 2025.
- ↑ (EN) Writers Explain What It's Like Toiling on the Content Farm - MediaShift, in MediaShift, 21 luglio 2010. URL consultato il 17 ottobre 2025.
- 1 2 (EN) A.I.-Generated Content Discovered on News Sites, Content Farms and Product Reviews (Published 2023), 19 maggio 2023. URL consultato il 17 ottobre 2025.
- ↑ (EN) USA Today turns to the content farm as the ship sinks | Blog | Econsultancy, su econsultancy.com. URL consultato il 17 ottobre 2025 (archiviato dall'url originale il 13 aprile 2010).
- ↑ (EN) Bernard Marr, The Danger Of AI Content Farms, su Forbes. URL consultato il 17 ottobre 2025.
- ↑ (EN) Michael Arrington, The End Of Hand Crafted Content, su TechCrunch, 13 dicembre 2009. URL consultato il 17 ottobre 2025.
- ↑ (EN) It’s harder than ever to find reliable product recommendations online, in The Washington Post, 13 gennaio 2025. URL consultato il 17 ottobre 2025.
- 1 2 (EN) FOX 32 Digital Staff, Chicago Sun-Times issues response after publication of fake book list generated by AI, su FOX 32 Chicago, 20 maggio 2025. URL consultato il 17 ottobre 2025.
- ↑ (EN) Rise of the Newsbots: AI-Generated News Websites Proliferating Online, su NewsGuard. URL consultato il 17 ottobre 2025.
- ↑ (EN) UK judge warns of risk to justice after lawyers cited fake AI-generated cases in court, su AP News, 7 giugno 2025. URL consultato il 17 ottobre 2025.
- ↑ (EN) Rio Yamat, From AI avatars to virtual reality crime scenes, courts are grappling with AI in the justice system, su AP News, 9 maggio 2025. URL consultato il 17 ottobre 2025.
- ↑ Che cos'è il collasso del modello? | IBM, su www.ibm.com, 14 ottobre 2024. URL consultato il 17 ottobre 2025.
- ↑ (EN) Josh Constine, Facebook swells to 1.65B users and beats Q1 estimates with $5.38B revenue, su TechCrunch, 27 aprile 2016. URL consultato il 17 ottobre 2025.
- 1 2 3 (EN) Tate Ryan-Mosleyarchive page, Junk websites filled with AI-generated text are pulling in money from programmatic ads, su MIT Technology Review. URL consultato il 17 ottobre 2025.
- ↑ (EN) Google, Finding more high-quality sites in search, su Official Google Blog. URL consultato il 17 ottobre 2025.
- ↑ (EN) Christopher Mimsarchive page, The Search Engine Backlash Against ‘Content Mills’, su MIT Technology Review. URL consultato il 17 ottobre 2025.