AnnuncioTi presentiamo MongoDB 8.0, il MongoDB più veloce di sempre! Leggi >
AnnuncioVoyage AI si unisce a MongoDB per potenziare applicazioni AI più accurate e affidabili su Atlas. Scopra di più >
Blog home
arrow-left

Sblocca il valore dell'archivio storico con l'AI multimodale

20 gennaio 2026 ・ 3 min read

La digitalizzazione avrebbe dovuto risolvere il problema degli archivi. Scansionare le pagine, eseguire il riconoscimento ottico dei caratteri (OCR), attivare la ricerca per parole chiave — tutto fatto. Eppure, decenni e milioni di dollari dopo, la maggior parte degli archivi di giornali rimane essenzialmente inutilizzabile per una ricerca seria.​

Prendi per esempio un importante quotidiano statunitense con ogni edizione cartacea scansionata e disponibile per gli abbonati. Per i ricercatori che cercano le tendenze storiche dei prezzi delle materie prime, la digitalizzazione non ha cambiato quasi nulla: sfogliano ancora manualmente migliaia di edizioni. Il collo di bottiglia non è rappresentato dalla conservazione, bensì dal recupero.

Come prevedibile, la tecnologia OCR incontra difficoltà con la carta stampata di un secolo fa: carta deteriorata, caratteri tipografici insoliti, impaginazione complessa. Ma il problema più profondo è ciò che l'OCR non è in grado di gestire: il significato incorporato in grafici, diagrammi e visualizzazioni di dati. Questi elementi visivi — spesso i contenuti più preziosi dal punto di vista analitico — rimangono completamente invisibili ai sistemi di ricerca.​

Musei e archivi in tutto il mondo riportano situazioni simili. Un istituto ha raggiunto una precisione dell'OCR pressoché perfetta grazie a scanner piani, supporti specializzati e processi di controllo qualità esaustivi. Eppure il problema fondamentale persiste: la ricerca per parole chiave non può fornire la ricchezza semantica necessaria per l'analisi longitudinale, l'identificazione delle tendenze o la ricerca comparativa su un periodo di decenni.​

La svolta multimodale dell'AI

Il passaggio dall'OCR con ricerca testuale agli embedding vettoriali multimodali rappresenta qualcosa di più fondamentale di un semplice miglioramento dell'accuratezza. Si tratta di un modello diverso di ciò che significa "ricercabile".​

voyage-multimodal-3.5 (uscito la scorsa settimana!) interpreta testo e immagini direttamente dalle scansioni, mappando intere pagine in vettori semantici densi. Ad esempio, voyage-multimodal-3.5 vettorizza efficacemente i dati multimodali per acquisire al meglio le caratteristiche semantiche chiave da tabelle, grafici, figure, diapositive, PDF e altro ancora. Questo permette di effettuare query in base al significato, al contesto o al concetto visivo, non solo a corrispondenze esatte di parole chiave. In modo fondamentale, questi modelli comprendono il contenuto semantico delle visualizzazioni statistiche, facendo emergere grafici economici per query come "tendenze dell'inflazione negli anni '70" anche quando non esiste un testo esplicativo.​

Le implicazioni vanno oltre il recupero. Per la prima volta, gli archivi si trasformano in insiemi di dati che si possono effettivamente analizzare. I ricercatori possono misurare come la copertura dell'energia nucleare si è evoluta dal dibattito politico al consenso scientifico, e individuare se questi cambiamenti sono apparsi prima negli editoriali o nelle inchieste. Possono tracciare come l'uso dei grafici economici sia cambiato decennio dopo decennio, o come l'energia rinnovabile sia passata da menzioni marginali alla dominanza in prima pagina.​

Non si tratta solo di una ricerca migliore. È la differenza tra una collezione statica e un'infrastruttura di ricerca.

Ricerca semantica su larga scala

MongoDB Atlas Vector Search con il modello multimodale-3 di Voyage AI consente di effettuare ricerche su quesiti a cui la tradizionale ricerca per parole chiave non può rispondere. Invece di trovare dove appare "energia rinnovabile", i ricercatori possono scoprire come il trattamento visivo e testuale dell'argomento si è evoluto nel corso dei decenni. Possono confrontare la copertura in prima pagina con i commenti editoriali, monitorare l'introduzione delle visualizzazioni dei dati e individuare cambiamenti nell'inquadratura.​​

Figura 1. Architettura di riferimento per la ricerca negli archivi storici.

Diagramma dell'architettura di riferimento che illustra il flusso di lavoro per la ricerca semantica degli archivi storici.

L'architettura segue un flusso di lavoro lineare, come illustrato nella Figura 1. Gli archivi storici dei giornali — conservati come contenuti originali in una CDN o in un filesystem — vengono elaborati tramite l'ultimo modello multimodale di Voyage AI, che genera embedding vettoriali a 1024 dimensioni sia dal testo sia dalle immagini. MongoDB memorizza questi embedding insieme ai metadati in un modello documentale unificato, eliminando la complessità di sincronizzazione tipica degli archivi vettoriali separati.​​

Quando un ricercatore interroga "dibattiti sul trasporto pubblico dagli anni '70 agli anni '90", il sistema elabora quella domanda in un vettore semantico usando lo stesso modello voyage-multimodal-3.5. La ricerca vettoriale di MongoDB confronta questo vettore di query con milioni di embedding archiviati, recuperando articoli, grafici e immagini rilevanti basandosi sulla somiglianza concettuale nello spazio ad alta dimensione, non sulla corrispondenza delle parole chiave. I risultati vengono restituiti ordinati per rilevanza semantica, evidenziando contenuti che condividono significato anche quando i termini esatti differiscono.​​

L'ultima fase consente aggregazione ed esplorazione: i ricercatori possono analizzare i modelli di frequenza nel tempo, segmentare i risultati per data di pubblicazione o tipo di sezione, e costruire visualizzazioni statistiche a partire dai risultati classificati. Il framework di aggregazione di MongoDB può aiutare a gestire questo layer analitico – facile e intuitivo da implementare, potente nell'aggiungere valore incrementale ai dati recuperati.

I nodi di ricerca dedicati di MongoDB forniscono l'isolamento dei carichi di lavoro e la scalabilità dell'infrastruttura di ricerca vettoriale indipendentemente dai carichi operativi del database. Quando esistono metadati strutturati, tra cui date di pubblicazione, etichette di sezione o altri attributi catalogati, la ricerca ibrida di MongoDB combina la somiglianza semantica con i filtri tradizionali in un'unica query, perfezionando i risultati senza sacrificare la potenza semantica.​

Roadmap per i leader IT

Iniziare con una raccolta pilota di 10.000–20.000 pagine ha senso, ma i criteri di selezione contano più del volume. Le collezioni dovrebbero comprendere diversi tipi di contenuti: articoli, pubblicità, grafici, infografiche e potenzialmente video. L'obiettivo è verificare se i modelli multimodali e la ricerca vettoriale possono far emergere con precisione sia il contenuto testuale che quello visivo attraverso query semantiche.​

Metriche di successo da monitorare: recupero di richiamo superiore al 90% tra i tipi di contenuto, riduzione dei costi di manodopera manuale, accelerazione dei flussi di lavoro di ricerca, e aumenti misurabili dell’engagement negli archivi. Le opportunità di guadagno derivanti dalla concessione di licenze API e dalla monetizzazione delle risorse visive sono indicatori secondari: dipendono dalla dimostrazione del valore della ricerca.​

La questione strategica non è se modernizzare gli archivi. Dipende se la tua organizzazione vede gli archivi come collezioni statiche da preservare, o come sistemi di conoscenza dinamici che possono generare valore continuo. L'IA multimodale e la ricerca vettoriale permettono quest'ultima, ma solo se l'infrastruttura circostante supporta flussi di lavoro analitici, non solo il recupero.​

Non è un miglioramento incrementale. Si tratta di un cambiamento di categoria in ciò che gli archivi digitalizzati possono fare.

megaphone
Next Steps

Visita la pagina web Media and Entertainment e scopri di più sul ruolo di MongoDB nell'industria dei media.

Leggi il blog Voyage-multimodal-3 per scoprire come Voyage AI abilita gli embedding per testo, immagini e screenshot.

Esplora la Libreria di soluzioni MongoDB per scoprire le best practice, i modelli pronti all'uso e le indicazioni degli esperti per creare applicazioni potenti.

Scopri come le aziende hanno innovato con MongoDB in queste Customer Success Stories.

Risorse MongoDB
Hub di apprendimento Atlas|Customer Case Study|Hub di apprendimento AI|Documentazione|MongoDB University