Vector Search e nodi di ricerca vettoriale dedicati: ora in General Availability

Elliott Gluck

Siamo entusiasti di compiere un ulteriore passo avanti nel potenziare ulteriormente la piattaforma Atlas con il rilascio (GA) sia di Atlas Vector Search che di Search Nodes.

Da quando abbiamo annunciato Atlas Vector Search e l'infrastruttura dedicata con Search Nodes in public preview, abbiamo riscontrato un costante interesse e una richiesta di carichi di lavoro aggiuntivi che utilizzano nodi di ricerca ottimizzati per vettori. Questo nuovo livello di scalabilità e prestazioni garantisce l'isolamento del carico di lavoro e la capacità di ottimizzare meglio le risorse per i casi d'uso della ricerca vettoriale.

Atlas Vector Search consente agli sviluppatori di creare applicazioni intelligenti basate sulla ricerca semantica e sull'AI generativa su qualsiasi tipo di dati. Atlas Vector Search risolve la sfida di fornire risultati pertinenti anche quando gli utenti non sanno cosa stanno cercando e utilizza modelli di apprendimento automatico per trovare risultati simili per quasi tutti i tipi di dati. A soli cinque mesi dall'annuncio della public preview, Atlas Vector Search ha già ricevuto il più alto net promoter score (NPS) degli sviluppatori - una misura della probabilità che qualcuno raccomandi una soluzione a qualcun altro - ed è il secondo database vettoriale più utilizzato, secondo il rapporto State of AI di Retool.

Consulta la nostra pagina delle risorse sull'intelligenza artificiale per saperne di più sulla creazione di app basate sull'intelligenza artificiale con MongoDB.

Due sono gli use case per la creazione di applicazioni di nuova generazione con Atlas Vector Search:

  1. Ricerca semantica: ricerca di risultati rilevanti da dati non strutturati in base alla somiglianza semantica

  2. Retrieval augmented generation (RAG): aumenta le incredibili capacità dei LLM con feed di dati personali in tempo reale per creare app GenAI personalizzate in base alle esigenze della tua azienda.

Atlas Vector Search sblocca tutto il potenziale dei tuoi dati, sia strutturati che non strutturati, sfruttando l'aumento della popolarità e dell'utilizzo dell'intelligenza artificiale e LLM per risolvere le problematiche aziendali più critiche. Questo è possibile perché Vector Search fa parte della developer data platform MongoDB Atlas, che inizia con il nostro data model doc flessibile e l'API unificata che offre un'esperienza coerente. Per assicurarti di ottenere il massimo valore da Atlas Vector Search, abbiamo coltivato un solido ecosistema di integrazioni con l'intelligenza artificiale, che consente agli sviluppatori di utilizzare i loro LLM o framework preferiti.

Per saperne di più su Atlas Vector Search, guarda questo breve video o passa direttamente al tutorial.

Atlas Vector Search sfrutta anche la nostra nuova architettura di Search Nodes dedicata, che consente una migliore ottimizzazione del giusto livello di risorse per le esigenze di carichi di lavoro specifici. I nodi di ricerca forniscono un'infrastruttura dedicata ai carichi di lavoro di Atlas Search e Vector Search, consentendo di ottimizzare le risorse di calcolo e di scalare completamente le esigenze di ricerca indipendentemente dal database. I nodi di ricerca offrono migliori prestazioni su scala, garantendo l'isolamento dei carichi di lavoro, una maggiore disponibilità e la possibilità di ottimizzare l'uso delle risorse. In alcuni casi abbiamo riscontrato tempi di query più rapidi del 60% per i carichi di lavoro di alcuni utenti, grazie alla query simultanea nei nodi di ricerca.

Oltre ai nodi di ricerca più pesanti dal punto di vista del calcolo che abbiamo fornito in public preview, questa release GA include un'opzione ottimizzata per la memoria a bassa CPU che è ottimale per vector Search in produzione. In questo modo la contesa delle risorse e la possibilità di un'interruzione del servizio (dovuta al fatto che il database e la ricerca condividono la stessa infrastruttura) non sono più un problema.

"Riteniamo che questa sia la prossima evoluzione della nostra architettura sia per Atlas Search che per Vector Search, e che aumenti il valore offerto dalla developer data platform MongoDB. Al momento i nodi di ricerca sono disponibili su cluster AWS a singola regione (con Google Cloud e Azure in arrivo), mentre i clienti possono continuare a utilizzare l'infrastruttura condivisa di Google Cloud e Microsoft Azure."

Leggi il nostro blog post per scoprire come attivare i nodi di ricerca oggi stesso, oppure passa direttamente al tutorial.

Entrambe le funzionalità sono disponibili da oggi per l'uso in produzione. Siamo ansiosi di ammirare le tue creazioni e ti invitiamo a contattarci per qualsiasi domanda.