Einführung von Atlas Vector Search: Entwickeln Sie intelligente Anwendungen mit Semantic Search und KI für alle Arten von Daten

Benjamin Flast

Wir freuen uns, Ihnen mitteilen zu können, dass Atlas Vector Search jetzt allgemein verfügbar ist. Vector Search unterstützt jetzt Produktions-Workloads, sodass Sie auch weiterhin intelligente Anwendungen auf Basis von Semantic Search und generativer KI erstellen können, während der Ressourcenverbrauch optimiert und die Leistung mit Search Nodes verbessert wird.

Die vollständige Ankündigung und die Liste der Vorteile finden Sie unten.

Die Zeit ist endlich gekommen. Künstliche Intelligenz hat sich nach links verschoben. Was einst in unternehmensweiten Data-Science- und Machine-Learning-Teams entwickelt wurde und oft dort feststeckte, ist jetzt für Entwickler auf der ganzen Welt leicht verfügbar. Um jedoch die unglaubliche Leistungsfähigkeit dieser neuen Tools nutzen zu können, müssen sie auf einer zuverlässigen, zusammensetzbaren und eleganten Datenplattform aufbauen. Gleichzeitig sind diese neuen Funktionen, wie wir alle gesehen haben, nur so gut, wie die Daten oder die „Grundwahrheit“, auf die sie zugreifen müssen. Aus diesem Grund freuen wir uns, der MongoDB Atlas Developer Data Platform eine weitere Funktion hinzuzufügen, um das volle Potenzial Ihrer Daten auszuschöpfen und KI-Anwendungen voranzutreiben. MongoDB freut sich, heute unsere aufregende neue Vector Search Funktion bekannt zu geben, die den Anforderungen von Daten in allen Formen gerecht wird und es unseren Partnern ermöglicht, diese unglaublichen neuen Funktionen zu nutzen.

Auf unserer KI-Ressourcenseite erfahren Sie mehr über die Entwicklung von KI-gestützten Apps mit MongoDB.


Was ist die Fähigkeit?

Für diejenigen unter Ihnen, die es nicht kennen: Vector Search ist eine Funktion, mit der Sie Ihre Daten auf der Grundlage der Semantik oder der Bedeutung der Daten und nicht auf der Grundlage der Daten selbst abfragen können. Möglich wird dies dadurch, dass man jede Form von Daten numerisch als Vektor darstellen kann, die dann mit Hilfe hochentwickelter Algorithmen miteinander verglichen werden können. Der erste Schritt besteht darin, die Quelldaten, egal ob Text, Audio, Bild oder Video, mithilfe eines „Kodierungsmodells“ in „Vektoren“ oder „Einbettungen“ umzuwandeln. Dank der jüngsten Fortschritte in der künstlichen Intelligenz sind diese Vektoren nun besser in der Lage, die Bedeutung von Daten zu erfassen, indem sie niedrigerdimensionale Daten in einen höherdimensionalen Raum projizieren, der mehr Kontext zu den Daten enthält. Sobald diese Daten in diese numerischen Darstellungen umgewandelt wurden, können Sie Abfragen durchführen, um ähnliche Werte mithilfe eines ANN-Algorithmus (Approximate Nearest Neighbors) zu finden, der es Ihren Abfragen ermöglicht, sehr schnell Daten mit ähnlichen Vektoren zu finden. Auf diese Weise können Sie Anfragen wie „Gib mir Filme mit dem Gefühl der Traurigkeit“ oder „Gib mir Bilder, die aussehen wie ...“ erfüllen. Diese Fähigkeit eröffnet Ihnen eine ganz neue Gruppe von Möglichkeiten.

In welcher Beziehung steht dies zu unserer Plattform?

Da diese Funktionalität nativ in MongoDB Atlas integriert ist, müssen Sie Ihre Daten nicht kopieren und transformieren, keinen neuen Stack und keine neue Syntax erlernen oder eine völlig neue Infrastruktur managen. Mit Atlas Vector Search von MongoDB ist das alles nicht nötig. Sie können diese leistungsstarken neuen Funktionen innerhalb einer erstklassigen und kampferprobten Plattform nutzen, um Anwendungen schneller als je zuvor zu entwickeln. Viele der mit der Nutzung von KI und Vector Search verbundenen Herausforderungen ergeben sich aus der Komplexität, die mit der sicheren Offenlegung Ihrer Anwendungsdaten verbunden ist. Diese Aufgaben erhöhen die Reibungspunkte für die Entwicklererfahrung und erschweren das Entwickeln, Debuggen und Warten Ihrer Anwendungen. MongoDB beseitigt all diese Herausforderungen und bringt gleichzeitig die Leistungsfähigkeit von Vector Search auf eine Plattform, die organisch vertikal und horizontal skaliert, um jeden Workload zu bewältigen, die Sie ihr auferlegen. Schließlich ist nichts davon ohne Garantien in Bezug auf Sicherheit und Verfügbarkeit von Bedeutung, und das Engagement von MongoDB für eine sichere Datenverwaltungslösung zusammen mit hoher Verfügbarkeit durch Redundanz und automatischem Failover sorgt dafür, dass Ihre Anwendung nie aus dem Takt kommt.

Neu bei MongoDB.local London

Bei .Local London freuen wir uns, die Einführung einer speziellen Vektorsuch-Aggregationsstufe ankündigen zu können, die über $vectorSearch aufgerufen werden kann. Diese neue Aggregationsstufe führt ein paar neue Konzepte ein, die die Vektorsuche noch leistungsfähiger und einfacher als je zuvor machen. Mit $vectorSearch können Sie auch einen Vorfilter mit MQL-Syntax (z. B. $gte, $eq usw.) verwenden, die beim Durchlaufen des Index Dokumente herausfiltert, was zu konsistenten Ergebnissen und hoher Leistung führt. Jeder Entwickler, der MongoDB versteht, wird diese Filterfunktion problemlos nutzen können! Schließlich führen wir auch zwei Möglichkeiten ein, Ihre Ergebnisse innerhalb der Aggregationsphase zu optimieren, sowohl einen „numCandidates“ -Parameter als auch einen „limit“ -Parameter. Mit diesen Parametern können Sie einstellen, wie viele Dokumente für die ungefähre Suche nach dem nächsten Nachbarn in Frage kommen sollen, und dann die Anzahl der gewünschten Ergebnisse mit dem „Limit“ einschränken.

Wie interagiert dies mit der Umgebung?

Die Menge an Innovationen im Bereich der künstlichen Intelligenz ist erstaunlich und es ist beeindruckend zu sehen, welche rasanten Fortschritte die Open Source Community macht. Es gibt enorme Fortschritte bei Open-Source-Sprachmodellen sowie bei den verschiedenen Methoden, mit denen sie in Anwendungen integriert werden können. Angesichts der enormen Leistungsfähigkeit, die künstliche Intelligenz bietet, war es noch nie so wichtig, eine solide Abstraktion für diese Funktion zu haben, um Entwicklern die Flexibilität zu bieten, die sie benötigen. Vor diesem Hintergrund freuen wir uns, Ihnen mitteilen zu können, dass wir in LangChain und LlamaIndex mehrere Funktionen unterstützen, von der Unterstützung von Vector Search bis hin zur Chat-Protokollierung und Dokumentindizierung. Wir schreiten hier schnell voran und werden weiterhin neue Funktionen für die führenden Anbieter veröffentlichen.

Zusammenfassung

Trotz alledem geht es gerade erst los. Wir bei MongoDB setzen uns dafür ein, Entwicklern dabei zu helfen, die nächste Generation von KI-fähigen Anwendungen zu entwickeln – mit der besten Plattform für Entwicklerdaten auf dem Markt. Wir werden uns auch mit weiteren Frameworks und Plugin-Architekturen befassen, die wir unterstützen können. Aber wie immer sind Sie als Entwickler der wichtigste Teil dieser Gleichung. Wir werden mit der Community sprechen und Wege finden, wie wir Ihnen am besten helfen können, und sicherstellen, dass wir Ihre Bedürfnisse bei jedem Schritt erfüllen. Geh los und entwickel!

Um mehr über Atlas Vector Search zu erfahren und herauszufinden, ob es die richtige Lösung für Sie ist, schauen Sie sich unsere Dokumentation, unser Whitepaper und unsere Tutorials an oder legen Sie noch heute los.