Atlas Vector Search obtient le NPS le plus élevé pour les développeurs dans le cadre de l'enquête Retool State of AI 2023
Retool vient de publier son tout premier rapport sur l'IA et il vaut le détour. Inspirée de son célèbre rapport State of Internal Tools, l'enquête sur l'état de l'IA a examiné plus de 1 500 spécialistes de la technologie issus de divers secteurs d'activité : ingénieurs logiciels, dirigeants, chefs de produit, concepteurs, etc. Son objectif est de comprendre comment ils exploitent l'intelligence artificielle (IA).
Dans le cadre de cette enquête, Retool s'est penché sur les outils les plus populaires, y compris les bases de données vectorielles les plus utilisées avec l'IA. Elle a révélé que MongoDB Atlas Vector Search a obtenu le Net Promoter Score (NPS) le plus élevé et est la deuxième base de données vectorielle la plus utilisée, cinq mois seulement après son lancement. Elle devance ainsi des solutions concurrentes qui existent depuis des années.
Dans cet article, nous examinerons l'essor phénoménal des bases de données vectorielles et comment les développeurs utilisent des solutions telles qu'Atlas Vector Search pour créer des applications alimentées par l'IA. Nous aborderons également d'autres points clés du rapport Retool.
Consultez notre page de ressources sur l'IA pour en savoir plus sur la création d'applications alimentées par l'IA avec MongoDB.
Adoption des bases de données vectorielles : en plein essor (enfin presque…)
De la curiosité mathématique à la superpuissance à l'origine de l’IA générative et les LLM, les vector embeddings et les bases de données qui les gèrent ont parcouru un long chemin en très peu de temps.
Découvrez les tendances des modèles de base de données de DB-Engines au cours des 12 derniers mois et vous verrez que les bases de données vectorielles dépassent de loin toutes les autres en termes de popularité. Il suffit de regarder la trajectoire «de la ligne rose « vers le haut et vers la droite » dans le graphique ci-dessous.
Mais pourquoi les bases de données vectorielles sont-elles devenues si populaires ?
Ils constituent un élément clé d'un nouveau modèle architectural appelé « génération augmentée de récupération » (RAG). Il s'agit d'un puissent mélange qui combine les capacités de raisonnement des LLM préformés et polyvalents et les alimente en données spécifiques à l'entreprise en temps réel. Il en résulte des applications alimentées par l'IA qui apportent des solutions uniques à l'entreprise, qu'il s'agisse de créer de nouveaux produits, de repenser l'expérience client ou d'optimiser la productivité et l'efficacité.
Les vector embeddings sont essentielles pour exploiter tout le potentiel de la RAG. Leurs modèles encodent les données d'entreprise, qu'il s'agisse de texte, de code, de vidéo, d'images, de flux audio ou de tableaux, comme les vecteurs. Ces derniers sont ensuite stockés, indexés et interrogés dans une base de données vectorielle ou un moteur de recherche vectorielle, fournissant les données d'entrée pertinentes en tant que contexte au LLM sélectionné. Il en résulte des applications d'IA fondées sur des données d'entreprise et des connaissances pertinentes pour l'activité, précises, fiables et à jour.
Comme le montre l'enquête Retool, le paysage des bases de données vectorielles reste encore à exploiter. À l'heure actuelle, moins de 20 % des personnes interrogées les utilisent, mais avec la tendance croissante à la personnalisation des modèles et l’infrastructure d’IA, elles devraient être de plus en plus plébiscitées.
Pourquoi les développeurs adoptent-ils Atlas Vector Search ?
L'enquête de Retool présente d'excellentes bases de données vectorielles qui ont ouvert la voie au cours des deux dernières années, en particulier dans les applications nécessitant une recherche sémantique contextuelle. Pensez aux catalogues de produits ou à la découverte de contenu.
Cependant, le défi auquel les développeurs sont confrontés lorsqu'ils utilisent ces bases de données vectorielles est qu'ils doivent les intégrer avec d'autres bases de données dans la pile technologique de leur application.
Chaque couche de base de données supplémentaire de la pile technologique des applications renforce la complexité, la latence et les frais généraux. Cela signifie qu'ils doivent se procurer une autre base de données, l'assimiler, l'intégrer (pour le développement, les tests et la production), la sécuriser et la certifier, la faire évoluer, la surveiller et la sauvegarder, tout en synchronisant les données entre ces multiples systèmes.
MongoDB adopte une approche différente qui contourne ces problèmes :
-
Les développeurs stockent et recherchent des vector embeddings natives dans le même système que celui qu'ils utilisent comme base de données opérationnelle.
-
Grâce à l'architecture distribuée de MongoDB, ils peuvent isoler ces différentes charges de travail tout en synchronisant les données.
-
Search Nodes fournissent un calcul dédié et une isolation de la charge de travail, un aspect essentiel pour les charges de travail de recherche vectorielle à forte intensité de mémoire. Ce processus permet ainsi d'améliorer les performances et la disponibilité.
-
Contrairement aux autres base de données, grâce au schéma de documents flexible et dynamique de MongoDB, les développeurs peuvent modéliser et faire évoluer les relations entre les vecteurs, les métadonnées et les données d'application.
-
Ils peuvent traiter et filtrer les données vectorielles et opérationnelles en fonction des besoins de l'application avec une API de requête expressive et des pilotes qui prennent en charge tous les langages de programmation les plus courants.
-
L'utilisation de la plateforme de données de développement MongoDB Atlas entièrement gérée permet aux développeurs d'obtenir le répartir, la sécurité et la performance que les utilisateurs de leurs applications attendent.
Que signifie cette approche unifiée pour les développeurs ? Les cycles de développement plus rapides et les applications plus performantes offrent une latence plus faible avec des données plus pertinentes, le tout associé à des frais généraux et des coûts opérationnels réduits. Ces résultats se traduisent par le NPS de MongoDB, le meilleur de sa catégorie.
Saravana Kumar, CEO, Kovai parle du développement de l'assistant d'intelligence artificielle de son entrepriseAtlas Vector Search est robuste, rentable et incroyablement rapide !
Consultez notre série d'articles Concevoir l'IA avec MongoDB (rendez-vous dans la section « Démarrer » pour lire les articles précédemment publiés). Ici, Atlas Vector Search est utilisé pour les applications alimentées par l'IA conversationnelle avec des chatbots et des voicebots, des co-pilotes, des informations sur les menaces et la cybersécurité, la gestion des contrats, les foires aux questions, la conformité et les assistants de traitement, la découverte et la monétisation des contenus, etc.
Pierce Lamb, ingénieur logiciel senior de l'équipe Data and Machine Learning chez VISO TRUSTMongoDB stockait déjà des métadonnées relatives aux artefacts de notre système. Avec l'introduction d'Atlas Vector Search, nous disposons désormais d'une base de données complète de métadonnées vectorielles qui a été testée pendant plus de dix ans et qui répond à nos besoins considérables en termes de récupération. Il n'est pas nécessaire de déployer une nouvelle base de données que nous devrions gérer et apprendre. Nos vecteurs et les métadonnées de nos artefacts peuvent être stockés les uns à côté des autres.
Que nous apprend le rapport Retool concernant l'IA ?
Au-delà de la découverte des bases de données vectorielles les plus populaires, l'enquête aborde différents aspects du secteur. Elle commence par explorer les perceptions de l'IA par les personnes interrogées (sans surprise, les dirigeants sont plus optimistes que les collaborateurs). Il explore ensuite les priorités en matière d'investissement, l'impact de l'IA sur les perspectives d'emploi futures et la manière dont elle affectera probablement les développeurs et les compétences dont ils auront besoin à l'avenir.
L'enquête examine ensuite le niveau d'adoption et de maturité de l'IA. Plus de 75 % des répondants déclarent que leur entreprise commence à exploiter l'IA. Environ la moitié d'entre eux déclarent que ces projets n'en sont qu'à leurs prémices et ciblent principalement une utilisation interne. Elle se penche ensuite sur la nature de ces applications sur leur utilité au sein de l'entreprise. Elle constate que presque tout le monde utilise l'IA au travail, que ce soit autorisé ou non, puis identifie les principaux problèmes. Sans surprise, la précision des modèles, la sécurité et les hallucinations figurent en tête de liste.
L'enquête se termine par l'examen des principaux modèles utilisés. Là encore, il n'est pas surprenant de constater que les offres d'Open AI sont en tête, mais cela indique également une intention croissante d'utiliser des modèles open source ainsi que des outils et infrastructures d'IA pour la personnalisation à l'avenir.
Pour en savoir plus sur cette enquête, lisez le rapport.
Démarrer avec Atlas Vector Search
Vous souhaitez découvrir notre offre Vector Search ? Rendez-vous sur notre page produit Atlas Vector Search. Vous y trouverez des liens vers des tutoriels, de la documentation et des intégrations clés de l'écosystème d'IA afin de vous commencer à créer vos propres applications alimentées par l'IA.
Si vous souhaitez en savoir plus sur les possibilités de haut niveau de la recherche vectorielle, téléchargez notre livre blanc sur l'intégration de l'IA générative.
Consultez notre présentation « Créer votre feuille de route IA pour 2024 » pour en savoir plus sur les différents cas d'utilisation de l'IA et comment les entreprises les prennent en charge !