Construire avec des modèles : Un résumé

MongoDB
September 15, 2023 | Updated: December 18, 2025

Alors que nous terminons la série "Building with Patterns", c'est l'occasion de récapituler les problèmes que les modèles abordés ont permis de résoudre et de mettre en évidence certains des avantages et des compromis de chaque modèle. La question la plus fréquente concernant les modèles de conception est la suivante : "Je conçois une application pour faire X, comment dois-je modéliser les données ?". Comme nous espérons que vous l'avez découvert au cours de cette série d’articles, il y a beaucoup d'éléments à prendre en considération pour répondre à cette question. Cependant, nous avons inclus un schéma d’exemples de cas d’utilisation que nous avons trouvé utile pour au moins fournir un guide initial sur les modèles de modélisation des données pour les cas d'utilisation génériques.

Exemples de cas d'utilisation

Le graphique ci-dessous indique ce que nous avons constaté après des années d'expérience avec nos clients en ce qui concerne les modèles de conception de schéma utilisés dans une variété d'applications. Il ne s'agit pas d'une définition "gravée dans le marbre" de règles indiquant quel modèle de conception peut être utilisé pour un type d'application particulier. Examinez ceux qui sont fréquemment utilisés dans votre cas d'utilisation. Mais, n'écartez pas les autres, ils peuvent tout de même s'appliquer. La façon dont vous concevez le schéma de données de votre application dépend fortement la manière dont vous accédez aux données.

Use Cases vs Patterns Matrix

Résumés des modèles de conception

Approximation

Le modèle Approximation est utile lorsque des calculs coûteux sont fréquemment effectués et que la précision de ces calculs n'est pas une priorité absolue.

Avantages

Moins d'écritures dans la base de données.
Maintenir des chiffres statistiquement valables.

Inconvénients

Les chiffres exacts ne sont pas représentés.
Doit être implémenté dans l'application.’

Attribut

Le modèle Attribut est utile pour les problèmes liés à l'existence de documents volumineux comportant de nombreux champs similaires, mais un sous-ensemble de champs partageant des caractéristiques communes et sur lesquels on souhaite effectuer un tri ou une requête. Lorsque les champs à trier ne se trouvent que dans un petit sous-ensemble de documents. Ou lorsque ces deux conditions sont réunies dans les documents.

Avantages

Moins d'index sont nécessaires.
Les requêtes deviennent plus simples à écrire et sont généralement plus rapides.

Bucket

Le modèle Bucket est une excellente solution lorsqu'il s'agit de gérer un flux de données, comme dans les applications Time Series, Real-Time Analytics ou Internet of Things (IoT)).

Avantages

Réduit le nombre total de documents dans une collection.
Améliore les performances de index.
Peut simplifier l'accès aux données en tirant parti de la préagrégation.

Computed

Lorsqu'il existe des schémas d'accès aux données très intensifs en lecture et que ces données doivent être calculées de manière répétée par l'application, le modèle Calculé (Computed Pattern) est une excellente option à explorer.

Avantages

Réduction de la charge du CPU pour les calculs fréquents.
Les requêtes deviennent plus simples à écrire et sont généralement plus rapides.

Inconvénients

Il peut être difficile d'identifier le besoin de ce modèle.
L'application ou l'utilisation excessive du modèle doit être évitée, sauf en cas de nécessité.

Document Versioning

Lorsque vous êtes confronté à la nécessité de conserver des versions antérieures de documents dans MongoDB, le modèle Document Versioning est une solution possible.

Avantages

Facile à mettre en œuvre, même sur des systèmes existants.
Aucun impact sur les performances des requêtes sur la dernière révision.

nconvénients

Double le nombre d'écritures.
Les requêtes doivent cibler la bonne collection.

Extended Reference

Le modèle Extended Reference est particulièrement utile lorsque votre application doit effectuer un grand nombre d'opérations de jointure pour regrouper des données accédées fréquemment ensemble.

Avantages

Améliore les performances lorsqu'il y a beaucoup d'opérations de jointure.
Des lectures plus rapides et une réduction du nombre total de jointures.

Inconvénients

Duplication des données.

Outliner

Constatez-vous que certaines requêtes ou certains documents ne correspondent pas au modèles de données habituels ? Ces exceptions sont-elles à l'origine de votre solution d'application ? Si c'est le cas, le modèle des valeurs aberrantes est une excellente solution à cette situation.

Avantages

Empêche que quelques documents ou requêtes ne déterminent la solution d'une application.
Les requêtes sont adaptées aux cas d'utilisation "typiques", mais les cas aberrants sont toujours pris en compte.

Inconvénients

Souvent adaptés à des requêtes spécifiques, les requêtes ad hoc risquent donc de ne pas donner de bons résultats.
Une grande partie de ce modèle est réalisée avec le code de l'application.

Pre-allocation

Lorsque vous connaissez la structure de votre document et que votre application doit simplement la remplir de données, le modèle Pre-Allocation est le bon choix.

Avantages

Simplification de la conception lorsque la structure du document est connue à l'avance.

Inconvénients

Simplicité contre performance.

Polymorphic

Le modèle Polymorphic est la solution lorsqu'il existe une variété de documents qui présentent plus de similitudes que de différences et que les documents doivent être conservés dans une collection unique.

Avantages

Facile à mettre en œuvre.
Les requêtes peuvent porter sur une seule collection.

Schema Versioning

Pratiquement toutes les applications peuvent bénéficier du Schema Versioning, car des modifications du schéma de données interviennent fréquemment au cours de la durée de vie d'une application. Ce modèle permet aux versions précédentes et actuelles des documents de coexister dans une collection.

Avantages

Aucun temps d'arrêt n'est nécessaire.
Contrôle de la migration des schémas.
Réduction de la dette technique future.

Inconvénients

Il se peut que deux index soient nécessaires pour le même champ lors de la migration.

Subset Pattern

Le modèle Subset résout le problème du dépassement de la capacité mémoire par les documents volumineux dont une grande partie des données n'est pas utilisée par l'application.

Avantages

Réduction de la taille globale des données de travail.
Temps d'accès au disque plus court pour les données les plus fréquemment utilisées.

Inconvénients

Nous devons gérer le sous-ensemble.
La récupération de données supplémentaires nécessite des accès supplémentaires à la base de données.

Tree

Lorsque les données ont une structure hiérarchique arborescente et qu'elles sont fréquemment interrogées, le modèle Tree est le schéma à suivre.

Avantages

Amélioration des performances en évitant les opérations de jointure multiples.

Inconvénients

Les mises à jour de l’arbre doivent être gérées dans l'application.

Conclusion

Comme nous espérons que vous l'avez vu dans cette série, le modèle document de MongoDB offre une grande flexibilité dans la façon dont vous modélisez les données. Cette flexibilité est incroyablement puissante, mais elle doit être exploitée en fonction des manières d'accèder aux données de votre application. N'oubliez pas que la conception du schéma dans MongoDB a un impact considérable sur les performances de votre application. Nous avons constaté que les problèmes de performance sont souvent dus à une mauvaise conception du schéma.

Gardez à l'esprit que pour améliorer encore la puissance du modèle document, ces modèles de conception de schémas peuvent être utilisés ensemble, lorsque cela s'avère judicieux. Par exemple, le schéma Versioning peut être utilisé en conjonction avec n'importe quel autre schéma au fur et à mesure que votre application évolue. Avec les douze modèles de conception de schémas abordés, vous disposez des outils et des connaissances nécessaires pour exploiter la puissance de la flexibilité du modèle document.

← Previous

Bauen mit Mustern: Eine Zusammenfassung

Zum Abschluss der Reihe „Bauen mit Mustern“ ist dies eine gute Gelegenheit, die Probleme, die die behandelten Muster lösen, noch einmal zusammenzufassen und einige der Vorteile und Nachteile jedes Musters hervorzuheben. Die am häufigsten gestellte Frage zu Schema-Design-Mustern lautet: „Ich entwerfe eine Anwendung für X, wie modelliere ich die Daten?“ Wir hoffen, dass Sie im Laufe dieser Blogserie herausgefunden haben, dass es bei der Beantwortung dieser Frage viele Dinge zu berücksichtigen gilt. Wir haben jedoch Charts für Anwendungsfälle beigefügt, die unserer Meinung nach hilfreich waren, um zumindest eine erste Anleitung zu Datenmodellierungsmustern für generische Anwendungsfälle zu geben. Beispielanwendungsfälle Die folgenden Charts sind eine Richtlinie dafür, was wir nach jahrelanger Erfahrung in der Zusammenarbeit mit unseren Kunden darüber herausgefunden haben, welche Schema-Design-Muster in einer Vielzahl von Anwendungen verwendet werden. Hierbei handelt es sich nicht um eine in Stein gemeißelte Festlegung von Regeln darüber, welches Designmuster für eine bestimmte Art von Anwendung verwendet werden kann. Stellen Sie sicher, dass Sie sich diejenigen ansehen, die in Ihrem Anwendungsfall häufig verwendet werden. Verwerfen Sie die anderen jedoch nicht, sie könnten immer noch zutreffen. Wie Sie Schema Ihrer Anwendung entwerfen, hängt stark von Ihren Datenzugriffsmustern ab. Zusammenfassungen von Designmustern Annäherung Das Approximationsmuster ist nützlich, wenn häufig teure Berechnungen durchgeführt werden und die Präzision dieser Berechnungen nicht die höchste Priorität hat. Vorteile Weniger Schreibvorgänge in die Datenbank. Behalten Sie statistisch gültige Zahlen bei. Nachteile Genaue Zahlen werden nicht dargestellt. Die Umsetzung muss in der Anwendung erfolgen. Attribute Das Attributmuster ist nützlich für Probleme, bei denen es um große Dokumente mit vielen ähnlichen Feldern geht, aber es gibt eine Teilmenge von Feldern, die gemeinsame Merkmale aufweisen, und wir möchten diese Teilmenge von Feldern sortieren oder abfragen. Wenn die Felder, nach denen wir sortieren müssen, nur in einer kleinen Teilmenge von Dokumenten zu finden sind. Oder wenn beide Bedingungen in den Dokumenten erfüllt sind. Vorteile Es werden weniger Index benötigt. Abfragen lassen sich einfacher schreiben und sind im Allgemeinen schneller. Aufspaltung Das Bucket Pattern ist eine großartige Lösung für die managed von Streaming-Daten wie Time Series, Real-Time Analytics oder Internet of Things (IoT). Vorteile Reduziert die Gesamtzahl der Dokumente in einer collection. Verbessert die Indexleistung. Kann den Datenzugriff durch die Nutzung der Voraggregation vereinfachen. Berechnet Wenn es sehr leseintensive Datenzugriffsmuster gibt und diese Daten wiederholt von der Anwendung berechnet werden müssen, ist das berechnete Muster eine großartige Option zum Erkunden. Vorteile Reduzierung der CPU-Auslastung bei häufigen Berechnungen. Abfragen lassen sich einfacher schreiben und sind im Allgemeinen schneller. Nachteile Es kann schwierig sein, die Notwendigkeit dieses Musters zu erkennen. Das Anwenden oder Überbeanspruchen des Musters sollte vermieden werden, sofern dies nicht erforderlich ist. Dokumentversionierung Wenn Sie frühere Versionen von Dokumenten in MongoDB verwalten müssen, ist das Dokumentversionierungsmuster eine mögliche Lösung. Vorteile Einfache Implementierung, auch auf bestehenden Systemen. Keine Auswirkungen auf die Leistung bei Abfragen der neuesten Revision. Nachteile Verdoppelt die Anzahl der Schreibvorgänge. Abfragen müssen auf die richtige collection abzielen. Erweiterte Referenz Das Muster „Extended Reference“ ist am nützlichsten, wenn Ihre Anwendung viele JOIN-Vorgänge durchführt, um häufig aufgerufene Daten zusammenzuführen. Vorteile Verbessert die Leistung, wenn viele JOIN-Vorgänge ausgeführt werden. Schnellere Lesevorgänge und eine Reduzierung der Gesamtzahl der JOINs. Nachteile Datenvervielfältigung. Ausreißer Finden Sie, dass es einige Abfragen oder Dokumente gibt, die nicht in Ihre übrigen typischen Datenmuster passen? Treiben diese Ausnahmen Ihre Anwendungslösung voran? Wenn ja, ist das Ausreißermuster eine wunderbare Lösung für diese Situation. Vorteile Verhindert, dass einige Dokumente oder Abfragen die Lösung einer Anwendung bestimmen. Abfragen sind auf „typische“ Anwendungsfälle zugeschnitten, Ausreißer werden jedoch dennoch berücksichtigt. Nachteile Oft auf bestimmte Abfragen zugeschnitten, daher funktionieren Ad-hoc-Abfragen möglicherweise nicht gut. Ein Großteil dieses Musters wird mit Anwendungscode erstellt. Vorabzuteilung Wenn Sie die Struktur Ihres Dokuments kennen und Ihre Anwendung diese lediglich mit Daten füllen muss, ist das Pre-Allocation Pattern die richtige Wahl. Vorteile Designvereinfachung, wenn die Dokumentstruktur im Voraus bekannt ist. Nachteile Einfachheit versus Leistung. Polymorph Das polymorphe Muster ist die Lösung, wenn es eine Vielzahl von Dokumenten gibt, die mehr Ähnlichkeiten als Unterschiede aufweisen und die Dokumente in einer einzigen collection aufbewahrt werden müssen. Vorteile Einfach umzusetzen. Abfragen können für eine einzelne collection ausgeführt werden. Schemaversionierung Nahezu jede Anwendung kann vom Schema-Versionierungs muster profitieren, da im Laufe der Lebensdauer einer Anwendung häufig Änderungen am Datenschema vorgenommen werden. Dieses Muster ermöglicht, dass frühere und aktuelle Versionen von Dokumenten nebeneinander in einer collection vorhanden sind. Vorteile Keine Ausfallzeiten erforderlich. Steuerung der Schemamigration. Reduzierte zukünftige technische Schulden. Nachteile Möglicherweise sind während der Migration zwei Index für dasselbe Feld erforderlich. Teilmenge Das Subset muster löst das Problem, dass die Arbeitsfestlegung die RAM-Kapazität überschreitet, da bei großen Dokumenten ein Großteil der Daten im Dokument nicht von der Anwendung verwendet wird. Vorteile Reduzierung der Gesamtgröße der Arbeitsfeststellung. Kürzere Festplattenzugriffszeit für die am häufigsten verwendeten Daten. Nachteile Wir müssen die Teilmenge managed. Das Einlesen zusätzlicher Daten erfordert zusätzliche Fahrten in die Datenbank. Baum Wenn Daten eine hierarchische Struktur haben und häufig abgefragt werden, ist das Baum muster das zu implementierende Entwurfsmuster. Vorteile Erhöhte Leistung durch Vermeidung mehrerer JOIN-Vorgänge. Nachteile Aktualisierungen des Graph müssen in der Anwendung managed werden. Fazit Wie Sie hoffentlich in dieser Serie gesehen haben, bietet das MongoDB-Dokumentmodell viel Flexibilität bei der Modellierung von Daten. Diese Flexibilität ist unglaublich leistungsfähig, aber diese Leistung muss im Hinblick auf die Datenzugriffsmuster Ihrer Anwendung genutzt werden. Denken Sie daran, dass Schema-Design in MongoDB einen enormen Einfluss auf die Leistung Ihrer Anwendung hat. Wir haben festgestellt, dass Leistungsprobleme häufig auf ein schlechtes Schema-Design zurückzuführen sind. Bedenken Sie, dass diese Schema-Design-Muster zur weiteren Leistungssteigerung des Dokumentmodells zusammen verwendet werden können, wenn und sofern dies sinnvoll ist. Beispielsweise kann die Schemaversionierung in Verbindung mit allen anderen Mustern verwendet werden, während sich Ihre Anwendung weiterentwickelt. Mit den zwölf behandelten Schema-Design-Mustern verfügen Sie über die Werkzeuge und Kenntnisse, die Sie benötigen, um die Leistungsfähigkeit der Flexibilität des Dokumentmodells zu nutzen.

September 15, 2023

Next →

That’s a Wrap: MongoDB’s 2025 in Review & 2026 Predictions

It’s nearly the end of the year—again! That means it’s time for an end-of-year blog post that expresses disbelief at the passage of time. Which, as the saying goes, flies when you’re having fun. And definitely when you’re as busy as MongoDB was in 2025. It was a big year for the company—and more importantly, for the tens of thousands of customers and millions of developers who rely on MongoDB’s modern data platform for their most mission-critical workloads. At MongoDB, everything we do starts with our obsession with customers and their needs, and if there’s a theme to MongoDB’s 2025, it was (and will continue to be) enabling customer innovation and helping them succeed in the AI era. So here are a few highlights of how MongoDB acted on behalf of customers in 2025. From the acquisition of Voyage AI to customer success across industries, a lot happened in 2025. Let’s go!* *Read to the end for 2026 thoughts. 2025: The (MongoDB) year that was Voyage AI, modernization, and search In February, MongoDB announced the acquisition of Voyage AI, a pioneer in embedding and reranking models, to enhance the accuracy of AI applications. Integrating Voyage AI's advanced retrieval technology with MongoDB’s modern, AI-ready data platform addresses a critical challenge: LLM model hallucinations caused by a lack of context. By improving retrieval accuracy for specialized domains like finance and law, the integration enables businesses to deploy AI for mission-critical use cases. To learn more, see the MongoDB Voyage AI page. Then, in September, we launched MongoDB AMP, an AI-powered Application Modernization Platform. AMP is designed to accelerate the transformation of legacy applications through a combination of AI-powered tooling, a proven delivery framework, and expert guidance (tools, techniques, and talent) to help enterprises reduce technical debt and modernize 2-3 times faster. Want more? Sure you do! Check out this short video. MongoDB also announced the addition of search and vector search capabilities to MongoDB Community Edition and MongoDB Enterprise Server. This allows developers to build and test AI-native applications, including those using retrieval-augmented generation (RAG), in local or on-premises environments. Previously exclusive to MongoDB Atlas, these features enable secure, hybrid deployments where sensitive data can remain on-premises while still leveraging advanced search tools. Here’s a (slightly less short) video about search and vector search on Enterprise Server. Growing and scaling with MongoDB As noted, everything we do at MongoDB starts with our obsession with customers. 2025 was another banner year for customer success and innovation—we were inspired by what organizations of every shape and size, across industries and geographies, built with MongoDB in 2025. Here are just two of the many stories our customers shared in 2025; much more can be found in my colleague Katie Palmer’s blog series, Innovating with MongoDB. Factory By combining the Atlas modern data platform with Voyage AI’s high-performance embeddings, the AI-native startup Factory—which uses AI agents called Droids to accelerate software development lifecycles for organizations—consolidated its fragmented tech stack. This enabled superior code retrieval, simplified operations, and provided the scalability needed to process billions of tokens daily. McKesson McKesson, a global pharmaceutical distributor, replaced its monolithic legacy infrastructure with MongoDB Atlas to meet strict drug tracing mandates. By adopting our modern cloud data platform, McKesson scaled its operations 300x, managing tracking data for 1.2 billion containers annually without latency, and ensuring compliance and patient safety while reducing developer complexity. For more, check out the video of McKesson at MongoDB.local NYC from September. From niche NoSQL to enterprise powerhouse As senior MongoDB engineer and Technical Fellow Ashish Kumar put it earlier this year, “through a sustained and deliberate engineering effort,” MongoDB has gone from a (seemingly) niche NoSQL solution to a trusted enterprise standard, and now delivers “the high availability, tunable consistency, ACID transactions, and robust security that enterprises demand.” A new era of leadership The face of MongoDB has also changed—our CFO, Mike Berry, joined the company in April, and Dev Ittycheria stepped down as CEO in November, after more than 11 years leading the company (including its 2017 IPO). In a LinkedIn post about his role, new MongoDB CEO CJ Desai noted that the company is “at the forefront of a new data revolution, unlocking the next wave of productivity and intelligence.” “Having spent my career building and scaling technology platforms, I’ve always been drawn to companies defined by clarity of vision, relentless organic innovation, and a customer-first culture. MongoDB exemplifies all three,” said Desai. We couldn’t agree more. Onward! Reading the 2026 tea leaves So what might 2026 bring (for MongoDB and tech at large)? Here are a handful of our leaders’ predictions: “As much as people want to talk about Artificial General Intelligence (AGI), we’re still in the phase where most AI use cases automate redundant tasks but benefit from human-in-the-loop checks. Organizations that use AI to complete work that historically is a drain on human resources—but then uses people to carefully verify what AI builds, apply governance frameworks, and maintain accountability across the data lifecycle—will be more successful.” —Pete Johnson, Field CTO, AI, MongoDB “After years of inflated expectations and unsustainable spending, the AI industry is trapped in a bubble where companies reflexively attempt to deploy LLMs at every problem, driving up costs with minimal to no return. Businesses that break free from this spending cycle are the ones that understand the need to ground LLM responses in factual data and learn from prior mistakes. We believe the best way to do this will be with highly accurate embedding models and rerankers for reliable data retrieval.” —Frank Liu, Staff Product Manager, MongoDB "In 2026, cloud independence will evolve from strategic preference to existential imperative across enterprises of every scale. The outages and disruptions of recent years have exposed a fundamental truth: in an always-on digital economy—where commerce, mobility, governance, and even public safety depend on uninterrupted access to cloud services—single-provider reliance is no longer a calculated risk, but a systemic vulnerability. Compounding this is the inexorable rise of data sovereignty. Regulatory regimes worldwide now demand precise jurisdictional control over data residency, rendering rigid cloud commitments incompatible with compliance at global scale. The defining competitive advantage will belong to organizations that transcend fragile prevention theater and engineer true infrastructural resilience: architectures inherently portable, data frictionlessly mobile, and operations autonomously sustained across heterogeneous clouds through AI-orchestrated redundancy. In short, the winners will not merely mitigate downtime—they will design systems that render the concept obsolete." —Ben Cefalo, SVP, Head of Core Products, MongoDB Happy holidays and happy New Year, everyone!

December 22, 2025