1. La relation entre le document original et l’entité
Cela peut être des relations un contre un, un à plusieurs, et plusieurs à plusieurs. En général, ce sont des relations unius à un : c’est-à-dire une paire de documents originaux ne doivent correspondre qu’à une seule entité. Dans des cas particuliers, elles peuvent être des relations un à plusieurs ou plusieurs à un, c’est-à-dire qu’un document original correspond à plusieurs réalités ou plusieurs documents originaux correspondant à une entité. L’entité ici peut être comprise comme une table de base. Après avoir clarifié cette correspondance, conçois pour nous L’interface d’entrée est très utile. 〖Exemple 1〗 : Les informations sur un CV d’employé correspondent à trois tableaux de base du système d’information des ressources humaines : tableau d’information de base de l’employé et société Table de relations, formulaire de CV professionnel. C’est un exemple typique de « un document original correspond à plusieurs entités ». 2. Clés primaires et étrangères En général, une entité ne peut avoir ni clé primaire ni clé étrangère. Dans le diagramme E-R, les entités de la partie feuille peuvent définir la clé primaire, Il est aussi possible de ne pas définir une clé primaire (car elle n’a pas d’enfants), mais elle doit avoir une clé étrangère (car elle a un père). La conception des clés primaires et étrangères occupe une place importante dans la conception des bases de données mondiales. Lorsque la conception de la base de données globale est terminée, il y a un Des experts américains en conception de bases de données ont déclaré : « Clés, clés partout, rien que des clés », voici son expérience en conception de bases de données Cela reflète également ses idées très abstraites sur le cœur des systèmes d’information (modèles de données). Parce que : la clé primaire est une entité très abstraite, et la clé primaire est associée à Une paire de clés étrangères qui représente une connexion entre entités. 3. La nature du tableau de base La table de base diffère de la table intermédiaire et de la table temporaire car elle présente les quatre caractéristiques suivantes : (1) Atomicité. Les champs de la table de base ne sont plus décomposables. (2) La primitivité. Les enregistrements dans la table de base sont des enregistrements des données originales (les données sous-jacentes). (3) Déductive. Toutes les données de sortie peuvent être dérivées des données de la table de base et de la table de code. (4) Stabilité. La structure de la table de base est relativement stable, et les enregistrements de la table doivent être conservés longtemps. Après avoir compris la nature des tables de base, lors de la conception de bases de données, on peut distinguer les tables de base des tables intermédiaires et temporaires. 4. Normes de paradigme La relation entre la table de base et ses champs doit répondre autant que possible au troisième paradigme. Cependant, les conceptions de bases de données qui répondent au troisième paradigme ne le sont souvent pas Le meilleur design. Pour améliorer l’efficacité opérationnelle des bases de données, il est souvent nécessaire de réduire la norme paradigme : augmenter de manière appropriée la redondance afin d’obtenir de la place pour le temps Le but de. Exemple 2 : Il existe un tableau de base pour le stockage des marchandises, comme montré dans le Tableau 1. La présence du champ « Montant » indique que le tableau n’est pas conçu pour être satisfait Le troisième paradigme est suffisant, car « montant » peut être obtenu en multipliant « prix unitaire » par « quantité », indiquant que « montant » est un champ redondant. Cependant, augmentation Le champ redondant de « quantité » peut améliorer la vitesse des statistiques de requête, qui est la pratique d’échanger de l’espace contre le temps. Dans Rose 2002, il existe deux types de colonnes prescrites : les colonnes de données et les colonnes calculées. Une colonne comme « montant » est appelée une « colonne de calcul », et Des colonnes comme « Prix unitaire » et « Quantité » sont appelées « colonnes de données ». Tableau 1 Structure des tableaux du tableau des matières premières Nom du produit Modèle Unité Prix Quantité TV 29 pouces 2 500 40 100 000
5. Comprendre les trois paradigmes en termes simples Comprendre ces trois paradigmes en termes simples est d’un grand bénéfice pour la conception de bases de données. En conception de bases de données, afin de mieux appliquer les trois paradigmes, il suffit Trois paradigmes doivent être compris en termes simples : Le premier paradigme : 1NF est une contrainte atomique sur les attributs, qui exige que les attributs soient atomiques et ne puisse plus être décomposée ; Le second paradigme : 2NF est la contrainte d’unicité sur les enregistrements, exigeant que les enregistrements aient une identification unique, c’est-à-dire l’unicité de l’entité ; Paradigme 3 : 3NF est une contrainte sur la redondance des champs, c’est-à-dire qu’aucun champ ne peut être dérivé d’autres corps, il exige que le champ ne soit pas redondant
。 Aucune conception de base de données redondante ne peut le faire. Cependant, une base de données sans redondance n’est pas nécessairement la meilleure base de données, parfois pour améliorer la chance Pour atteindre l’efficacité, il est nécessaire de réduire la norme de paradigme et de conserver de manière appropriée les données redondantes. L’approche spécifique consiste à respecter le troisième paradigme lors de la conception de modèles conceptuels de données , le travail de réduction de la norme de paradigme est pris en compte dans la conception du modèle de données physique. Abaisser le paradigme revient à ajouter des champs permettant la redondance. 6. Être bon pour identifier et gérer correctement les relations de plusieurs à plusieurs S’il existe une relation de plusieurs-à-plusieurs entre deux entités, cette relation doit être éliminée. La façon de l’éliminer est d’ajouter un troisième réal entre les deux corps. Ainsi, ce qui était autrefois une relation de plusieurs à plusieurs est maintenant devenue deux relations de un-à-plusieurs. Les attributs des deux entités originales devraient être raisonnablement répartis Va voir les trois entités. La troisième entité ici est essentiellement une relation plus complexe, qui correspond à une table de base. De manière générale, les chiffres L’outil de conception de bibliothèque ne peut pas reconnaître les relations de plusieurs à plusieurs, mais il peut gérer les relations de plusieurs à plusieurs. Exemple 3 : Dans le « Système d’Information de la Bibliothèque », « livre » est une entité, et « lecteur » est aussi une entité. Ces deux entités sont identiques La relation entre les livres est typique de plusieurs à plusieurs : un livre peut être emprunté par plusieurs lecteurs à des moments différents, et un lecteur peut en emprunter davantage Ce livre. À cette fin, une troisième entité devrait être ajoutée entre les deux, appelée « emprunt et remboursement des livres », et ses propriétés sont : le temps d’emprunt et l’emprunt Il possède également un logo (0 signifie emprunter un livre, 1 signifie rendre un livre), de plus, il doit aussi comporter deux clés étrangères (la clé primaire de « livre » et la clé primaire de « lecteur »), de sorte que Il est lié aux « livres » et aux « lecteurs ». 7. La méthode de la valeur de la clé primaire PK PK est un outil de connexion inter-tables pour les programmeurs, qui peut être une chaîne de nombres sans signification physique, ajoutée automatiquement par le programme à 1. Oui est un nom de champ physiquement significatif ou une combinaison de noms de champs. Mais la première option est meilleure que la seconde. Lorsque PK est une combinaison de noms de champs, suggérez un numéro de champ Ne comptez pas trop, car l’indice occupe non seulement beaucoup d’espace, mais ralentit aussi. 8. Assurer la redondance des données correctement La répétition des clés primaires et étrangères dans plusieurs tables n’est pas un concept de redondance des données, et beaucoup de gens n’en ont pas connaissance 。 La répétition de champs non clés est une redondance de données ! Et c’est une redondance de bas niveau, c’est-à-dire une redondance répétitive. La redondance avancée n’est pas basée sur le champ À plusieurs reprises, mais des dérivés de champs. Exemple 4 : Les trois champs « prix unitaire, quantité et montant » dans le produit, « montant » est dérivé du « prix unitaire » multiplié par « quantité » C’est de la redondance, et c’est une sorte de redondance avancée. Le but de la redondance est d’augmenter la vitesse de traitement. Seule une redondance de faible niveau augmentera le nombre incohérence des données, car les mêmes données peuvent être saisies plusieurs fois à différents moments, lieux et rôles. Par conséquent, nous plaidons pour une redondance avancée (pie redondance par nature), et s’oppose à la redondance de bas niveau (redondance répétitive). 9. Il n’existe pas de réponse standard pour les diagrammes E--R Il n’existe pas de réponse standard au diagramme E-R d’un système d’information, car sa conception et sa méthode de dessin ne sont pas uniques, tant qu’elle couvre les activités requises par le système La portée et le contenu fonctionnel sont réalisables. Il est donc nécessaire de modifier le diagramme E-R. Bien qu’il n’y ait pas de réponse standard unique, cela ne signifie pas qu’il peut être arbitraire Conception. Les critères pour un bon diagramme E-R sont : une structure claire, une association concise, un nombre modéré d’entités, une allocation raisonnable des attributs, et aucune redondance de faible niveau. 10. Les techniques de vue sont utiles dans la conception de bases de données Contrairement aux tables de base, aux tables de code et aux tables intermédiaires, les vues sont des tables virtuelles qui dépendent des tables réelles de la source de données pour exister. Les vues sont pour les programmeurs Une fenêtre utilisant la base de données est une forme de synthèse des données de table de base, une méthode de traitement des données, et une forme de confidentialité des données utilisateur signifie. Pour effectuer des traitements complexes, augmenter la vitesse de calcul et économiser de l’espace de stockage, la profondeur de définition de la vue ne devrait généralement pas dépasser trois couches. Environ trois étages Si la vue ne suffit toujours pas, vous devriez définir une table temporaire sur la vue puis définir une vue sur la table temporaire. De cette façon, la profondeur de la vue est définie à plusieurs reprises Aucune restriction. Pour certains systèmes d’information liés aux intérêts politiques, économiques, technologiques, militaires et sécuritaires nationaux, le rôle des opinions est encore plus important. Ceux-ci Après la conception physique de la table de base du système, la première couche de vues est immédiatement établie sur la table de base, et le nombre ainsi que la structure de cette vue de couche sont les mêmes que pour la table de base Le nombre et la structure sont exactement les mêmes. Et il est stipulé que tous les programmeurs ne sont autorisés à opérer que sur la vue. Seul l’administrateur de la base de données, avec La « clé de sécurité » tenue par plusieurs personnes peut être utilisée directement sur la table de base. Les lecteurs sont invités à réfléchir : pourquoi cela ? 11. Tableaux intermédiaires, instructions et tables temporaires Une table intermédiaire est une table qui stocke des statistiques, elle est conçue pour l’entreposage de données, les rapports de sortie ou les résultats de requêtes, et parfois elle ne possède pas de clé primaire avec Clés étrangères (sauf les entrepôts de données). Les tables temporaires sont conçues par les programmeurs pour stocker des enregistrements temporaires à des fins personnelles. Les tableaux de base et intermédiaires sont tenus par le DBA Les tables temporaires sont automatiquement maintenues par le programmeur lui-même. 12. Les contraintes d’intégrité se manifestent sous trois aspects Intégrité du domaine : Utilisez Check pour implémenter des contraintes, et dans l’outil de conception de base de données, il y a un Ch lors de la définition de la plage de valeurs du champ Eck, par lequel la ville de valeur du champ est définie. Intégrité référentielle : implémentée avec PK, FK et déclencheurs au niveau de la table. Intégrité définie par l’utilisateur : Ce sont certaines règles métier implémentées avec des procédures stockées et des déclencheurs. 13. La méthode pour prévenir le patching de conception de base de données est le principe des « trois moins » (1) Moins il y a de tables dans une base de données, mieux c’est. Ce n’est que si le nombre de tables est réduit qu’on peut dire que le diagramme E-R du système est petit et fin, et il est supprimé Les entités dupliquées et redondantes constituent un haut degré d’abstraction du monde objectif, et une intégration systématique des données est réalisée pour éviter le patching de conception ; (2) Moins il y a de champs dans un tableau combinant des clés primaires, mieux c’est. En raison du rôle de la clé primaire, l’une est de construire l’index de clé primaire, et l’autre de servir de sous-table des clés étrangères, donc le nombre de champs dans la combinaison des clés primaires est réduit, ce qui non seulement fait gagner du temps d’exécution, mais aussi de l’espace de stockage pour l’index ; (3) Moins il y a de champs dans un tableau, mieux c’est. Un petit nombre de champs indique qu’il n’y a pas de duplication de données dans le système Il y a peu de redondance des données et, plus important encore, les lecteurs sont encouragés à apprendre à « changer de ligne », ce qui empêche que les champs ne soient aspirés dans la table principale de la sous-table , laissant de nombreux champs libres dans la table principale. La fameuse « ligne de changement de colonne » consiste à extraire une partie du contenu du tableau principal et à en construire une distincte Sous-table. Cette méthode est très simple, certaines personnes ne s’y habituent tout simplement pas, ne l’adoptent pas et ne l’appliquent pas. Le principe pratique de la conception de bases de données est de trouver le bon équilibre entre la redondance des données et la vitesse de traitement. Le « trois de moins » est un aperçu global La pensée, les vues globales, ne peuvent isoler un certain principe. Le principe est relatif, pas absolu. Le principe des « trois de plus » est définitivement erroné. Essaie Pensez : si la même fonction du système est couverte, le diagramme E-R de 100 entités (1 000 attributs au total) est définitivement meilleur que le diagramme E-R de 200 entités (2 000 attributs au total) Le diagramme E-R est bien meilleur. Prôner le principe de « trois de moins » permet aux lecteurs d’apprendre à utiliser la technologie de conception de bases de données pour une intégration systématique des données. Les étapes de l’intégration des données sont à suivre : Le système de fichiers est intégré à une base de données applicative, la base de données applicative est intégrée à une base de données thématique, et la base de données thématique est intégrée à une base de données globale et complète. Plus le degré d’intégration est élevé, plus le partage des données est fort, et moins il y a d’îlots d’information présents Le nombre de clés primaires et le nombre d’attributs seront plus petits. Le but de défendre le principe de « trois de moins » est d’empêcher les lecteurs d’utiliser la technologie de correctifs pour ajouter, supprimer et modifier constamment la base de données, afin de créer des données d’entreprise La bibliothèque est devenue un « tas à ordures » de tables de bases de données conçues arbitrairement, ou un « désordre » de tables de bases de données, et finit par provoquer les tables et générations de base dans la base de données Les tables de codes, les tables intermédiaires et les tables temporaires sont encombrées et innombrables, ce qui empêche et paralyse les systèmes d’information des entreprises et des institutions. Le principe des « trois de plus » peut être appliqué par n’importe qui, qui est le sophisme de la « méthode de patching » pour concevoir des bases de données. Le principe de « trois de moins » C’est un principe de moins mais d’accord, qui exige de grandes compétences en conception de bases de données et en art, ce que tout le monde ne peut pas faire, car ce principe est éliminé La base théorique de la conception de la base de données utilisant la « méthode de patching ». 14. Moyens d’améliorer l’efficacité des opérations de base de données Dans les conditions matérielles et logicielles du système données, les méthodes pour améliorer l’efficacité opérationnelle du système de base de données sont : (1) Dans la conception physique de la base de données, réduire le paradigme, augmenter la redondance, utiliser moins de déclencheurs et employer davantage de procédures stockées. (2) Lorsque le calcul est très complexe et que le nombre d’enregistrements est très important (par exemple 10 millions), le calcul complexe doit d’abord être en dehors de la base de données Après que la méthode du système de fichiers a été calculée et traitée en langage C++, elle est finalement ajoutée à la table. C’est l’expérience de la conception de systèmes de facturation télécom. (3) Si une table est jugée avoir trop d’enregistrements, comme plus de 10 millions, elle doit être divisée horizontalement. La pratique de la segmentation horizontale est la suivante : Divisez horizontalement l’enregistrement de la table en deux tables en fonction d’une certaine valeur de la clé primaire PK de la table. Si une table est jugée avoir trop de champs, comme dépassant Quatre-vingts, la table est divisée verticalement, et la table d’origine est divisée en deux tableaux. (4) Optimisation système du SGBD du système de gestion de la base de données, c’est-à-dire l’optimisation de divers paramètres du système, tels que le nombre de tampons. (5) Lors de l’utilisation d’un langage SQL orienté données pour la programmation, essayez d’adopter des algorithmes d’optimisation. En résumé, pour améliorer l’efficacité opérationnelle de la base de données, il est nécessaire d’optimiser le système de base de données, la conception de la base de données et la mise en œuvre du programme , ces trois niveaux travaillent dur en même temps. Les quatorze compétences ci-dessus sont progressivement résumées par de nombreuses personnes dans un grand nombre de pratiques d’analyse et de conception de bases de données. Pour ces expériences Les lecteurs ne doivent pas être rigides ou mécaniques, mais digérer et comprendre, chercher la vérité dans les faits, et maîtriser avec flexibilité. Et fais-le progressivement : envoie la candidature exposition, application en développement.
|