Datenbankdesignprinzipien (Nachdruck) Vierzehn Tipps

Test · Veröffentlicht am 09.04.2015 21:00:54

1. Die Beziehung zwischen dem Originaldokument und der Gesellschaft

Es können Eins-zu-Eins-, Eins-zu-Viele- und Viele-zu-Viele-Beziehungen sein. Im Allgemeinen handelt es sich um Eins-zu-eins-Beziehungen: d. h. ein Paar von Originaldokumenten
sollte und nur einer Entität entsprechen. In besonderen Fällen können sie Eins-zu-Viele- oder Viele-zu-Eins-Beziehungen sein, d. h. ein Originaldokument entspricht mehreren Realitäten
Body oder mehrere Originaldokumente, die einer Entität entsprechen. Die Entität hier kann als Basistabelle verstanden werden. Nachdem Sie diese Korrespondenz geklärt haben, entwerfen Sie für uns
Die Einstiegsoberfläche ist sehr hilfreich.
〖Beispiel 1〗: Die Informationen zum Lebenslauf eines Mitarbeiters entsprechen drei grundlegenden Tabellen im Personalinformationssystem: Mitarbeiter-Basisinformationstabelle und Gesellschaft
Beziehungstabelle, Formular für den Arbeitslebenslauf. Dies ist ein typisches Beispiel für "ein Originaldokument entspricht mehreren Einheiten".
2. Primär- und Fremdschlüssel
Im Allgemeinen kann eine Entität weder einen primären noch einen Fremdschlüssel besitzen. Im E-R-Diagramm können die Entitäten im Blattteil den Primärschlüssel definieren,
Es ist auch möglich, keinen Primärschlüssel zu definieren (weil er keine Kinder hat), aber er muss einen Fremdschlüssel haben (weil er einen Vater hat).
Das Design von Primär- und Fremdschlüsseln nimmt eine wichtige Rolle bei der Gestaltung globaler Datenbanken ein. Wenn das Design der globalen Datenbank abgeschlossen ist, gibt es eine
Amerikanische Datenbankdesign-Experten sagten: "Schlüssel, Schlüssel überall, nichts als Schlüssel", das ist seine Erfahrung im Datenbankdesign
Es spiegelt auch seine hochabstrakten Ideen über den Kern von Informationssystemen (Datenmodellen) wider. Weil: der Primärschlüssel eine hochabstrakte Entität ist, und der Primärschlüssel ist mit
Ein Paar Fremdschlüssel, das eine Verbindung zwischen Entitäten darstellt.
3. Die Natur der Basistabelle
Die Grundtabelle unterscheidet sich von der Zwischentabelle und der temporären Tabelle, da sie die folgenden vier Eigenschaften aufweist:
(1) Atomität. Die Felder in der Basistabelle sind nicht mehr zerlegbar.
(2) Primitivität. Die Datensätze in der Basistabelle sind Datensätze der ursprünglichen Daten (der zugrunde liegenden Daten).
(3) Deduktiv. Alle Ausgabedaten können aus den Daten in der Basistabelle und der Codetabelle abgeleitet werden.
(4) Stabilität. Die Struktur der Basistabelle ist relativ stabil, und die Datensätze in der Tabelle sollten lange aufbewahrt werden.
Nachdem man die Natur von Grundtabellen verstanden hat, lassen sich beim Entwurf von Datenbanken Basistabellen von Zwischen- und temporären Tabellen unterscheiden.
4. Paradigmenstandards
Die Beziehung zwischen der Grundtabelle und ihren Feldern sollte dem dritten Paradigma so weit wie möglich entsprechen. Datenbankdesigns, die dem dritten Paradigma entsprechen, jedoch oft nicht
Das beste Design. Um die operative Effizienz von Datenbanken zu verbessern, ist es oft notwendig, den Paradigmenstandard zu senken: Redundanz angemessen zu erhöhen, um Zeitraum zu schaffen
Der Zweck von.
Beispiel 2: Es gibt eine grundlegende Tabelle für die Lagerung von Gütern, wie in Tabelle 1 gezeigt. Das Vorhandensein des Feldes "Amount" weist darauf hin, dass die Tabelle nicht darauf ausgelegt ist, erfüllt zu sein
Das dritte Paradigma ist ausreichend, da "Betrag" durch Multiplikation des "Einheitspreises" mit "Menge" erhalten werden kann, was darauf hinweist, dass "Menge" ein redundantes Feld ist. Erhöhen Sie jedoch
Das redundante Feld "Menge" kann die Geschwindigkeit von Abfragestatistiken verbessern, was die Praxis ist, Raum gegen Zeit zu tauschen.
In Rose 2002 gibt es zwei Arten von vorgeschriebenen Spalten: Datenspalten und berechnete Spalten. Eine Spalte wie "Betrag" wird als "Berechnungsspalte" bezeichnet, und
Spalten wie "Einheitspreis" und "Menge" werden als "Datenspalten" bezeichnet.
Tabelle 1 Tabellenstruktur der Warentabelle
Produktname, Produktmodell, Einheitspreis, Menge, Betrag
Fernseher 29 Zoll 2.500 40 100.000

5. Die drei Paradigmen in Laiensprachen verstehen
Das Verständnis der drei Paradigmen in Laiensprachen ist für das Datenbankdesign von großem Vorteil. Im Datenbankdesign gilt, um die drei Paradigmen besser anzuwenden, einfach
Drei Paradigmen müssen in einfachen Begriffen verstanden werden:
Das erste Paradigma: 1NF ist eine atomare Einschränkung auf Attribute, die erfordert, dass Attribute atomar sind und nicht mehr zerlegt werden können;
Das zweite Paradigma: 2NF ist die Einzigartigkeitsbedingung für Datensätze, die von Datensätzen eine eindeutige Identifikation verlangt, also die Eindeutigkeit der Entität;
Paradigma 3: 3NF ist eine Einschränkung der Feldredundanz, das heißt, kein Feld kann aus anderen Körpern abgeleitet werden, es erfordert, dass das Feld nicht redundant ist
。
Kein redundantes Datenbankdesign kann das. Eine Datenbank ohne Redundanz ist jedoch nicht unbedingt die beste Datenbank, manchmal um das Glück zu verbessern
Um Effizienz zu erreichen, ist es notwendig, den Paradigmenstandard zu reduzieren und redundante Daten angemessen zu behalten. Der spezifische Ansatz besteht darin, beim Entwerfen konzeptioneller Datenmodelle das dritte Paradigma einzuhalten
Die Arbeit zur Reduzierung des Paradigmenstandards wird bei der Gestaltung des physikalischen Datenmodells berücksichtigt. Das Paradigma zu senken bedeutet, Felder hinzuzufügen, die Redundanz ermöglichen.
6. Sei gut darin, viele-zu-viele Beziehungen zu identifizieren und korrekt zu handhaben
Wenn es eine viele-zu-viele-Beziehung zwischen zwei Einheiten gibt, sollte diese Beziehung beseitigt werden. Die Möglichkeit, es zu eliminieren, ist, ein drittes Real zwischen den beiden hinzuzufügen
Körper. So ist das, was früher eine viele-zu-viele-Beziehung war, nun zu zwei Eins-zu-viele-Beziehungen geworden. Die Eigenschaften der ursprünglichen beiden Einheiten sollten angemessen verteilt sein
Geh zu den drei Entitäten. Die dritte Entität hier ist im Wesentlichen eine komplexere Beziehung, die einer Basistabelle entspricht. Allgemein gesprochen sind Zahlen
Das Bibliotheksdesign-Tool erkennt zwar nicht viele-zu-viele Beziehungen, aber es kann viele-zu-viele Beziehungen verarbeiten.
Beispiel 3: Im "Library Information System" ist "book" eine Entität, und "reader" ist ebenfalls eine Entität. Diese beiden Entitäten sind dasselbe
Die Beziehung zwischen Büchern ist typisch viele-zu-viele: Ein Buch kann von mehreren Lesern zu verschiedenen Zeiten ausgeliehen werden, und ein Leser kann mehr ausleihen
Dieses Buch. Zu diesem Zweck sollte eine dritte Einheit zwischen den beiden hinzugefügt werden, die "Ausleihen und Rückgabe von Büchern" genannt wird, und ihre Eigenschaften sind: Zeit ausleihen und ausleihen
Es hat außerdem ein Logo (0 bedeutet das Ausleihen eines Buches, 1 das Rückgeben eines Buches), zusätzlich sollte es zwei Fremdschlüssel haben (den Hauptschlüssel "Buch" und den Primärschlüssel "Leser"), sodass
Es verbindet sich mit "Büchern" und "Lesern".
7. Die Wertmethode des Primärschlüssels PK
PK ist ein Verbindungswerkzeug für Programmierer zwischen Tabellen, das eine Zahlenfolge ohne physikalische Bedeutung sein kann und automatisch vom Programm zu 1 hinzugefügt wird. Ja
ist ein physikalisch bedeutungsvoller Feldname oder eine Kombination von Feldnamen. Aber Ersteres ist besser als Letzteres. Wenn PK eine Kombination von Körpernamen ist, wird eine Körperzahl vorgeschlagen
Zähle nicht zu viel, denn der Index nimmt nicht nur viel Platz ein, sondern verlangsamt sich auch.
8. Erreichen Sie die Datenredundanz richtig
Die Wiederholung von Primär- und Fremdschlüsseln in mehreren Tabellen ist kein Konzept der Datenredundanz, und viele Menschen sind sich dessen nicht bewusst
。 Die Wiederholung von Nicht-Schlüsselfeldern ist Datenredundanz! Und es handelt sich um eine niedrigstufige Redundanz, also eine wiederholende Redundanz. Fortgeschrittene Redundanz ist nicht feldbasiert
Wiederholt, aber Ableitungen von Feldern.
Beispiel 4: Die drei Felder "Einheitspreis, Menge und Menge" im Produkt "Betrag" werden aus dem "Einheitspreis" multipliziert mit "Menge" abgeleitet
Es ist Redundanz und eine Art fortgeschrittene Redundanz. Der Zweck der Redundanz ist es, die Verarbeitungsgeschwindigkeit zu erhöhen. Nur niedrigstufige Redundanz erhöht die Zahl
Inkonsistenz der Daten, da dieselben Daten mehrfach aus verschiedenen Zeiten, Orten und Rollen eingegeben werden können. Deshalb setzen wir uns für fortgeschrittene Redundanz (Pie) ein
von Natur aus Redundanz), und lehnt niedrigstufige Redundanz (wiederholende Redundanz) ab.
9. Es gibt keine Standardantwort für E-R-Diagramme
Es gibt keine einheitliche Antwort auf das E-R-Diagramm eines Informationssystems, da seine Entwurfs- und Zeichenmethode nicht eindeutig sind, solange sie das vom System geforderte Geschäft abdeckt
Der Umfang und der funktionale Inhalt sind machbar. Stattdessen ist es notwendig, das E-R-Diagramm zu modifizieren. Auch wenn es keine einheitliche Standardantwort gibt, bedeutet das nicht, dass sie willkürlich sein kann
Design. Die Kriterien für ein gutes E-R-Diagramm sind: klare Struktur, prägnante Assoziation, moderate Anzahl von Entitäten, angemessene Attributzuweisung und keine niedrigstufige Redundanz.
10. Ansichtstechniken sind im Datenbankdesign nützlich
Im Gegensatz zu Basistabellen, Codetabellen und Zwischentabellen sind Ansichten virtuelle Tabellen, die von den realen Tabellen der Datenquelle abhängen. Views sind für Programmierer gedacht
Ein Fenster, das die Datenbank verwendet, ist eine Form der Basistabellen-Datensynthese, eine Methode der Datenverarbeitung und eine Art Vertraulichkeit der Benutzerdaten
bedeutet. Um komplexe Verarbeitung durchzuführen, die Rechengeschwindigkeit zu erhöhen und Speicherplatz zu sparen, sollte die Definitionstiefe der Ansicht in der Regel drei Schichten nicht überschreiten. So drei Stockwerke
Wenn die Ansicht immer noch nicht ausreicht, solltest du eine temporäre Tabelle auf der Ansicht definieren und dann eine Ansicht auf der temporären Tabelle. Auf diese Weise wird die Tiefe der Ansicht wiederholt definiert
Keine Einschränkungen.
Für bestimmte Informationssysteme im Zusammenhang mit nationalen politischen, wirtschaftlichen, technologischen, militärischen und sicherheitspolitischen Interessen ist die Rolle der Ansichten noch wichtiger. Diese
Nachdem das physische Design der Basistabelle des Systems abgeschlossen ist, wird die erste Ansichtsschicht sofort auf der Basistabelle etabliert, und die Anzahl und Struktur dieser Ebenenansicht sind identisch mit der Basistabelle
Die Anzahl und Struktur sind genau gleich. Und es ist festgelegt, dass alle Programmierer nur mit der Ansicht arbeiten dürfen. Nur der Datenbankadministrator, mit
Der "Sicherheitsschlüssel", der von mehreren Mitarbeitern gehalten wird, kann direkt auf dem Grundtisch bedient werden. Die Leser werden eingeladen, zu überlegen: Warum ist das so?
11. Zwischentabellen, Anweisungen und temporäre Tabellen
Eine Zwischentabelle ist eine Tabelle, die Statistiken speichert, sie ist für Data Warehousing, Ausgabeberichte oder Abfrageergebnisse konzipiert und hat manchmal keinen Primärschlüssel mit
Fremdschlüssel (außer Data Warehouses). Temporäre Tabellen werden von Programmierern entwickelt, um temporäre Datensätze für den persönlichen Gebrauch zu speichern. Die Basis- und Zwischentabellen werden vom DBA gepflegt
Temporäre Tabellen werden automatisch vom Programmierer selbst gepflegt.
12. Integritätsbeschränkungen manifestieren sich in drei Aspekten
Domänenintegrität: Verwenden Sie Check, um Constraints zu implementieren, und im Datenbankdesign-Tool gibt es ein Ch, wenn man den Wertbereich des Feldes definiert
Eck-Button, durch die die Wertstadt des Feldes definiert wird.
Referenzielle Integrität: Implementiert mit PK-, FK- und Tabellen-Triggern.
Benutzerdefinierte Integrität: Es handelt sich um einige Geschäftsregeln, die mit gespeicherten Prozeduren und Triggern implementiert werden.
13. Die Methode zur Verhinderung von Datenbankdesign-Patches ist das Prinzip der "drei weniger"
(1) Je weniger Tabellen in einer Datenbank, desto besser. Nur wenn die Anzahl der Tabellen reduziert wird, kann gesagt werden, dass das E-R-Diagramm des Systems klein und fin ist, und es wird entfernt
Die doppelten und redundanten Entitäten bilden einen hohen Maß an Abstraktion der Zielwelt, und systematische Datenintegration wird durchgeführt, um das Patching-Design zu verhindern;
(2) Je weniger Felder in einer Tabelle, die Primärschlüssel kombinieren, desto besser. Aufgrund der Rolle des Primärschlüssels besteht der eine darin, den Primärschlüsselindex zu erstellen, und der andere dient als Untertabelle
Fremdschlüssel, sodass die Anzahl der Felder in der Kombination der Primärschlüssel reduziert wird, was nicht nur Laufzeit spart, sondern auch Speicherplatz für den Index spart;
(3) Je weniger Felder in einer Tabelle, desto besser. Nur eine kleine Anzahl von Feldern zeigt an, dass es keine Datenduplikation im System gibt
Es gibt kaum Datenredundanz, und noch wichtiger: Leser werden ermutigt, zu lernen, "Zeilen zu ändern", was verhindert, dass Felder in die Haupttabelle der Untertabelle gezogen werden
, sodass viele freie Felder in der Haupttabelle übrig bleiben. Die sogenannte "Spaltenwechselzeile" dient dazu, einen Teil des Inhalts der Haupttabelle herauszuziehen und eine separate zu erstellen
Untertabelle. Diese Methode ist sehr einfach, manche Menschen gewöhnen sich einfach nicht daran, übernehmen sie nicht und setzen sie nicht um.
Das praktische Prinzip des Datenbankdesigns besteht darin, das richtige Gleichgewicht zwischen Datenredundanz und Verarbeitungsgeschwindigkeit zu finden. Das "drei weniger" ist ein ganzheitlicher Überblick
Gedanken, umfassende Ansichten, können ein bestimmtes Prinzip nicht isolieren. Das Prinzip ist relativ, nicht absolut. Das Prinzip "drei mehr" ist definitiv falsch. Versuch es mal
Denken Sie daran: Wenn die gleiche Funktion des Systems abgedeckt wird, ist das E-R-Diagramm mit 100 Entitäten (insgesamt 1.000 Attribute) definitiv besser als das E-R-Diagramm mit 200 Entitäten (insgesamt 2.000 Attribute)
Das E-R-Diagramm ist viel besser.
Das Prinzip "drei weniger" zu vertreten, bedeutet, den Lesern zu ermöglichen, Datenbankdesign-Technologie für systematische Datenintegration zu nutzen. Die Schritte zur Datenintegration sind:
Das Dateisystem ist in eine Anwendungsdatenbank integriert, die Anwendungsdatenbank in eine Themendatenbank und die Themendatenbank in eine globale umfassende Datenbank.
Je höher der Integrationsgrad, desto stärker der Datenaustausch, und desto weniger Informationsinseln sind vorhanden
Die Anzahl der Primärschlüssel und die Anzahl der Attribute sind geringer.
Der Zweck des Prinzips "drei weniger" ist es, Leser daran zu hindern, Patching-Technologie zu nutzen, um die Datenbank ständig hinzuzufügen, zu löschen und zu verändern, um Unternehmensdaten zu erstellen
Die Bibliothek ist zu einem "Müllhaufen" aus willkürlich gestalteten Datenbanktabellen oder zu einem "Durcheinander" von Datenbanktabellen geworden und verursacht schließlich die grundlegenden Tabellen und Generationen in der Datenbank
Die Code-, Zwischen- und temporäre Tabellen sind überladen und zahllos, was dazu führt, dass Informationssysteme von Unternehmen und Institutionen nicht mehr gewartet und gelähmt werden können.
Das Prinzip "drei mehr" kann von jedem angewendet werden, was der Fehlschluss der "Patching-Methode" zur Gestaltung von Datenbanken ist. Das Prinzip von "drei weniger"
Es handelt sich um ein Prinzip von weniger aber gut, das hohe Datenbankdesign-Fähigkeiten und Kunst erfordert, was nicht jeder kann, da dieses Prinzip abgeschafft wird
Die theoretische Grundlage für die Gestaltung der Datenbank mit der "Patching-Methode".
14. Wege zur Verbesserung der Effizienz des Datenbankbetriebs
Unter den gegebenen Systemhardware- und Systemsoftwarebedingungen sind die Methoden zur Verbesserung der Betriebseffizienz des Datenbanksystems:
(1) Im physischen Design der Datenbank das Paradigma reduzieren, Redundanz erhöhen, weniger Trigger verwenden und mehr gespeicherte Verfahren verwenden.
(2) Wenn die Berechnung sehr komplex ist und die Anzahl der Datensätze sehr groß ist (z. B. 10 Millionen), muss die komplexe Berechnung zunächst außerhalb der Datenbank erfolgen
Nachdem die Dateisystemmethode in der Sprache C++ berechnet und verarbeitet wurde, wird sie schließlich der Tabelle hinzugefügt. Dies ist die Erfahrung im Design von Telekommunikationsabrechnungssystemen.
(3) Wenn eine Tabelle zu viele Datensätze enthält, zum Beispiel mehr als 10 Millionen, sollte die Tabelle horizontal aufgeteilt werden. Die Praxis der horizontalen Segmentierung ist:
Teile den Datensatz der Tabelle horizontal in zwei Tabellen auf, basierend auf einem bestimmten Wert des primären Schlüssel-PK der Tabelle. Wenn eine Tabelle zu viele Felder enthält, zum Beispiel überschreitend
Achtzig wird der Tisch vertikal geteilt, und der ursprüngliche Tisch wird in zwei Tische geteilt.
(4) Systemoptimierung des Datenbankmanagementsystems DBMS, also Optimierung verschiedener Systemparameter, wie z. B. der Anzahl der Puffer.
(5) Bei der Verwendung datenorientierter SQL-Sprache zur Programmierung sollten Sie versuchen, Optimierungsalgorithmen zu verwenden.
Kurz gesagt, um die Betriebseffizienz der Datenbank zu verbessern, ist es notwendig, das Datenbanksystem, das Datenbankdesign und die Programmimplementierung zu optimieren
Diese drei Ebenen arbeiten gleichzeitig hart.
Die oben genannten vierzehn Fähigkeiten werden von vielen Personen schrittweise in einer Vielzahl von Datenbankanalyse- und Designpraktiken zusammengefasst. Für diese Erfahrungen
Leser sollten nicht starr oder routinemäßig sein, sondern sie verdauen und verstehen, Wahrheit aus Fakten suchen und flexibel meistern. Und nach und nach: Senden Sie die Bewerbung ein
Ausstellung, Anwendung in der Entwicklung.

[Quelle] Datenbankdesignprinzipien (Nachdruck) Vierzehn Tipps

Verwandte Beiträge

Betrachtete Abschnitte