Questo articolo è un articolo speculare di traduzione automatica, clicca qui per saltare all'articolo originale.

Vista: 12075|Risposta: 0

[Fonte] Principi di progettazione del database (ristampa) Quattordici consigli

[Copiato link]
Pubblicato su 09/04/2015 21:00:54 | | |

1. Il rapporto tra il documento originale e l'entità

Può essere una relazione uno a uno, uno a molti e molti-a molti. In generale, sono relazioni uno a uno: cioè una coppia di documenti originali
dovrebbe e corrisponde solo a un'entità. In casi particolari, possono essere relazioni uno a molti o molti-a-uno, cioè un documento originale corrisponde a molteplici realtà
o più documenti originali corrispondenti a un'entità. L'entità qui può essere intesa come una tabella di base. Dopo aver chiarito questa corrispondenza, disegna per noi
L'interfaccia di ingresso è molto vantaggiosa.
〖Esempio 1〗: Le informazioni sul curriculum di un dipendente corrispondono a tre tabelle di base nel sistema informativo delle risorse umane: tabella di informazioni di base del dipendente e società
Tabella delle relazioni, modulo per il curriculum di lavoro. Questo è un esempio tipico di "un documento originale corrisponde a più entità".
2. Chiavi primarie ed estere
In generale, un'entità non può avere né una chiave primaria né una chiave esterna. Nel diagramma E-R, le entità nella parte foglia possono definire la chiave primaria,
È anche possibile non definire una chiave primaria (perché non ha figli), ma deve avere una chiave esterna (perché ha un padre).
La progettazione delle chiavi primarie ed estere occupa una posizione importante nella progettazione dei database globali. Quando la progettazione del database globale è completata, si ottiene un
Gli esperti americani di design di database dissero: "Chiavi, chiavi ovunque, nient'altro che chiavi", questa è la sua esperienza nella progettazione di database
Riflette anche le sue idee altamente astratte sul nucleo dei sistemi informativi (modelli di dati). Perché: la chiave primaria è un'entità altamente astratta, e la chiave primaria è associata a
Una coppia di chiavi esterne che rappresenta una connessione tra entità.
3. La natura della tabella di base
La tabella base è diversa dalla tabella intermedia e dalla tabella temporanea perché presenta le seguenti quattro caratteristiche:
(1) Atomicità. I campi nella tabella base non sono più decomponibili.
(2) Primitività. I record nella tabella base sono i record dei dati originali (i dati sottostanti).
(3) Deduttivo. Tutti i dati di output possono essere derivati dai dati nella tabella base e nella tabella dei codici.
(4) Stabilità. La struttura della tabella di base è relativamente stabile e i record nella tabella dovrebbero essere conservati a lungo.
Dopo aver compreso la natura delle tabelle di base, durante la progettazione di database, si possono distinguere dalle tabelle intermedie e dalle tabelle temporanee.
4. Standard di paradigma
La relazione tra la tabella di base e i suoi campi dovrebbe soddisfare il più possibile il terzo paradigma. Tuttavia, i design di database che soddisfano il terzo paradigma spesso non lo sono
Il miglior design. Per migliorare l'efficienza operativa dei database, spesso è necessario ridurre lo standard di paradigma: aumentare adeguatamente la ridondanza per ottenere spazio temporale
Lo scopo di.
Esempio 2: Esiste una tabella base per la conservazione delle merci, come mostrato nella Tabella 1. La presenza del campo "Importo" indica che la tabella non è progettata per essere soddisfatta
Il terzo paradigma è sufficiente, perché la "importe" può essere ottenuta moltiplicando il "prezzo unitario" per la "quantità", indicando che "importo" è un campo ridondante. Tuttavia, aumento
Il campo ridondante della "quantità" può migliorare la velocità delle statistiche di interrogazione, che è la pratica di scambiare spazio per tempo.
In Rose 2002, esistono due tipi di colonne prescritte: colonne dati e colonne calcolate. Una colonna come "importo" è chiamata "colonna di calcolo", e
Colonne come "Prezzo unitario" e "Quantità" sono chiamate "colonne dati".
Tabella 1 Struttura della tabella delle merci
Nome prodotto Modello Unità Prezzo Quantità
TV 29 pollici 2.500 40 100.000

5. Comprendere i tre paradigmi in termini semplici
Comprendere i tre paradigmi in termini semplici è di grande beneficio per la progettazione di database. Nella progettazione di database, per applicare meglio i tre paradigmi, basta
Tre paradigmi devono essere compresi in termini semplici:
Il primo paradigma: 1NF è un vincolo atomico sugli attributi, che richiede che gli attributi siano atomici e non può più essere decomposto;
Il secondo paradigma: 2NF è il vincolo di unicità sui record, che richiede che i record abbiano un'identificazione unica, cioè l'unicità dell'entità;
Paradigma 3: 3NF è un vincolo sulla ridondanza dei campi, cioè nessun campo può essere derivato da altri campi, richiede che il campo non sia ridondante

Nessun design di database ridondante può farlo. Tuttavia, un database senza ridondanza non è necessariamente il miglior database, a volte per migliorare la fortuna
Per raggiungere l'efficienza, è necessario ridurre lo standard paradigmico e conservare adeguatamente i dati ridondanti. L'approccio specifico è attenersi al terzo paradigma nella progettazione di modelli di dati concettuali
, il lavoro di riduzione dello standard paradigmico è considerato nella progettazione del modello dati fisico. Abbassare il paradigma significa aggiungere campi che permettono la ridondanza.
6. Essere bravi nell'identificare e gestire correttamente le relazioni molti-a-molti
Se esiste una relazione molti-a-molti tra due entità, la relazione dovrebbe essere eliminata. Il modo per eliminarlo è aggiungere un terzo reale tra i due
Corpo. In questo modo, quella che prima era una relazione molti-a-molti ora è diventata due relazioni uno a molti. Gli attributi delle due entità originali dovrebbero essere ragionevolmente distribuiti
Vai alle tre entità. La terza entità qui è essenzialmente una relazione più complessa, che corrisponde a una tabella di base. In generale, i numeri
Lo strumento di progettazione della libreria non riconosce relazioni molti-a-molti, ma può gestire relazioni molti-a-molti.
Esempio 3: Nel "Sistema Informativo della Biblioteca", "libro" è un'entità, e "lettore" è anche un'entità. Queste due entità sono le stesse
La relazione tra i libri è tipica di molti-a-molti: un libro può essere preso in prestito da più lettori in momenti diversi, e un lettore può prenderne in prestito altri
Questo libro. A tal fine, dovrebbe essere aggiunta una terza entità tra le due, chiamata "libri di prestito e restituzione", e le sue proprietà sono: tempo di prestito e prestito
Ha anche un logo (0 significa prendere in prestito un libro, 1 significa restituire un libro), inoltre dovrebbe avere due chiavi esterne (la chiave primaria di "libro" e la chiave primaria di "lettore"), in modo che
Si collega a "libri" e "lettori".
7. Il metodo dei valori della chiave primaria PK
PK è uno strumento di connessione inter-tabelle per programmatori, che può essere una sequenza di numeri senza significato fisico, che viene automaticamente aggiunta dal programma a 1. Sì
è un nome di campo fisicamente significativo o una combinazione di nomi di campi. Ma la prima è meglio della seconda. Quando PK è una combinazione di nomi di campi, suggerisci un numero di campo
Non contare troppo, perché l'indice non solo occupa molto spazio, ma rallenta anche.
8. Ottenere la giusta ridondanza dei dati
La ripetizione di chiavi primarie ed estrane in più tabelle non è un concetto di ridondanza dei dati, e molte persone non ne sono consapevoli
。 La ripetizione di campi non chiave è ridondanza dei dati! Ed è una ridondanza di basso livello, cioè una ridondanza ripetitiva. La ridondanza avanzata non è basata sul campo
Ripetutamente, ma derivati di campi.
Esempio 4: I tre campi "prezzo unitario, quantità e importo" nel prodotto, "importo" deriva dal "prezzo unitario" moltiplicato per "quantità"
È ridondanza, ed è una sorta di ridondanza avanzata. Lo scopo della ridondanza è aumentare la velocità di elaborazione. Solo la ridondanza a basso livello aumenterà il numero
incoerenza dei dati, perché gli stessi dati possono essere inseriti più volte da tempi, luoghi e ruoli diversi. Perciò, sosteniamo la ridondanza avanzata (torta
ridondanza per natura), e si oppone alla ridondanza di basso livello (ridondanza ripetitiva).
9. Non esiste una risposta standard per i diagrammi E--R
Non esiste una risposta standard al diagramma E-R di un sistema informativo, perché il suo design e il suo metodo di disegno non sono unici, purché copra il business richiesto dal sistema
L'ambito e il contenuto funzionale sono fattibili. Invece, è necessario modificare il diagramma E-R. Anche se non ha una risposta standard unica, ciò non significa che possa essere arbitraria
Design. I criteri per un buon diagramma E-R sono: struttura chiara, associazione concisa, numero moderato di entità, attribuzione ragionevole degli attributi e nessuna ridondanza a basso livello.
10. Le tecniche di visualizzazione sono utili nella progettazione di database
A differenza delle tabelle di base, delle tabelle di codice e delle tabelle intermedie, le viste sono tabelle virtuali che dipendono dalle tabelle reali della fonte dati per esistere. Le visualizzazioni sono per i programmatori
Una finestra che utilizza il database è una forma di sintesi dei dati della tabella base, un metodo di elaborazione dei dati e una sorta di riservatezza dei dati utente
significa. Per eseguire elaborazioni complesse, aumentare la velocità di calcolo e risparmiare spazio di archiviazione, la profondità di definizione della visuale generalmente non dovrebbe superare tre livelli. Tipo tre piani
Se la vista non è ancora sufficiente, dovresti definire una tabella temporanea sulla vista e poi definire una vista sulla tabella temporanea. In questo modo, la profondità della vista viene definita ripetutamente
Nessuna restrizione.
Per alcuni sistemi informativi legati a interessi politici, economici, tecnologici, militari e di sicurezza nazionali, il ruolo delle opinioni è ancora più importante. Questi
Dopo che il design fisico della tabella base del sistema è stato completato, il primo livello di viste viene immediatamente stabilito sulla tabella base, e il numero e la struttura di questa vista a livello sono gli stessi della tabella base
Il numero e la struttura sono esattamente gli stessi. E si stipula che tutti i programmatori possono operare solo sulla visualizzazione. Solo l'amministratore del database, con
La "chiave di sicurezza" tenuta da più persone può essere azionata direttamente sul tavolo base. I lettori sono invitati a riflettere: perché succede questo?
11. Tabelle intermedie, istruzioni e tabelle temporanee
Una tabella intermedia è una tabella che memorizza statistiche, è progettata per data warehousing, report di output o risultati di query, e talvolta non ha una chiave primaria con
chiavi estere (eccetto i data warehouse). Le tabelle temporanee sono progettate dai programmatori per memorizzare record temporanei per uso personale. Le tabelle base e intermedie sono mantenute dal DBA
Le tabelle temporanee sono gestite automaticamente dallo stesso programmatore.
12. I vincoli di integrità si manifestano in tre aspetti
Integrità del dominio: Usa Check per implementare i vincoli, e nello strumento di progettazione del database c'è una Ch quando si definisce l'intervallo di valori del campo
Tasto ECK, attraverso il quale viene definito il valore città del campo.
Integrità referenziale: implementata con trigger PK, FK e a livello di tabella.
Integrità definita dall'utente: sono alcune regole di business implementate con stored procedure e trigger.
13. Il metodo per prevenire le patch nel design del database è il principio dei "tre in meno"
(1) Meno tabelle c'è in un database, meglio è. Solo se il numero di tabelle viene ridotto si può dire che il diagramma E-R del sistema è piccolo e fine, e viene rimosso
Le entità duplicate e ridondanti costituiscono un alto grado di astrazione del mondo obiettivo, e l'integrazione sistematica dei dati viene effettuata per prevenire il design patch;
(2) Meno campi in una tabella combinano le chiavi primarie, meglio è. A causa del ruolo della chiave primaria, una è costruire l'indice della chiave primaria, e l'altra serve come sotto-tabella
chiavi esternee, quindi il numero di campi nella combinazione delle chiavi primarie viene ridotto, il che non solo fa risparmiare tempo di esecuzione, ma anche spazio di archiviazione nell'indice;
(3) Meno campi in una tabella, meglio è. Solo un piccolo numero di campi indica che non c'è duplicazione dei dati nel sistema
C'è poca ridondanza dei dati e, cosa più importante, si invita i lettori a imparare a "cambiare righe", il che impedisce che i campi vengano risucchiati nella tabella principale della sottotabella
, lasciando molti campi liberi nella tabella principale. La cosiddetta "riga di cambio colonna" serve a estrarre parte del contenuto della tabella principale e costruirne una separata
Sottotavolo. Questo metodo è molto semplice, alcune persone semplicemente non ci si abituano, non lo adottano e non lo implementano.
Il principio pratico della progettazione di database è trovare il giusto equilibrio tra ridondanza dei dati e velocità di elaborazione. Il "tre in meno" è una panoramica olistica
Il pensiero, le visioni comprensive, non possono isolare un certo principio. Il principio è relativo, non assoluto. Il principio dei "tre ancora" è sicuramente sbagliato. Prova
Pensa: se si tratta la stessa funzione del sistema, il diagramma E-R di 100 entità (1.000 attributi in totale) è sicuramente migliore del diagramma E-R di 200 entità (2.000 attributi in totale)
Il diagramma E-R è molto migliore.
Sostenere il principio dei "tre in meno" significa permettere ai lettori di imparare a utilizzare la tecnologia di progettazione di database per un'integrazione sistematica dei dati. I passaggi per l'integrazione dei dati sono da proporre:
Il file system è integrato in un database applicativo, il database applicativo è integrato in un database tematico e il database tematico è integrato in un database globale e completo.
Più alto è il grado di integrazione, più forte è la condivisione dei dati e meno isole informative sono presenti
Il numero di chiavi primarie e il numero di attributi saranno più piccoli.
Lo scopo di promuovere il principio dei "tre in meno" è impedire ai lettori di utilizzare la tecnologia di patching per aggiungere, cancellare e modificare costantemente il database, al fine di creare dati aziendali
La libreria è diventata una "cucchia" di tabelle di database progettate arbitrariamente, o un "caos" di tabelle di database, e infine causa le tabelle e le generazioni di base nel database
Le tabelle dei codici, le tabelle intermedie e le tabelle temporanee sono ingombranti e innumerevoli, con conseguente impossibilità di mantenere e paralizzare i sistemi informativi di imprese e istituzioni.
Il principio dei "tre ancora" può essere applicato da chiunque, che è la fallacia del "metodo di patching" per progettare database. Il principio di "tre in meno"
È un principio del meno ma va bene, che richiede alte capacità di progettazione di database e arte, cosa che non tutti possono fare, perché questo principio viene eliminato
La base teorica per la progettazione del database utilizzando il "metodo delle patching".
14. Modi per migliorare l'efficienza operativa del database
Nelle condizioni specifiche di hardware e software di sistema, i metodi per migliorare l'efficienza operativa del sistema di database sono:
(1) Nel design fisico del database, ridurre il paradigma, aumentare la ridondanza, usare meno trigger e utilizzare più stored procedure.
(2) Quando il calcolo è molto complesso e il numero di record è molto grande (ad esempio 10 milioni), il calcolo complesso deve prima essere esterno al database
Dopo che il metodo del file system è stato calcolato ed elaborato in linguaggio C++, viene infine aggiunto alla tabella. Questa è l'esperienza della progettazione di sistemi di fatturazione delle telecomunicazioni.
(3) Se una tabella risulta avere troppi record, ad esempio più di 10 milioni, la tabella deve essere divisa orizzontalmente. La pratica della segmentazione orizzontale è:
Dividere orizzontalmente il record della tabella in due tabelle basate su un certo valore della chiave primaria PK della tabella. Se una tabella risulta avere troppi campi, ad esempio superando
Ottanta, il tavolo è diviso verticalmente e il tavolo originale è diviso in due tabelle.
(4) Ottimizzazione del sistema di gestione del database DBMS, cioè ottimizzazione di vari parametri di sistema, come il numero di buffer.
(5) Quando si utilizza un linguaggio SQL orientato ai dati per la programmazione, si cerca di adottare algoritmi di ottimizzazione.
In breve, per migliorare l'efficienza operativa del database, è necessario ottimizzare il sistema del database, la progettazione del database e l'implementazione del programma
, questi tre livelli lavorano duramente allo stesso tempo.
Le quattordici competenze sopra elencate vengono gradualmente riassunte da molte persone in un gran numero di pratiche di analisi e progettazione di database. Per queste esperienze
I lettori non dovrebbero essere rigidi o meccanici, ma dovrebbero assimilare e comprendere, cercare la verità dai fatti e padroneggiare con flessibilità. E fallo gradualmente: invia la domanda
Esposizione, applicazione in sviluppo.




Precedente:Ti insegno facilmente come creare tutorial a tre sistemi su XP+Linux+Win7
Prossimo:Il video indecente di Bi Fujian "Ingannare la Montagna della Tigre" e rimprovera il presidente Mao
Disconoscimento:
Tutto il software, i materiali di programmazione o gli articoli pubblicati dalla Code Farmer Network sono destinati esclusivamente all'apprendimento e alla ricerca; I contenuti sopra elencati non devono essere utilizzati per scopi commerciali o illegali, altrimenti gli utenti dovranno sostenere tutte le conseguenze. Le informazioni su questo sito provengono da Internet, e le controversie sul copyright non hanno nulla a che fare con questo sito. Devi eliminare completamente i contenuti sopra elencati dal tuo computer entro 24 ore dal download. Se ti piace il programma, ti preghiamo di supportare software autentico, acquistare la registrazione e ottenere servizi autentici migliori. In caso di violazione, vi preghiamo di contattarci via email.

Mail To:help@itsvse.com