1. Forholdet mellem det oprindelige dokument og enheden
Det kan være én-til-én, én-til-mange og mange-til-mange relationer. Generelt er de én-til-én-relationer: dvs. et par originale dokumenter bør og kun svare til én enhed. I særlige tilfælde kan de være én-til-mange eller mange-til-en relationer, dvs. ét originalt dokument svarer til flere virkeligheder krop eller flere originale dokumenter, der svarer til en enhed. Entiteten her kan forstås som en grundlæggende tabel. Efter at have afklaret denne korrespondance, design for os Indgangsgrænsefladen er meget nyttig. 〖Eksempel 1〗: En medarbejders CV-information svarer til tre grundlæggende tabeller i personaleinformationssystemet: medarbejderens grundlæggende informationstabel og samfundet Forholdstabell, ansøgningsskema. Dette er et typisk eksempel på "ét originalt dokument svarer til flere enheder". 2. Primær- og fremmednøgler Generelt kan en enhed hverken have en primær eller en fremmednøgle. I E-R-diagrammet kan enhederne i bladdelen definere primærnøglen, Det er også muligt ikke at definere en primær nøgle (fordi den ikke har børn), men den skal have en fremmednøgle (fordi den har en far). Designet af primær- og fremmednøgler indtager en vigtig plads i designet af globale databaser. Når designet af den globale database er færdigt, er der en Amerikanske eksperter i databasedesign sagde: "Nøgler, nøgler overalt, intet andet end nøgler", dette er hans erfaring med databasedesign Det afspejler også hans stærkt abstrakte idéer om kernen i informationssystemer (datamodeller). Fordi: primærnøglen er en meget abstrakt enhed, og primærnøglen er forbundet med Et par fremmednøgler, der repræsenterer en forbindelse mellem enheder. 3. Grundlæggende tabellens natur Den grundlæggende tabel adskiller sig fra mellemtabellen og den midlertidige tabel, fordi den har følgende fire karakteristika: (1) Atomicitet. Felter i basistabellen er ikke længere dekomponable. (2) Primitivitet. Posterne i basistabellen er poster af de oprindelige data (de underliggende data). (3) Deduktiv. Alle outputdata kan udledes fra dataene i basistabellen og kodetabellen. (4) Stabilitet. Strukturen i den grundlæggende tabel er relativt stabil, og posterne i tabellen bør bevares i lang tid. Efter at have forstået grundlæggende tabellers natur, kan man ved design af databaser skelne grundlæggende tabeller fra mellemliggende tabeller og midlertidige tabeller. 4. Paradigmestandarder Forholdet mellem den grundlæggende tabel og dens felter bør opfylde det tredje paradigme så vidt muligt. Databasedesigns, der opfylder det tredje paradigme, gør det dog ofte ikke Det bedste design. For at forbedre databasers operationelle effektivitet er det ofte nødvendigt at reducere paradigmestandarden: øge redundansen passende for at opnå plads i tid Formålet med. Eksempel 2: Der er en grundlæggende tabel for opbevaring af varer, som vist i Tabel 1. Tilstedeværelsen af feltet "Beløb" indikerer, at tabellen ikke er designet til at være opfyldt Det tredje paradigme er tilstrækkeligt, fordi "beløb" kan opnås ved at multiplicere "enhedspris" med "mængde", hvilket indikerer, at "mængde" er et redundant felt. Dog øg Det redundante felt "amount" kan forbedre hastigheden af forespørgselsstatistikker, hvilket er praksissen med at bytte plads for tid. I Rose 2002 findes der to typer foreskrevne kolonner: datakolonner og beregnede kolonner. En kolonne som "beløb" kaldes en "beregningskolonne", og Kolonner som "Enhedspris" og "Mængde" kaldes "datakolonner". Tabel 1 Tabelstruktur af varetabellen Produktnavn, Produktmodel, Enhedspris, Mængde, Mængde TV 29 tommer 2.500 40 100.000
5. Forstå de tre paradigmer på almindeligt dansk At forstå de tre paradigmer på almindeligt dansk er til stor gavn for databasedesign. I databasedesign, for bedre at anvende de tre paradigmer, er det blot Tre paradigmer skal forstås på almindeligt dansk: Det første paradigme: 1NF er en atomar begrænsning på attributter, som kræver, at attributter er atomare og ikke længere kan dekomponeres; Det andet paradigme: 2NF er unikhedsbegrænsningen på poster, som kræver, at records har en unik identifikation, det vil sige entitetens unikhed; Paradigme 3: 3NF er en begrænsning på feltredundans, det vil sige, at intet felt kan udledes fra andre felter, det kræver, at feltet ikke er redundant
。 Ingen redundant databasedesign kan klare det. Dog er en database uden redundans ikke nødvendigvis den bedste database, nogle gange for at forbedre heldet For at opnå effektivitet er det nødvendigt at reducere paradigmestandarden og passende bevare redundante data. Den specifikke tilgang er at følge det tredje paradigme, når konceptuelle datamodeller designes , arbejdet med at reducere paradigmestandarden indgår i designet af den fysiske datamodel. At sænke paradigmet er at tilføje felter, der tillader redundans. 6. Vær god til at identificere og korrekt håndtere mange-til-mange-relationer Hvis der er et mange-til-mange-forhold mellem to enheder, bør forholdet elimineres. Måden at eliminere det på er at tilføje en tredjedel reel mellem de to krop. På denne måde er det, der tidligere var et mange-til-mange-forhold, nu blevet til to én-til-mange-forhold. Attributterne for de oprindelige to enheder bør fordeles rimeligt Gå til de tre enheder. Den tredje enhed her er i det væsentlige en mere kompleks relation, som svarer til en grundlæggende tabel. Generelt tal, tal Biblioteksdesignværktøjet kan ikke genkende mange-til-mange-relationer, men det kan håndtere mange-til-mange-relationer. Eksempel 3: I "Library Information System" er "book" en enhed, og "reader" er også en enhed. Disse to enheder er det samme Forholdet mellem bøger er et typisk mange-til-mange-forhold: en bog kan lånes af flere læsere på forskellige tidspunkter, og én læser kan låne flere Denne bog. Til dette formål bør der tilføjes en tredje enhed mellem de to, som kaldes "lån og tilbagelevering af bøger", og dens egenskaber er: lånetid og lån Den har også et logo (0 betyder at låne en bog, 1 betyder at returnere en bog), og derudover bør den også have to fremmednøgler (primærnøglen "bog" og primærnøglen "læser"), så Den forbinder med "bøger" og "læsere". 7. Værdimetoden for primærnøglen PK PK er et inter-table forbindelsesværktøj for programmører, som kan være en talstreng uden fysisk betydning, der automatisk tilføjes af programmet til 1. Ja er et fysisk meningsfuldt feltnavn eller en kombination af feltnavne. Men det første er bedre end det sidste. Når PK er en kombination af feltnavne, foreslås et feltnummer Tæl ikke for meget, da indekset ikke kun fylder meget, men også sænker farten. 8. Få dataredundans korrekt Gentagelsen af primær- og fremmednøgler i flere tabeller er ikke et begreb om dataredundans, og mange er ikke klar over det 。 Gentagelsen af ikke-nøglefelter er dataredundans! Og det er en lavniveau-redundans, altså gentagen redundans. Avanceret redundans er ikke feltbaseret Gentagne gange, men afledte af felter. Eksempel 4: De tre felter "enhedspris, mængde og mængde" i produktet, "mængde" udledes fra "enhedsprisen" ganget med "mængde" Det er redundans, og det er en slags avanceret redundans. Formålet med redundans er at øge behandlingshastigheden. Kun lavniveau-redundans vil øge antallet inkonsistens i data, fordi de samme data kan indtastes flere gange fra forskellige tidspunkter, steder og roller. Derfor går vi ind for avanceret redundans (pie) redundans af natur), og modsætter sig lavniveau redundans (gentagen redundans). 9. Der findes ikke noget standardsvar for E-R-diagrammer Der findes ikke noget standardsvar på E-R-diagrammet for et informationssystem, fordi dets design og tegnemetode ikke er unikke, så længe det dækker den forretning, systemet kræver Omfanget og det funktionelle indhold er realistisk. I stedet er det nødvendigt at ændre E-R-diagrammet. Selvom den ikke har et enkelt standardsvar, betyder det ikke, at den kan være vilkårlig Design. Kriterierne for et godt E-R-diagram er: klar struktur, præcis association, moderat antal enheder, rimelig attributallokering og ingen lavniveau redundans. 10. Visningsteknikker er nyttige i databasedesign I modsætning til basale tabeller, kodetabeller og mellemliggende tabeller er visninger virtuelle tabeller, der afhænger af de reelle tabeller i datakilden for at eksistere. Views er for programmører Et vindue, der bruger databasen, er en form for syntese af basistabelldata, en metode til databehandling og en form for brugerdatafortrolighed betyder. For at udføre kompleks behandling, øge beregningshastigheden og spare lagerplads, bør definitionsdybden af visningen generelt ikke overstige tre lag. Som tre etager Hvis visningen stadig ikke er nok, bør du definere en midlertidig tabel på visningen og derefter en visning på den midlertidige tabel. På denne måde defineres dybden af visningen gentagne gange Ingen begrænsninger. For visse informationssystemer relateret til nationale politiske, økonomiske, teknologiske, militære og sikkerhedsmæssige interesser er synspunkternes rolle endnu vigtigere. Disse Når det fysiske design af systemets grundlæggende tabel er færdigt, etableres det første lag af visninger straks på basistabellen, og antallet og strukturen af denne lagvisning er den samme som i basistabellen Antallet og strukturen er præcis det samme. Og det er fastsat, at alle programmører kun må arbejde på visningen. Kun databaseadministratoren, med "Sikkerhedsnøglen", som flere personer holder, kan betjenes direkte på det grundlæggende bord. Læserne opfordres til at tænke: hvorfor er det sådan? 11. Mellemliggende tabeller, udsagn og midlertidige tabeller En mellemtabel er en tabel, der gemmer statistikker, den er designet til datalager, outputrapporter eller forespørgselsresultater, og nogle gange har den ikke en primærnøgle med fremmednøgler (undtagen datalagre). Midlertidige tabeller er designet af programmører til at gemme midlertidige poster til personligt brug. Basis- og mellemtabellerne vedligeholdes af DBA Midlertidige tabeller vedligeholdes automatisk af programmøren selv. 12. Integritetsbegrænsninger manifesteres i tre aspekter Domæneintegritet: Brug Check til at implementere begrænsninger, og i databasedesignværktøjet er der en Ch, når værdiområdet for feltet defineres Eck-knappen, hvorigennem værdibyen for feltet defineres. Referentieel integritet: Implementeret med PK-, FK- og tabelniveau-triggere. Brugerdefineret integritet: Det er nogle forretningsregler, der implementeres med lagrede procedurer og triggere. 13. Metoden til at forhindre patching af databasedesign er princippet om "tre mindre" (1) Jo færre tabeller i en database, desto bedre. Kun hvis antallet af tabeller reduceres, kan det siges, at E-R-diagrammet for systemet er lille og fint, og det fjernes De duplikerede og redundante enheder udgør en høj grad af abstraktion af den objektive verden, og systematisk dataintegration udføres for at forhindre patching-design; (2) Jo færre felter i en tabel, der kombinerer primærnøgler, desto bedre. På grund af primærnøglens rolle er den ene at opbygge primærnøgleindekset, og den anden skal fungere som en deltabel fremmednøgler, så antallet af felter i kombinationen af primærnøgler reduceres, hvilket ikke kun sparer køretid, men også indekslagerplads; (3) Jo færre felter i en tabel, desto bedre. Kun et lille antal felter indikerer, at der ikke er nogen dataduplikering i systemet Der er lidt data-redundans, og vigtigere er det, at læserne opfordres til at lære at "ændre rækker", hvilket forhindrer felter i at blive trukket ind i hovedtabellen i undertabellen , hvilket efterlader mange frie felter i hovedtabellen. Den såkaldte "kolonneændringsrække" er at trække en del af indholdet i hovedtabellen ud og bygge en separat Undertabel. Denne metode er meget enkel, nogle mennesker vænner sig bare ikke til den, adopterer den ikke og implementerer den ikke. Det praktiske princip for databasedesign er at finde den rette balance mellem dataredundans og behandlingshastighed. "Tre mindre" er en helhedsorienteret oversigt Tanke, omfattende synspunkter, kan ikke isolere et bestemt princip. Princippet er relativt, ikke absolut. Princippet om "tre mere" er helt sikkert forkert. Prøv Tænk: Hvis systemets samme funktion dækkes, er E-R-diagrammet med 100 enheder (1.000 attributter i alt) bestemt bedre end E-R-diagrammet med 200 enheder (2.000 attributter i alt) E-R-diagrammet er meget bedre. At fremme princippet om "tre mindre" er at lade læserne lære at bruge databasedesignteknologi til systematisk dataintegration. Trinene for dataintegration skal gøres: Filsystemet integreres i en applikationsdatabase, applikationsdatabasen integreres i en emnedatabase, og emnedatabasen integreres i en global omfattende database. Jo højere integrationsgrad, desto stærkere er datadelingen, og desto færre informationsøer er til stede Antallet af primærnøgler og antallet af attributter vil være mindre. Formålet med at fremme princippet om "tre mindre" er at forhindre læsere i at bruge patch-teknologi til konstant at tilføje, slette og modificere databasen for at skabe virksomhedsdata Biblioteket er blevet en "skraldebunke" af vilkårligt designede databasetabeller eller et "rod" af databasetabeller, og forårsager til sidst de grundlæggende tabeller og generationer i databasen Kodetabellerne, mellemliggende tabellerne og midlertidige tabellerne er rodede og utallige, hvilket resulterer i manglende evne til at vedligeholde og lamme informationssystemerne i virksomheder og institutioner. "Tre mere"-princippet kan udføres af alle, hvilket er fejlslutningen i "patching-metoden" til design af databaser. Princippet om "tre mindre" Det er et princip om mindre men fint, som kræver høje databasedesignfærdigheder og kunst, hvilket ikke alle kan, fordi dette princip er elimineret Det teoretiske grundlag for at designe databasen ved brug af "patching-metoden". 14. Måder at forbedre effektiviteten i databasedrift på Under de givne systemhardware- og systemsoftwarebetingelser er metoderne til at forbedre databasesystemets driftseffektivitet: (1) I det fysiske design af databasen, reducer paradigmet, øg redundansen, brug færre triggere og brug flere lagrede procedurer. (2) Når beregningen er meget kompleks, og antallet af poster er meget stort (såsom 10 millioner), skal den komplekse beregning først foregå uden for databasen Efter at filsystemmetoden er beregnet og behandlet i C++-sproget, tilføjes den endelig til tabellen. Dette er erfaringen med design af telekommunikationsfaktureringssystemer. (3) Hvis en tabel viser sig at have for mange poster, såsom mere end 10 millioner, bør tabellen deles horisontalt. Praksissen med horisontal segmentering er: Del tabellens post horisontalt i to tabeller baseret på en bestemt værdi af den primære nøgle PK i tabellen. Hvis en tabel findes at have for mange felter, såsom overskridende Firs er bordet delt lodret, og det oprindelige bord er delt i to borde. (4) Systemoptimering af databasestyringssystemet DBMS, det vil sige optimering af forskellige systemparametre, såsom antallet af buffere. (5) Når du bruger dataorienteret SQL-sprog til programmering, bør du forsøge at anvende optimeringsalgoritmer. Kort sagt er det nødvendigt for at forbedre databasens driftseffektivitet at optimere databasesystemet, databasedesignet og programimplementeringen , disse tre niveauer arbejder hårdt på samme tid. De ovennævnte fjorten færdigheder opsummeres gradvist af mange mennesker i et stort antal databaseanalyse- og designpraksisser. For disse oplevelser Læserne bør ikke være stive eller rutineprægede, men bør fordøje og forstå, søge sandhed i fakta og mestre fleksibelt. Og gradvist gør det: indsend ansøgningen udstilling, anvendelse i udvikling.
|