Ta članek je zrcalni članek strojnega prevajanja, kliknite tukaj za skok na izvirni članek.

Pogled: 12075|Odgovoriti: 0

[Vir] Načela oblikovanja podatkovnih baz (ponatis) Štirinajst nasvetov

[Kopiraj povezavo]
Objavljeno na 9. 04. 2015 21:00:54 | | |

1. Razmerje med izvirnim dokumentom in entiteto

Lahko gre za odnose ena na ena, ena na mnoge in za mnoge. Na splošno gre za odnose ena na ena: torej par izvirnih dokumentov
bi morala in pripadati le eni entiteti. V posebnih primerih so lahko razmerja ena-na-več ali več-na-ena, tj. en izvirni dokument ustreza več realnostim
ali več izvirnih dokumentov, ki ustrezajo entiteti. Entiteto tukaj lahko razumemo kot osnovno tabelo. Po razjasnitvi te korespondence, načrtujte za nas
Uporabniški vmesnik za vstop je zelo koristen.
〖Primer 1〗: Informacije o življenjepisu zaposlenega ustrezajo trem osnovnim tabelam v informacijskem sistemu za kadrovske zadeve: tabela osnovnih informacij zaposlenih in družba
Tabela za odnose, obrazec za življenjepis za delo. To je tipičen primer "en izvirni dokument ustreza več entitetam".
2. Primarni in tuji ključi
Na splošno entiteta ne more imeti niti primarnega niti tujega ključa. V E-R diagramu lahko entitete v listnem delu definirajo primarni ključ,
Možno je tudi, da primarnega ključa ne definiramo (ker nima potomcev), vendar mora imeti tuji ključ (ker ima očeta).
Oblikovanje primarnih in tujih ključev zavzema pomembno mesto pri oblikovanju globalnih podatkovnih baz. Ko je načrtovanje globalne baze podatkov zaključeno, obstaja
Ameriški strokovnjaki za oblikovanje podatkovnih baz so dejali: "Ključi, ključi povsod, nič drugega kot ključi", to je njegova izkušnja z oblikovanjem baz podatkov
Odraža tudi njegove zelo abstraktne ideje o jedru informacijskih sistemov (podatkovnih modelov). Ker: primarni ključ je zelo abstraktna entiteta, primarni ključ pa je povezan z
Par tujih ključev, ki predstavlja povezavo med entitetami.
3. Narava osnovne tabele
Osnovna tabela se razlikuje od vmesne in začasne tabele, ker ima naslednje štiri značilnosti:
(1) Atomičnost. Polja v osnovni tabeli niso več razgradljiva.
(2) Primitivnost. Zapisi v osnovni tabeli so zapisi izvirnih podatkov (osnovnih podatkov).
(3) Deduktivno. Vse izhodne podatke je mogoče pridobiti iz podatkov v osnovni tabeli in kodni tabeli.
(4) Stabilnost. Struktura osnovne tabele je razmeroma stabilna, zapisi v tabeli pa morajo biti shranjeni dolgo časa.
Po razumevanju narave osnovnih tabel je pri načrtovanju baz podatkov mogoče osnovne tabele ločiti od vmesnih in začasnih tabel.
4. Standardi paradigme
Razmerje med osnovno tabelo in njenimi polji bi moralo čim bolj ustrezati tretjemu paradigmi. Vendar pa zasnove podatkovnih baz, ki ustrezajo tretjemu paradigmi, pogosto niso
Najboljši dizajn. Za izboljšanje operativne učinkovitosti podatkovnih baz je pogosto potrebno zmanjšati standard paradigme: ustrezno povečati redundanco, da se doseže prostor za čas
Namen.
Primer 2: Obstaja osnovna tabela za shranjevanje blaga, kot je prikazano v tabeli 1. Prisotnost polja "Amount" pomeni, da tabela ni zasnovana za izpolnjevanje
Tretja paradigma je zadostna, saj lahko "količino" dobimo tako, da "enotno ceno" pomnožimo z "količino", kar pomeni, da je "količina" odvečno polje. Vendar pa povečanje
Redundantno polje »količina« lahko izboljša hitrost statistike poizvedb, kar je praksa zamenjave prostora za čas.
V Rose 2002 obstajata dve vrsti predpisanih stolpcev: podatkovni stolpci in izračunani stolpci. Stolpec, kot je »znesek«, se imenuje »stolpec za izračun«, in
Stolpci, kot sta "Enotna cena" in "Količina", se imenujemo "podatkovni stolpci".
Tabela 1 Struktura tabele blaga
Ime izdelka Model izdelka Enotna cena Količina Količina
TV 29 palcev 2.500 40 100.000

5. Razumeti tri paradigme na preprost način
Razumevanje treh paradigm v preprostih izrazih je zelo koristno za oblikovanje podatkovnih baz. Pri oblikovanju podatkovnih baz, da bi bolje uporabili tri paradigme, preprosto
Tri paradigme je treba razumeti na preprost način:
Prva paradigma: 1NF je atomska omejitev na atribute, ki zahteva, da so atributi atomski in jih ni več mogoče razstaviti;
Druga paradigma: 2NF je omejitev edinstvenosti zapisov, ki zahteva, da imajo zapisi edinstveno identifikacijo, torej edinstvenost entitete;
Paradigma 3: 3NF je omejitev redundantnosti polja, to pomeni, da nobeno polje ni mogoče izpeljati iz drugih polj, zahteva, da polje ni redundantno

Noben redundantni dizajn baze podatkov tega ne more storiti. Vendar pa podatkovna baza brez redundance ni nujno najboljša, včasih za izboljšanje sreče
Za dosego učinkovitosti je potrebno zmanjšati standard paradigme in ustrezno ohraniti redundantne podatke. Specifičen pristop je držati se tretjega paradigme pri oblikovanju konceptualnih podatkovnih modelov
, delo na zmanjšanju standarda paradigme se upošteva pri načrtovanju fizičnega podatkovnega modela. Znižanje paradigme pomeni dodajanje polj, ki omogočajo redundanco.
6. Bodite dobri pri prepoznavanju in pravilnem ravnanju z odnosi med mnogimi
Če obstaja razmerje mnogo-na-več med dvema entitetama, je treba to razmerje odpraviti. Način za odpravo je, da med njima dodamo tretjega reala
telo. Na ta način je nekoč razmerje med mnogimi in mnogimi zdaj postalo dve razmerji ena proti mnogim. Lastnosti izvirnih dveh entitet bi morale biti razumno razporejene
Pojdi k trem entitetam. Tretja entiteta tukaj je v bistvu bolj kompleksen odnos, ki ustreza osnovni tabeli. Na splošno so številke
Orodje za oblikovanje knjižnice ne prepozna odnosov med mnogimi, lahko pa obvladuje odnose med mnogimi.
Primer 3: V "Knjižničnem informacijskem sistemu" je "knjiga" entiteta, "bralec" pa je prav tako entiteta. Ti dve entiteti sta enaki
Odnos med knjigami je tipičen odnos več proti mnogom: knjigo si lahko izposodi več bralcev ob različnih časih, en bralec pa si lahko izposodi več
Ta knjiga. V ta namen je treba med njima dodati tretjo entiteto, imenovano »izposoja in vračanje knjig«, katere lastnosti so: izposoja časa in izposoja
Ima tudi logotip (0 pomeni izposojo knjige, 1 pomeni vrnitev knjige), poleg tega pa mora imeti tudi dva tuja ključa (primarni ključ za "knjigo" in primarni za "reader"), tako da
Povezuje se z "knjigami" in "bralci".
7. Metoda vrednosti primarnega ključa PK
PK je orodje za povezovanje med tabelami za programerje, ki je lahko niz številk brez fizičnega pomena, ki ga program samodejno doda k 1. Da
je fizično pomenljivo ime polja ali kombinacija imen polj. A prvo je boljše od drugega. Ko je PK kombinacija imen polj, predlagamo številko polja
Ne štejte preveč, saj kazalec ne le zasede veliko prostora, ampak tudi upočasni.
8. Pravilno uredite redundanco podatkov
Ponavljanje primarnih in tujih ključev v več tabelah ni koncept redundance podatkov in mnogi se tega ne zavedajo
。 Ponavljanje polj brez ključa je podatkovna redundanca! In gre za nizkonivojsko redundanco, torej ponavljajočo se redundanco. Napredna redundanca ni na terenu
Večkrat, vendar odvodi polj.
Primer 4: Tri polja "enotna cena, količina in količina" v izdelku, "količina", so izpeljana iz "enotne cene" pomnožene z "količino"
To je redundanca in nekakšna napredna redundanca. Namen redundance je povečati hitrost procesiranja. Le nizkonivojska redundanca bo povečala število
nedoslednost podatkov, saj se lahko isti podatki vnesejo večkrat iz različnih časov, krajev in vlog. Zato zagovarjamo napredno redundanco (pie
redundanca po naravi), in nasprotuje nizkonivojski redundanci (ponavljajoči se redundanci).
9. Za E--R diagrame ni standardnega odgovora
Na E--R diagram informacijskega sistema ni standardnega odgovora, saj njegov način načrtovanja in risanja nista edinstvena, dokler zajema poslovanje, ki ga sistem zahteva
Obseg in funkcionalna vsebina sta izvedljivi. Namesto tega je treba spremeniti E--R diagram. Čeprav nima enotnega standardnega odgovora, to ne pomeni, da je lahko poljuben
Oblikovanje. Kriteriji za dober E-R diagram so: jasna struktura, jedrnata povezava, zmerno število entitet, razumna razporeditev atributov in brez nizkonivojske redundance.
10. Tehnike ogleda so uporabne pri oblikovanju podatkovnih baz
Za razliko od osnovnih tabel, kodnih tabel in vmesnih tabel so pogledi virtualne tabele, ki so odvisne od dejanskih tabel podatkovnega vira, da obstajajo. Pogledi so za programerje
Okno, ki uporablja podatkovno bazo, je oblika sinteze podatkov iz osnovne tabele, metoda obdelave podatkov in oblika zaupnosti uporabniških podatkov
pomeni. Za izvedbo kompleksne obdelave, povečanje hitrosti računalništva in prihranek prostora za shranjevanje, globina definicije pogleda običajno ne sme presegati treh plasti. Kot tri nadstropja
Če pogled še vedno ni dovolj, morate na pogledu definirati začasno tabelo in nato na začasni tabeli določiti pogled. Na ta način je globina pogleda večkrat definirana
Brez omejitev.
Za določene informacijske sisteme, povezane z nacionalnimi političnimi, gospodarskimi, tehnološkimi, vojaškimi in varnostnimi interesi, je vloga mnenj še pomembnejša. Ti
Ko je fizična zasnova osnovne tabele sistema zaključena, se prva plast pogledov takoj vzpostavi na osnovni tabeli, število in struktura tega pogleda pa sta enaka kot pri osnovni tabeli
Število in struktura sta popolnoma enaki. In določeno je, da vsi programerji smejo delovati le na podlagi pogleda. Samo skrbnik baze podatkov, z
"Varnostni ključ", ki ga drži več oseb, je mogoče neposredno upravljati na osnovni mizi. Bralce vabimo, da razmislijo: zakaj je temu tako?
11. Vmesne tabele, izjave in začasne tabele
Vmesna tabela je tabela, ki shranjuje statistiko, zasnovana je za skladiščenje podatkov, izhodna poročila ali rezultate poizvedb, včasih pa nima primarnega ključa z
Tuji ključi (razen podatkovnih skladišč). Začasne tabele so oblikovali programerji za shranjevanje začasnih zapisov za osebno uporabo. Osnovne in vmesne tabele vzdržuje DBA
Začasne tabele samodejno vzdržuje sam programer.
12. Omejitve integritete se kažejo v treh vidikih
Integriteta domene: Uporabite Check za implementacijo omejitev, v orodju za načrtovanje podatkovne baze pa je pri določanju vrednostnega območja polja črka Ch
gumb eck, preko katerega je definirano vrednost mesta polja.
Referenčna integriteta: Implementirana s PK, FK in sprožilci na ravni tabele.
Uporabniško definirana integriteta: Gre za nekatera poslovna pravila, ki se implementirajo s shranjenimi postopki in sprožilci.
13. Metoda za preprečevanje zakrpanja zasnove podatkovne baze je načelo "tri manj"
(1) Manj tabel v podatkovni bazi, bolje je. Šele če se število tabel zmanjša, lahko rečemo, da je E-R diagram sistema majhen in fin, zato se odstrani
Podvojene in redundantne entitete predstavljajo visoko stopnjo abstrakcije ciljnega sveta, sistematična integracija podatkov pa se izvaja, da se prepreči zakrpanje pri načrtovanju;
(2) Manj polj v tabeli, ki združujejo primarne ključe, bolje je. Zaradi vloge primarnega ključa je eden za gradnjo indeksa primarnega ključa, drugi pa za podtabelo
tuji ključi, zato se zmanjša število polj v kombinaciji primarnih ključev, kar ne le prihrani čas izvajanja, ampak tudi prostor za shranjevanje indeksov;
(3) Manj polj v tabeli je bolje. Le majhno število polj pomeni, da v sistemu ni podvajanja podatkov
Podatkov je malo redundance, še pomembneje pa je, da bralce spodbujajo, da se naučijo "spreminjati vrstice", kar preprečuje, da bi se polja vključila v glavno tabelo v podtabeli
, kar pusti veliko prostih polj v glavni tabeli. Tako imenovana "vrstica za spremembo stolpca" pomeni, da izločijo del vsebine glavne tabele in zgradijo ločeno
Podtabela. Ta metoda je zelo preprosta, nekateri se je preprosto ne navadijo, je ne sprejmejo in je ne implementirajo.
Praktično načelo oblikovanja podatkovnih baz je najti pravo ravnovesje med redundanco podatkov in hitrostjo obdelave. "Tri manj" je celosten pregled
Misel, celoviti pogledi, ne morejo izolirati določenega načela. Načelo je relativno, ne absolutno. Načelo "še trije" je zagotovo napačno. Poskusi
Pomislite: Če pokrijete isto funkcijo sistema, je E--R diagram s 100 entitetami (skupaj 1.000 atributov) zagotovo boljši od E--R diagrama s 200 entitetami (skupaj 2.000 atributov)
E--R diagram je veliko boljši.
Zagovarjanje načela "tri manj" pomeni, da bralci naučijo uporabljati tehnologijo oblikovanja podatkovnih baz za sistematično integracijo podatkov. Koraki za integracijo podatkov so:
Datotečni sistem je integriran v aplikacijsko bazo podatkov, aplikacijska baza podatkov je integrirana v tematsko bazo, tematska baza pa v globalno celovito bazo podatkov.
Višja kot je stopnja integracije, močnejše je deljenje podatkov in manj informacijskih otokov je prisotnih
Število primarnih ključev in število atributov bo manjše.
Namen zagovarjanja načela "tri manj" je preprečiti, da bi bralci uporabljali tehnologijo popravljanja za nenehno dodajanje, brisanje in spreminjanje baze podatkov, da bi ustvarili podatke za podjetja
Knjižnica je postala "smeti" poljubno zasnovanih tabel baze podatkov ali "zmeda" tabel podatkovne baze in na koncu povzroči osnovne tabele in generacije v bazi podatkov
Kode, vmesne tabele in začasne tabele so prenatrpane in neštete, kar povzroča nezmožnost vzdrževanja in ohromitve informacijskih sistemov podjetij in institucij.
Načelo »še trije« lahko uporabi kdorkoli, kar je zmota »metode popravljanja« za načrtovanje podatkovnih baz. Načelo "tri manj"
Gre za načelo manj, a fino, ki zahteva visoke spretnosti in umetnost oblikovanja podatkovnih baz, kar ne zmore vsak, saj je to načelo odpravljeno
Teoretična osnova za oblikovanje podatkovne baze z uporabo "metode popravljanja".
14. Načini za izboljšanje učinkovitosti delovanja podatkovnih baz
Pod danimi pogoji strojne in sistemske programske opreme so metode za izboljšanje učinkovitosti delovanja podatkovnega sistema:
(1) Pri fizični zasnovi baze podatkov zmanjšati paradigmo, povečati redundanco, uporabiti manj sprožilcev in več shranjenih postopkov.
(2) Ko je izračun zelo zapleten in je število zapisov zelo veliko (na primer 10 milijonov), mora biti kompleksni izračun najprej izven baze podatkov
Ko je metoda datotečnega sistema izračunana in obdelana v jeziku C++, se ta končno doda v tabelo. To je izkušnja oblikovanja telekomunikacijskih obračunskih sistemov.
(3) Če se izkaže, da ima tabela preveč zapisov, na primer več kot 10 milijonov, je treba tabelo razdeliti vodoravno. Praksa horizontalne segmentacije je:
Zapis tabele razdelite vodoravno na dve tabeli glede na določeno vrednost primarnega ključa PK tabele. Če se izkaže, da ima tabela preveč polj, na primer presega
Osemdeset, miza je razdeljena navpično, izvirna miza pa je razdeljena na dve mizi.
(4) Sistemska optimizacija sistema upravljanja podatkovnih baz DBMS, torej optimizacija različnih sistemskih parametrov, kot je število medpomnilnikov.
(5) Pri uporabi podatkovno usmerjenega jezika SQL za programiranje poskušajte sprejeti optimizacijske algoritme.
Na kratko, za izboljšanje operativne učinkovitosti baze podatkov je potrebno optimizirati podatkovni sistem, zasnovo podatkovne baze in implementacijo programa
, te tri ravni delajo trdo hkrati.
Zgornjih štirinajst veščin postopoma povzema veliko ljudi v številnih praksah analize in oblikovanja podatkovnih baz. Za te izkušnje
Bralci ne smejo biti tog ali rutinski, temveč naj prebavljajo in razumejo, iščejo resnico iz dejstev in obvladujejo prilagodljivo. In postopoma: pošlji prijavo
razstava, uporaba v razvoju.




Prejšnji:Enostavno te nauči, kako ustvariti XP+Linux+Win7 vodič za tri sisteme
Naslednji:Bi Fujianov "Prehitevanje Tiger Mountain" komentira nespodobni video in graja predsednika Maoja
Disclaimer:
Vsa programska oprema, programski materiali ali članki, ki jih izdaja Code Farmer Network, so namenjeni zgolj učnim in raziskovalnim namenom; Zgornja vsebina ne sme biti uporabljena v komercialne ali nezakonite namene, sicer uporabniki nosijo vse posledice. Informacije na tej strani prihajajo z interneta, spori glede avtorskih pravic pa nimajo nobene zveze s to stranjo. Zgornjo vsebino morate popolnoma izbrisati z računalnika v 24 urah po prenosu. Če vam je program všeč, podprite pristno programsko opremo, kupite registracijo in pridobite boljše pristne storitve. Če pride do kakršne koli kršitve, nas prosimo kontaktirajte po elektronski pošti.

Mail To:help@itsvse.com