Tento článok je zrkadlovým článkom o strojovom preklade, kliknite sem pre prechod na pôvodný článok.

Pohľad: 12075|Odpoveď: 0

[Zdroj] Princípy návrhu databázy (reedícia) Štrnásť tipov

[Kopírovať odkaz]
Zverejnené 9. 4. 2015 21:00:54 | | |

1. Vzťah medzi pôvodným dokumentom a subjektom

Môže to byť vzťah jeden na jedného, jeden ku mnohým alebo mnoho-na-mnohým. Vo všeobecnosti ide o vzťahy jeden na jedného: t. j. dvojica originálnych dokumentov
mali by a len zodpovedať jednej entite. V špeciálnych prípadoch môžu ísť o vzťahy jeden ku mnohým alebo mnoho-jedné, t. j. jeden pôvodný dokument zodpovedá viacerým realitám
alebo viacero originálnych dokumentov zodpovedajúcich subjektu. Entitu tu možno chápať ako základnú tabuľku. Po objasnení tejto korešpondencie navrhnite pre nás
Vstupné rozhranie je veľmi prospešné.
〖Príklad 1〗: Informácie o životopise zamestnanca zodpovedajú trom základným tabuľkám v informačnom systéme ľudských zdrojov: tabuľka základných informácií zamestnanca a spoločnosť
Stôl vzťahov, pracovný životopis. Toto je typický príklad "jeden originálny dokument zodpovedá viacerým subjektom".
2. Primárne a cudzie kľúče
Vo všeobecnosti entita nemôže mať ani primárny, ani cudzí kľúč. V diagrame E-R môžu entity v listovej časti definovať primárny kľúč,
Je tiež možné nedefinovať primárny kľúč (pretože nemá potomkov), ale musí mať cudzí kľúč (pretože má otca).
Návrh primárnych a cudzích kľúčov zaujíma dôležitú pozíciu v návrhu globálnych databáz. Keď je návrh globálnej databázy dokončený, existuje
Americkí odborníci na návrh databáz povedali: "Kľúče, kľúče všade, len kľúče", toto je jeho skúsenosť s návrhom databáz
Odráža tiež jeho vysoko abstraktné predstavy o jadre informačných systémov (dátové modely). Pretože: primárny kľúč je vysoko abstraktná entita a primárny kľúč je spojený s
Dvojica cudzích kľúčov, ktorá predstavuje spojenie medzi entitami.
3. Povaha základnej tabuľky
Základná tabuľka sa líši od medzitabuľky a dočasnej tabuľky tým, že má nasledujúce štyri charakteristiky:
(1) Atómovosť. Polia v základnej tabuľke už nie sú rozložiteľné.
(2) Primitívnosť. Záznamy v základnej tabuľke sú záznamy pôvodných dát (základných dát).
(3) Deduktívne. Všetky výstupné údaje je možné odvodiť z údajov v základnej tabuľke a tabuľke kódov.
(4) Stabilita. Štruktúra základnej tabuľky je relatívne stabilná a záznamy v tabuľke by sa mali uchovávať dlhodobo.
Po pochopení povahy základných tabuliek možno pri navrhovaní databáz základné tabuľky rozlíšiť od medzitabuliek a dočasných tabuliek.
4. Paradigmatické štandardy
Vzťah medzi základnou tabuľkou a jej poliami by mal čo najviac zodpovedať tretej paradigme. Avšak návrhy databáz, ktoré spĺňajú tretí paradigmat, často nie sú
Najlepší dizajn. Na zlepšenie prevádzkovej efektívnosti databáz je často potrebné znížiť štandard paradigmy: primerane zvýšiť redundanciu, aby sa dosiahol priestor pre čas
Účel.
Príklad 2: Existuje základná tabuľka pre skladovanie tovaru, ako je znázornené v tabuľke 1. Prítomnosť poľa "Amount" naznačuje, že tabuľka nie je navrhnutá na uspokojenie
Tretí paradigmat je postačujúci, pretože "množstvo" možno získať vynásobením "jednotkovej ceny" slovom "množstvo", čo naznačuje, že "množstvo" je redundantné pole. Avšak zvýšenie
Redundantné pole "množstvo" môže zlepšiť rýchlosť štatistík dotazov, čo je prax výmeny priestoru za čas.
V Rose 2002 existujú dva typy predpísaných stĺpcov: dátové stĺpce a vypočítané stĺpce. Stĺpec ako "suma" sa nazýva "výpočtový stĺpec" a
Stĺpce ako "Jednotková cena" a "Množstvo" sa nazývajú "dátové stĺpce".
Tabuľka 1 Štruktúra tabuľky komodít
Názov produktu Model produktu Jednotková cena Množstvo Množstvo
TV 29 palcov 2 500 40 100 000

5. Pochopte tri paradigmy jednoducho
Pochopenie týchto troch paradigmatov jednoduchou rečou je veľkým prínosom pre návrh databáz. Pri návrhu databáz, aby sa tieto tri paradigmy lepšie aplikovali, jednoducho
Tri paradigmy treba chápať jednoducho:
Prvý paradigmat: 1NF je atómové obmedzenie atribútov, ktoré vyžaduje, aby atribúty boli atómové a už sa nedajú rozložiť;
Druhý paradigmat: 2NF je obmedzenie jedinečnosti záznamov, ktoré vyžaduje, aby záznamy mali jedinečnú identifikáciu, teda jedinečnosť entity;
Paradigma 3: 3NF je obmedzenie redundancie poľa, teda žiadne pole nemôže byť odvodené z iných polí, vyžaduje, aby pole nebolo redundantné

Žiadny redundantný návrh databázy to nedokáže. Avšak databáza bez redundancie nemusí byť nevyhnutne najlepšia databáza, niekedy na zlepšenie šťastia
Na dosiahnutie efektívnosti je potrebné znížiť štandard paradigmy a primerane ponechať redundantné dáta. Konkrétny prístup spočíva v dodržiavaní tretieho paradigmatu pri navrhovaní konceptuálnych dátových modelov
, práca na redukcii paradigmatického štandardu sa zohľadňuje pri návrhu fyzického dátového modelu. Zníženie paradigmy znamená pridať polia, ktoré umožňujú redundanciu.
6. Buďte dobrí v identifikácii a správnom riešení vzťahov medzi mnohými
Ak existuje vzťah mnoho-na-mnohých medzi dvoma entitami, tento vzťah by sa mal odstrániť. Spôsob, ako ho odstrániť, je pridať tretie reálne číslo medzi týmito dvoma
telo. Týmto spôsobom sa z toho, čo kedysi bol vzťah mnohí ku mnohým, teraz stali dvoma vzťahmi jeden ku mnohým. Atribúty pôvodných dvoch entít by mali byť primerane rozdelené
Choď k trom subjektom. Tretia entita je v podstate zložitejší vzťah, ktorý zodpovedá základnej tabuľke. Vo všeobecnosti platí, že čísla
Nástroj na návrh knižnice nedokáže rozpoznať vzťahy mnoho-na-mnoho, ale dokáže zvládnuť vzťahy mnoho-na-mnoho.
Príklad 3: V "Knižničnom informačnom systéme" je "kniha" entita a "čitateľ" je tiež entita. Tieto dve entity sú rovnaké
Vzťah medzi knihami je typický vzťah mnoho-na-mnoho: knihu si môže požičať viacero čitateľov v rôznych časoch a jeden čitateľ si môže požičať viac
Táto kniha. Na tento účel by sa medzi nimi mala pridať tretia entita, ktorá sa nazýva "požičiavanie a vrátenie kníh" a jej vlastnosti sú: požičiavanie času a požičiavanie
Má tiež logo (0 znamená požičanie knihy, 1 znamená vrátenie knihy), okrem toho by mal mať aj dva cudzie kľúče (primárny kľúč pre "kniha" a primárny kľúč pre "čitateľ"), aby
Spája sa s "knihami" a "čitateľmi".
7. Metóda hodnôt primárneho kľúča PK
PK je nástroj na prepojenie medzi tabuľkami pre programátorov, ktorý môže byť reťazcom čísel bez fyzického významu, ktorý program automaticky pridá k jednotke 1. Áno
je fyzikálne významný názov poľa alebo kombinácia názvov polí. Ale prvé je lepšie ako druhé. Keď je PK kombináciou názvov polí, navrhnite číslo poľa
Nepočítajte príliš veľa, pretože index nielenže zaberá veľa miesta, ale aj spomaľuje.
8. Správne nastaviť redundanciu dát
Opakovanie primárnych a cudzích kľúčov vo viacerých tabuľkách nie je konceptom dátovej redundancie a mnohí si to neuvedomujú
。 Opakovanie polí bez kľúčov je dátová redundancia! A je to nízkoúrovňová redundancia, teda opakujúca sa redundancia. Pokročilá redundancia nie je založená na teréne
Opakovane, ale derivácie polí.
Príklad 4: Tri polia "jednotková cena, množstvo a množstvo" v produkte, "množstvo" sú odvodené z "jednotkovej ceny" vynásobenej "množstvom"
Je to redundancia a je to akýsi pokročilý typ redundancie. Účelom redundancie je zvýšiť rýchlosť spracovania. Len nízkoúrovňová redundancia zvýši počet
nekonzistentnosť údajov, pretože tie isté údaje môžu byť zadané viackrát z rôznych časov, miest a úloh. Preto presadzujeme pokročilú redundanciu (pie
redundancia prirodzene), a je proti nízkoúrovňovej redundancii (opakujúcej sa redundanci).
9. Neexistuje štandardná odpoveď pre E--R diagramy
Neexistuje štandardná odpoveď na E--R diagram informačného systému, pretože jeho návrh a spôsob kreslenia nie sú jedinečné, pokiaľ pokrýva potreby systému
Rozsah a funkčný obsah sú uskutočniteľné. Namiesto toho je potrebné upraviť E--R diagram. Aj keď nemá jednotnú štandardnú odpoveď, neznamená to, že môže byť ľubovoľná
Dizajn. Kritériá pre dobrý E-R diagram sú: jasná štruktúra, stručná asociácia, stredný počet entít, rozumné rozdelenie atribútov a žiadna nízkoúrovňová redundancia.
10. Techniky zobrazenia sú užitočné pri návrhu databáz
Na rozdiel od základných tabuliek, kódových tabuliek a medzitabuliek sú pohľady virtuálne tabuľky, ktoré závisia od skutočných tabuliek dátového zdroja, aby existovali. Zobrazenia sú pre programátorov
Okno využívajúce databázu je formou syntézy dát zo základných tabuliek, metódou spracovania dát a druhom dôvernosti používateľských údajov
prostriedky. Na vykonanie zložitého spracovania, zvýšenie rýchlosti výpočtov a úsporu úložného miesta by definícia hĺbky pohľadu nemala zvyčajne presiahnuť tri vrstvy. Asi tri poschodia
Ak pohľad stále nestačí, mali by ste definovať dočasnú tabuľku na pohľade a potom definovať pohľad na dočasnej tabuľke. Týmto spôsobom sa hĺbka pohľadu opakovane definuje
Žiadne obmedzenia.
Pre určité informačné systémy súvisiace s národnými politickými, ekonomickými, technologickými, vojenskými a bezpečnostnými záujmami je úloha názorov ešte dôležitejšia. Tieto
Po dokončení fyzického návrhu základnej tabuľky systému sa prvá vrstva pohľadov okamžite vytvorí na základnej tabuľke a počet a štruktúra tohto pohľadu sú rovnaké ako v základnej tabuľke
Počet a štruktúra sú úplne rovnaké. A je stanovené, že všetci programátori môžu pracovať iba s pohľadom. Iba správca databázy, s
"Bezpečnostný kľúč", ktorý drží viacero osôb, je možné ovládať priamo na základnom stole. Čitatelia sú vyzvaní, aby sa zamysleli: prečo je to tak?
11. Medzistolky, príkazy a dočasné tabuľky
Medzitabuľka je tabuľka, ktorá uchováva štatistiky, je navrhnutá na skladovanie dát, výstupné reporty alebo výsledky dotazov, a niekedy nemá primárny kľúč s
Cudzie kľúče (okrem dátových skladov). Dočasné tabuľky navrhujú programátori na ukladanie dočasných záznamov na osobné použitie. Základné a medzitabuľky spravuje DBA
Dočasné tabuľky automaticky udržiava samotný programátor.
12. Obmedzenia integrity sa prejavujú v troch aspektoch
Integrita domény: Použite Check na implementáciu obmedzení a v nástroji na návrh databázy je pri definovaní rozsahu hodnôt poľa Ch
tlačidlo eck, ktorým je definované hodnotové mesto poľa.
Referenčná integrita: Implementovaná pomocou PK, FK a spúšťačov na úrovni tabuľky.
Integrita definovaná používateľom: Ide o niektoré obchodné pravidlá, ktoré sa implementujú pomocou uložených procedúr a spúšťačov.
13. Metódou na zabránenie záplatám návrhu databázy je princíp "tri menej"
(1) Čím menej tabuliek v databáze, tým lepšie. Len ak sa zníži počet tabuliek, možno povedať, že E-R diagram systému je malý a jemný, a je odstránený
Duplicitné a redundantné entity tvoria vysokú mieru abstrakcie objektívneho sveta a systematická integrácia dát sa vykonáva, aby sa zabránilo návrhu záplat;
(2) Čím menej polí v tabuľke kombinuje primárne kľúče, tým lepšie. Vzhľadom na úlohu primárneho kľúča je jedným vytvoriť index primárneho kľúča a druhým slúžiť ako podtabuľka
cudzie kľúče, čím sa znižuje počet polí v kombinácii primárnych kľúčov, čo nielenže šetrí čas behu, ale aj miesto v indexovej pamäti;
(3) Čím menej polí v tabuľke, tým lepšie. Len malý počet polí naznačuje, že v systéme nedochádza k duplikácii dát
Dátová redundancia je minimálna a čo je dôležitejšie, čitatelia sú vyzývaní, aby sa naučili "meniť riadky", čo zabraňuje tomu, aby sa polia presúvali do hlavnej tabuľky v podtabuľke
, čím zostáva veľa voľných polí v hlavnej tabuľke. Takzvaný "riadok na zmenu stĺpca" slúži na vybratie časti obsahu hlavnej tabuľky a vytvorenie samostatnej tabuľky
Podstôl. Táto metóda je veľmi jednoduchá, niektorí ľudia si na ňu jednoducho nezvyknú, neprijmú ju a neimplementujú ju.
Praktickým princípom návrhu databáz je nájsť správnu rovnováhu medzi redundanciou dát a rýchlosťou spracovania. "O tri menej" je komplexný prehľad
Myšlienka, komplexné pohľady, nemôžu izolovať určitý princíp. Princíp je relatívny, nie absolútny. Princíp "ešte traja" je určite nesprávny. Skús
Predstavte si: Ak je pokrytá rovnaká funkcia systému, E--R diagram so 100 entitami (spolu 1 000 atribútov) je určite lepší ako E--R diagram s 200 entitami (spolu 2 000 atribútov)
Diagram E--R je oveľa lepší.
Presadzovanie princípu "o tri menej" znamená umožniť čitateľom naučiť sa používať technológiu návrhu databáz na systematickú integráciu dát. Kroky integrácie dát sú nasledovné:
Súborový systém je integrovaný do aplikačnej databázy, aplikačná databáza je integrovaná do tematickej databázy a tematická databáza je integrovaná do globálnej komplexnej databázy.
Čím vyššia je integrácia, tým silnejšie je zdieľanie dát a tým menej je prítomných informačných ostrovov
Počet primárnych kľúčov a počet atribútov bude menší.
Cieľom presadzovania princípu "o tri menej" je zabrániť čitateľom používať technológiu záplatovania na neustále pridávanie, mazanie a úpravu databázy, aby sa vytvorili podnikové dáta
Knižnica sa stala "smetím" ľubovoľne navrhnutých databázových tabuliek alebo "chaosom" databázových tabuliek a nakoniec spôsobuje základné tabuľky a generácie v databáze
Kódové tabuľky, medzitabuľky a dočasné tabuľky sú preplnené a nespočetné, čo vedie k neschopnosti udržiavať a paralyzovať informačné systémy podnikov a inštitúcií.
Princíp "tri naraz" môže uplatniť ktokoľvek, čo je omyl "metódy záplatovania" pri navrhovaní databáz. Princíp "o tri menej"
Je to princíp menej, ale v poriadku, ktorý vyžaduje vysoké zručnosti v návrhu databáz a umenie, čo nie každý dokáže, pretože tento princíp je odstránený
Teoretický základ pre návrh databázy pomocou "metódy patchovania".
14. Spôsoby, ako zlepšiť efektivitu prevádzky databázy
Za daných hardvérových a systémových softvérových podmienok sú metódy na zlepšenie efektivity prevádzky databázového systému nasledovné:
(1) Pri fyzickom návrhu databázy znížiť parametre, zvýšiť redundanciu, použiť menej spúšťačov a viac uložených procedúr.
(2) Keď je výpočet veľmi zložitý a počet záznamov je veľmi veľký (napríklad 10 miliónov), musí byť zložitý výpočet najprv mimo databázy
Po výpočte a spracovaní metódy súborového systému v jazyku C++ je nakoniec pridaná do tabuľky. Toto je skúsenosť s návrhom telekomunikačných fakturačných systémov.
(3) Ak sa zistí, že tabuľka obsahuje príliš veľa záznamov, napríklad viac ako 10 miliónov, mala by byť rozdelená horizontálne. Prax horizontálnej segmentácie je:
Rozdeľte záznam tabuľky horizontálne na dve tabuľky podľa určitej hodnoty primárneho kľúčového PK tabuľky. Ak sa zistí, že tabuľka má príliš veľa polí, napríklad presahovanie
Osemdesiat, stôl je rozdelený vertikálne a pôvodný stôl je rozdelený na dva stoly.
(4) Optimalizácia systému správy databáz DBMS, teda optimalizácia rôznych parametrov systému, ako je počet vyrovnávacích pamätí.
(5) Pri používaní dátovo orientovaného SQL jazyka na programovanie sa snažte prijať optimalizačné algoritmy.
Stručne povedané, na zlepšenie prevádzkovej efektivity databázy je potrebné optimalizovať databázový systém, návrh databázy a implementáciu programu
, tieto tri úrovne pracujú tvrdo súčasne.
Vyššie uvedených štrnásť zručností postupne zhrňuje mnoho ľudí v mnohých oblastiach analýzy a návrhu databáz. Za tieto zážitky
Čitatelia by nemali byť rigidní alebo mechanickí, ale mali by vstrebávať a rozumieť, hľadať pravdu z faktov a ovládať flexibilne. A postupne to urobte: pošlite žiadosť
výstava, aplikácia vo vývoji.




Predchádzajúci:Ľahko ťa naučí, ako vytvoriť trojsystémový tutoriál pre XP+Linux+Win7
Budúci:Bi Fujian vo svojej "Prekabátení Tiger Mountain" komentuje neslušné video a karhá predsedu Maoa
Vyhlásenie:
Všetok softvér, programovacie materiály alebo články publikované spoločnosťou Code Farmer Network slúžia len na vzdelávacie a výskumné účely; Vyššie uvedený obsah nesmie byť použitý na komerčné alebo nezákonné účely, inak nesú všetky následky používateľmi. Informácie na tejto stránke pochádzajú z internetu a spory o autorské práva s touto stránkou nesúvisia. Musíte úplne vymazať vyššie uvedený obsah zo svojho počítača do 24 hodín od stiahnutia. Ak sa vám program páči, podporte originálny softvér, zakúpte si registráciu a získajte lepšie originálne služby. Ak dôjde k akémukoľvek porušeniu, kontaktujte nás prosím e-mailom.

Mail To:help@itsvse.com