Principy návrhu databáze (reprint) Čtrnáct tipů

test · Zveřejněno 09.04.2015 21:00:54

1. Vztah mezi původním dokumentem a subjektem

Může to být vztah jeden na jednoho, jeden na mnoho a mnoho-na-mnoho. Obecně jde o vztahy jeden na jednoho: tj. dvojici originálních dokumentů
by měly a odpovídat pouze jedné entitě. Ve zvláštních případech mohou být vztahy jedna-na-mnoho nebo mnoho-na-jedné, tj. jeden původní dokument odpovídá více realitám
těle nebo více originálních dokumentů odpovídajících subjektu. Entita zde může být chápána jako základní tabulka. Po objasnění této korespondence, navrhněte nám
Vstupní rozhraní je velmi užitečné.
〖Příklad 1〗: Informace o životopise zaměstnance odpovídají třem základním tabulkám v informačním systému lidských zdrojů: tabulka základních informací zaměstnance a společnost
Tabulka vztahů, pracovní životopis. To je typický příklad "jeden původní dokument odpovídá více entitám".
2. Primární a cizí klíče
Obecně platí, že entita nemůže mít ani primární, ani cizí klíč. V diagramu E-R mohou entity v listové části definovat primární klíč,
Je také možné nedefinovat primární klíč (protože nemá děti), ale musí mít cizí klíč (protože má otce).
Návrh primárních a cizích klíčů zaujímá důležitou roli v návrhu globálních databází. Když je návrh globální databáze dokončen, existuje
Američtí odborníci na návrh databází řekli: "Klíče, klíče všude, nic než klíče", to je jeho zkušenost s návrhem databází
Odráží také jeho vysoce abstraktní představy o jádru informačních systémů (datových modelů). Protože: primární klíč je vysoce abstraktní entita a primární klíč je spojen s
Dvojice cizích klíčů, která představuje spojení mezi entitami.
3. Povaha základní tabulky
Základní tabulka se liší od mezilehlé a dočasné tabulky tím, že má následující čtyři charakteristiky:
(1) Atomicita. Pole v základní tabulce již nejsou rozložitelná.
(2) Primitivnost. Záznamy v základní tabulce jsou záznamy původních dat (základních dat).
(3) Deduktivní. Všechna výstupní data lze odvodit z dat v základní tabulce a v tabulkě kódů.
(4) Stabilita. Struktura základní tabulky je relativně stabilní a záznamy v tabulce by měly být uchovávány po dlouhou dobu.
Po pochopení povahy základních tabulek lze při návrhu databází základní tabulky odlišit od mezitabulek a dočasných tabulek.
4. Standardy paradigmatu
Vztah mezi základní tabulkou a jejími poli by měl co nejvíce odpovídat třetímu paradigmatu. Nicméně návrhy databází, které splňují třetí paradigma, často nejsou
Nejlepší design. Pro zlepšení provozní efektivity databází je často nutné snížit standard paradigmatu: vhodně zvýšit redundanci, aby se dosáhlo prostoru pro čas
Účel.
Příklad 2: Existuje základní tabulka pro skladování zboží, jak je znázorněno v tabulce 1. Přítomnost pole "Amount" znamená, že tabulka není navržena tak, aby byla splněna
Třetí paradigma je dostatečné, protože "množství" lze získat vynásobením "jednotkové ceny" slovem "množství", což naznačuje, že "množství" je redundantní pole. Nicméně zvýšení
Redundantní pole "množství" může zlepšit rychlost dotazových statistik, což je praxe výměny prostoru za čas.
V Rose 2002 existují dva typy předepsaných sloupců: datové sloupce a vypočítané sloupce. Sloupec jako "množství" se nazývá "výpočetní sloupec" a
Sloupce jako "Jednotková cena" a "Množství" se nazývají "datové sloupce".
Tabulka 1 Struktura tabulky komodit
Název produktu Model produktu Jednotková cena Množství Množství
TV 29 palců 2 500 40 100 000

5. Pochopte tři paradigmata laicky
Porozumění třem paradigmatům v jednoduchých termínech je pro návrh databází velkým přínosem. V návrhu databází, aby bylo možné lépe aplikovat tři paradigmata, stačí
Tři paradigmata je třeba chápat jednoduše řečeno:
První paradigma: 1NF je atomové omezení atributů, které vyžaduje, aby atributy byly atomické a již je nelze rozložit;
Druhý paradigmat: 2NF je omezení jedinečnosti záznamů, které vyžaduje, aby záznamy měly jedinečnou identifikaci, tedy jedinečnost entity;
Paradigma 3: 3NF je omezení na redundanci pole, to znamená, že žádné pole nelze odvodit z jiných polí, vyžaduje, aby pole nebylo redundantní
。
Žádný redundantní návrh databáze to nezvládne. Nicméně databáze bez redundance nemusí být nutně nejlepší databází, někdy kvůli zlepšení štěstí
Pro dosažení efektivity je nutné snížit standard paradigmatu a vhodně uchovávat redundantní data. Konkrétní přístup spočívá v dodržování třetího paradigmatu při navrhování konceptuálních datových modelů
, práce na redukci paradigmatického standardu je zohledněna při návrhu fyzického datového modelu. Snížení paradigmatu znamená přidat pole, která umožňují redundanci.
6. Buďte dobří v identifikaci a správném řešení vztahů mezi mnohonásobnými
Pokud existuje vztah mnoho-na-mnoho mezi dvěma entitami, měl by být tento vztah odstraněn. Způsob, jak ji odstranit, je přidat mezi ně třetí reálné číslo
tělo. Tímto způsobem se z toho, co dříve byl vztah mnoho, stalo dva vztahy jeden ku mnoha. Atributy původních dvou subjektů by měly být rozumně rozloženy
Jdi ke třem entitám. Třetí entita zde je v podstatě složitější vztah, který odpovídá základní tabulce. Obecně řečeno, čísla
Nástroj pro návrh knihovny nedokáže rozpoznat vztahy mnoho-na-mnoho, ale dokáže zvládnout vztahy mnoho-na-mnoho.
Příklad 3: V "Knihovním informačním systému" je "kniha" entita a "čtenář" je také entita. Tyto dvě entity jsou totéž
Vztah mezi knihami je typický vztah mnoho-na-mnoho: knihu si může více čtenářů půjčit v různých časech a jeden čtenář si může půjčit více
Tahle kniha. Za tímto účelem by měla být mezi nimi přidána třetí entita, která se nazývá "půjčování a vracení knih" a její vlastnosti jsou: půjčování času a půjčování
Má také logo (0 znamená půjčení knihy, 1 znamená vrácení knihy), navíc by měl mít také dva cizí klíče (primární klíč pro "knihu" a primární klíč pro "čtenáře"), takže
Spojuje se s "knihami" a "čtenáři".
7. Hodnotová metoda primárního klíče PK
PK je nástroj pro propojení mezi tabulkami pro programátory, což může být řetězec čísel bez fyzického významu, který program automaticky přidá k 1. Ano
je fyzikálně významový název pole nebo kombinace názvů polí. Ale první možnost je lepší než ta druhá. Když je PK kombinací názvů polí, navrhněte číslo pole
Nepočítajte příliš mnoho, protože index nejenže zabírá hodně místa, ale také zpomaluje.
8. Správně nastavit redundanci dat
Opakování primárních a cizích klíčů ve více tabulkách není pojmem datové redundance a mnoho lidí si toho není vědomo
。 Opakování neklíčových polí je datová redundance! A je to nízkoúrovňová redundance, tedy opakující se redundance. Pokročilá redundance není založená na terénu
Opakovaně, ale derivace polí.
Příklad 4: Tři pole "jednotková cena, množství a množství" v produktu, "množství" je odvozeno z "jednotkové ceny" vynásobené "množstvím"
Je to redundance a je to určitý druh pokročilé redundance. Účelem redundance je zvýšit rychlost zpracování. Pouze nízkoúrovňová redundance zvýší počet
nekonzistence dat, protože stejná data mohou být zadána vícekrát z různých časů, míst a rolí. Proto prosazujeme pokročilou redundanci (koláč
redundance od přírody) a odmítá nízkoúrovňovou redundanci (opakovanou redundanci).
9. Neexistuje standardní odpověď pro E--R diagramy
Neexistuje žádná standardní odpověď na E--R diagram informačního systému, protože jeho návrh a metoda kreslení nejsou jedinečné, pokud pokrývá potřeby systému
Rozsah a funkční obsah jsou proveditelné. Místo toho je nutné upravit E--R diagram. Ačkoliv nemá jednotnou standardní odpověď, neznamená to, že může být libovolná
Design. Kritéria pro dobrý E-R diagram jsou: jasná struktura, stručná asociace, střední počet entit, rozumné rozdělení atributů a absence nízkoúrovňové redundance.
10. Techniky zobrazení jsou užitečné při návrhu databází
Na rozdíl od základních tabulek, kódových tabulek a mezitabulek jsou pohledy virtuální tabulky, které závisí na skutečných tabulkách datového zdroje, aby existovaly. Pohledy jsou pro programátory
Okno využívající databázi je formou syntézy dat ze základních tabulek, metodou zpracování dat a druhem důvěrnosti uživatelských dat
Means. Pro provádění složitého zpracování, zvýšení rychlosti výpočtu a úsporu úložného místa by hloubka definice pohledu neměla obecně přesahovat tři vrstvy. Třeba tři patra
Pokud pohled stále nestačí, měli byste na pohledu definovat dočasnou tabulku a pak zobrazit pohled na dočasné tabulce. Tímto způsobem je hloubka pohledu opakovaně definována
Žádná omezení.
U některých informačních systémů souvisejících s národními politickými, ekonomickými, technologickými, vojenskými a bezpečnostními zájmy je role názorů ještě důležitější. Tyto
Po dokončení fyzického návrhu základní tabulky systému je první vrstva pohledů ihned stanovena na základní tabulce a počet i struktura tohoto pohledu jsou stejné jako u základní tabulky
Počet a struktura jsou přesně stejné. A je stanoveno, že všichni programátoři mohou pracovat pouze s tímto zobrazením. Pouze správce databáze, s
"Bezpečnostní klíč" držený více osobami může být ovládán přímo na základním stole. Čtenáři jsou vyzváni, aby přemýšleli: proč tomu tak je?
11. Mezilehlé tabulky, příkazy a dočasné tabulky
Mezilehlá tabulka je tabulka, která uchovává statistiky, je navržena pro datové skladování, výstupní reporty nebo výsledky dotazů, a někdy nemá primární klíč s
Cizí klíče (kromě datových skladů). Dočasné tabulky jsou programátory navrženy pro ukládání dočasných záznamů pro osobní použití. Základní a mezilehlé tabulky spravuje DBA
Dočasné tabulky jsou automaticky udržovány samotným programátorem.
12. Integritní omezení se projevují ve třech aspektech
Integrita domény: Použijte Check pro implementaci omezení a v nástroji pro návrh databáze je při definování rozsahu hodnot pole označeno Ch
Tlačítko eck, kterým je definováno město pole.
Referenční integrita: Implementováno pomocí spouštění na úrovni PK, FK a tabulky.
Uživatelsky definovaná integrita: Jedná se o některá obchodní pravidla, která jsou implementována pomocí uložených procedur a spouštěčů.
13. Metodou zabránění záplatám návrhu databáze je princip "o tři méně"
(1) Čím méně tabulek v databázi, tím lépe. Pouze pokud se počet tabulek sníží, lze říci, že E-R diagram systému je malý a jemný, a je odstraněn
Duplikované a redundantní entity tvoří vysokou míru abstrakce objektivního světa a systematická integrace dat je prováděna, aby se zabránilo záplatování;
(2) Čím méně polí v tabulce kombinuje primární klíče, tím lépe. Kvůli roli primárního klíče je jedním vytvořit index primárního klíče a druhým sloužit jako podtabulka
cizí klíče, takže se snižuje počet polí v kombinaci primárních klíčů, což nejen šetří provozní čas, ale také šetří místo v indexovém úložišti;
(3) Čím méně polí v tabulce, tím lépe. Pouze malý počet polí naznačuje, že v systému nedochází k duplikaci dat
Je zde malá redundance dat a co je důležitější, čtenáři jsou vyzýváni, aby se naučili "měnit řádky", což zabraňuje tomu, aby se pole vytahovala do hlavní tabulky v podtabulce
, což ponechává mnoho volných polí v hlavní tabulce. Takzvaný "řádek pro změnu sloupců" znamená vyjmout část obsahu hlavní tabulky a vytvořit samostatnou tabulku
Podstol. Tato metoda je velmi jednoduchá, někteří lidé si na ni prostě nezvyknou, nepřijmou ji a neimplementují ji.
Praktickým principem návrhu databází je najít správnou rovnováhu mezi redundancí dat a rychlostí zpracování. "Tři míň" je komplexní přehled
Myšlení, komplexní pohledy, nemohou izolovat určitý princip. Princip je relativní, nikoli absolutní. Princip "ještě tři" je rozhodně špatný. Zkus
Představte si: Pokud je stejná funkce systému pokryta, diagram E--R se 100 entitami (celkem 1 000 atributů) je rozhodně lepší než diagram E--R s 200 entitami (celkem 2 000 atributů)
Diagram E--R je mnohem lepší.
Prosazování principu "o tři méně" znamená umožnit čtenářům naučit se používat technologie návrhu databází pro systematickou integraci dat. Kroky pro integraci dat jsou následující:
Souborový systém je integrován do aplikační databáze, aplikační databáze je integrována do tematické databáze a tematická databáze je integrována do globální komplexní databáze.
Čím vyšší je stupeň integrace, tím silnější je sdílení dat a tím méně je přítomných informačních ostrovů
Počet primárních klíčů a počet atributů bude menší.
Cílem prosazování principu "o tři méně" je zabránit čtenářům používat technologie pro záplatování k neustálému přidávání, mazání a úpravám databáze, aby vznikla podniková data
Knihovna se stala "hromadou odpadu" libovolně navržených databázových tabulek, nebo "chaosem" databázových tabulek, a nakonec způsobuje základní tabulky a generace v databázi
Tabulky kódů, mezitabulky a dočasné tabulky jsou přeplněné a nespočetné, což vede k nemožnosti udržovat a paralyzovat informační systémy podniků a institucí.
Princip "ještě tři další" může použít kdokoliv, což je klam "metody záplatování" při návrhu databází. Princip "o tři míň"
Je to princip méně, ale v pořádku, který vyžaduje vysoké dovednosti v návrhu databází a umění, což ne každý zvládne, protože tento princip je odstraněn
Teoretický základ pro návrh databáze pomocí "metody patchingu".
14. Způsoby, jak zlepšit efektivitu provozu databáze
Za daných podmínek systémového hardwaru a softwarového systému jsou metody pro zvýšení provozní efektivity databázového systému:
(1) Při fyzickém návrhu databáze snížit paradigmatu, zvýšit redundanci, použít méně spouštěčů a více uložených procedur.
(2) Pokud je výpočet velmi složitý a počet záznamů je velmi velký (například 10 milionů), musí být složitý výpočet nejprve mimo databázi
Po výpočtu a zpracování metody souborového systému v jazyce C++ je nakonec přidána do tabulky. To je zkušenost s návrhem telekomunikačních fakturačních systémů.
(3) Pokud se zjistí, že tabulka obsahuje příliš mnoho záznamů, například více než 10 milionů, měla by být tabulka rozdělena horizontálně. Praxe horizontální segmentace je:
Rozdělte záznam tabulky horizontálně na dvě tabulky podle určité hodnoty primárního klíčového PK tabulky. Pokud se zjistí, že tabulka má příliš mnoho polí, například překračování
Osmdesát je stůl rozdělen vertikálně a původní stůl je rozdělen na dva stoly.
(4) Optimalizace systému DBMS, tedy optimalizace různých systémových parametrů, například počtu bufferů.
(5) Při používání datově orientovaného SQL jazyka pro programování se snažte přijmout optimalizační algoritmy.
Stručně řečeno, pro zlepšení provozní efektivity databáze je nutné optimalizovat databázový systém, návrh databáze a implementaci programu
, tyto tři úrovně pracují tvrdě současně.
Výše uvedených čtrnáct dovedností postupně shrnuje mnoho lidí v mnoha praktikách analýzy a návrhu databází. Za tyto zážitky
Čtenáři by neměli být striktní nebo mechanickí, ale měli by vstřebávat a chápat, hledat pravdu z faktů a ovládat flexibilně. A postupně to udělejte: pošlete žádost
výstava, aplikace ve vývoji.

[Zdroj] Principy návrhu databáze (reprint) Čtrnáct tipů

Související příspěvky

Prohlížené sekce