1. Vzťah medzi pôvodným dokumentom a subjektom
Môže to byť vzťah jeden na jedného, jeden ku mnohým alebo mnoho-na-mnohým. Vo všeobecnosti ide o vzťahy jeden na jedného: t. j. dvojica originálnych dokumentov mali by a len zodpovedať jednej entite. V špeciálnych prípadoch môžu ísť o vzťahy jeden ku mnohým alebo mnoho-jedné, t. j. jeden pôvodný dokument zodpovedá viacerým realitám alebo viacero originálnych dokumentov zodpovedajúcich subjektu. Entitu tu možno chápať ako základnú tabuľku. Po objasnení tejto korešpondencie navrhnite pre nás Vstupné rozhranie je veľmi prospešné. 〖Príklad 1〗: Informácie o životopise zamestnanca zodpovedajú trom základným tabuľkám v informačnom systéme ľudských zdrojov: tabuľka základných informácií zamestnanca a spoločnosť Stôl vzťahov, pracovný životopis. Toto je typický príklad "jeden originálny dokument zodpovedá viacerým subjektom". 2. Primárne a cudzie kľúče Vo všeobecnosti entita nemôže mať ani primárny, ani cudzí kľúč. V diagrame E-R môžu entity v listovej časti definovať primárny kľúč, Je tiež možné nedefinovať primárny kľúč (pretože nemá potomkov), ale musí mať cudzí kľúč (pretože má otca). Návrh primárnych a cudzích kľúčov zaujíma dôležitú pozíciu v návrhu globálnych databáz. Keď je návrh globálnej databázy dokončený, existuje Americkí odborníci na návrh databáz povedali: "Kľúče, kľúče všade, len kľúče", toto je jeho skúsenosť s návrhom databáz Odráža tiež jeho vysoko abstraktné predstavy o jadre informačných systémov (dátové modely). Pretože: primárny kľúč je vysoko abstraktná entita a primárny kľúč je spojený s Dvojica cudzích kľúčov, ktorá predstavuje spojenie medzi entitami. 3. Povaha základnej tabuľky Základná tabuľka sa líši od medzitabuľky a dočasnej tabuľky tým, že má nasledujúce štyri charakteristiky: (1) Atómovosť. Polia v základnej tabuľke už nie sú rozložiteľné. (2) Primitívnosť. Záznamy v základnej tabuľke sú záznamy pôvodných dát (základných dát). (3) Deduktívne. Všetky výstupné údaje je možné odvodiť z údajov v základnej tabuľke a tabuľke kódov. (4) Stabilita. Štruktúra základnej tabuľky je relatívne stabilná a záznamy v tabuľke by sa mali uchovávať dlhodobo. Po pochopení povahy základných tabuliek možno pri navrhovaní databáz základné tabuľky rozlíšiť od medzitabuliek a dočasných tabuliek. 4. Paradigmatické štandardy Vzťah medzi základnou tabuľkou a jej poliami by mal čo najviac zodpovedať tretej paradigme. Avšak návrhy databáz, ktoré spĺňajú tretí paradigmat, často nie sú Najlepší dizajn. Na zlepšenie prevádzkovej efektívnosti databáz je často potrebné znížiť štandard paradigmy: primerane zvýšiť redundanciu, aby sa dosiahol priestor pre čas Účel. Príklad 2: Existuje základná tabuľka pre skladovanie tovaru, ako je znázornené v tabuľke 1. Prítomnosť poľa "Amount" naznačuje, že tabuľka nie je navrhnutá na uspokojenie Tretí paradigmat je postačujúci, pretože "množstvo" možno získať vynásobením "jednotkovej ceny" slovom "množstvo", čo naznačuje, že "množstvo" je redundantné pole. Avšak zvýšenie Redundantné pole "množstvo" môže zlepšiť rýchlosť štatistík dotazov, čo je prax výmeny priestoru za čas. V Rose 2002 existujú dva typy predpísaných stĺpcov: dátové stĺpce a vypočítané stĺpce. Stĺpec ako "suma" sa nazýva "výpočtový stĺpec" a Stĺpce ako "Jednotková cena" a "Množstvo" sa nazývajú "dátové stĺpce". Tabuľka 1 Štruktúra tabuľky komodít Názov produktu Model produktu Jednotková cena Množstvo Množstvo TV 29 palcov 2 500 40 100 000
5. Pochopte tri paradigmy jednoducho Pochopenie týchto troch paradigmatov jednoduchou rečou je veľkým prínosom pre návrh databáz. Pri návrhu databáz, aby sa tieto tri paradigmy lepšie aplikovali, jednoducho Tri paradigmy treba chápať jednoducho: Prvý paradigmat: 1NF je atómové obmedzenie atribútov, ktoré vyžaduje, aby atribúty boli atómové a už sa nedajú rozložiť; Druhý paradigmat: 2NF je obmedzenie jedinečnosti záznamov, ktoré vyžaduje, aby záznamy mali jedinečnú identifikáciu, teda jedinečnosť entity; Paradigma 3: 3NF je obmedzenie redundancie poľa, teda žiadne pole nemôže byť odvodené z iných polí, vyžaduje, aby pole nebolo redundantné
。 Žiadny redundantný návrh databázy to nedokáže. Avšak databáza bez redundancie nemusí byť nevyhnutne najlepšia databáza, niekedy na zlepšenie šťastia Na dosiahnutie efektívnosti je potrebné znížiť štandard paradigmy a primerane ponechať redundantné dáta. Konkrétny prístup spočíva v dodržiavaní tretieho paradigmatu pri navrhovaní konceptuálnych dátových modelov , práca na redukcii paradigmatického štandardu sa zohľadňuje pri návrhu fyzického dátového modelu. Zníženie paradigmy znamená pridať polia, ktoré umožňujú redundanciu. 6. Buďte dobrí v identifikácii a správnom riešení vzťahov medzi mnohými Ak existuje vzťah mnoho-na-mnohých medzi dvoma entitami, tento vzťah by sa mal odstrániť. Spôsob, ako ho odstrániť, je pridať tretie reálne číslo medzi týmito dvoma telo. Týmto spôsobom sa z toho, čo kedysi bol vzťah mnohí ku mnohým, teraz stali dvoma vzťahmi jeden ku mnohým. Atribúty pôvodných dvoch entít by mali byť primerane rozdelené Choď k trom subjektom. Tretia entita je v podstate zložitejší vzťah, ktorý zodpovedá základnej tabuľke. Vo všeobecnosti platí, že čísla Nástroj na návrh knižnice nedokáže rozpoznať vzťahy mnoho-na-mnoho, ale dokáže zvládnuť vzťahy mnoho-na-mnoho. Príklad 3: V "Knižničnom informačnom systéme" je "kniha" entita a "čitateľ" je tiež entita. Tieto dve entity sú rovnaké Vzťah medzi knihami je typický vzťah mnoho-na-mnoho: knihu si môže požičať viacero čitateľov v rôznych časoch a jeden čitateľ si môže požičať viac Táto kniha. Na tento účel by sa medzi nimi mala pridať tretia entita, ktorá sa nazýva "požičiavanie a vrátenie kníh" a jej vlastnosti sú: požičiavanie času a požičiavanie Má tiež logo (0 znamená požičanie knihy, 1 znamená vrátenie knihy), okrem toho by mal mať aj dva cudzie kľúče (primárny kľúč pre "kniha" a primárny kľúč pre "čitateľ"), aby Spája sa s "knihami" a "čitateľmi". 7. Metóda hodnôt primárneho kľúča PK PK je nástroj na prepojenie medzi tabuľkami pre programátorov, ktorý môže byť reťazcom čísel bez fyzického významu, ktorý program automaticky pridá k jednotke 1. Áno je fyzikálne významný názov poľa alebo kombinácia názvov polí. Ale prvé je lepšie ako druhé. Keď je PK kombináciou názvov polí, navrhnite číslo poľa Nepočítajte príliš veľa, pretože index nielenže zaberá veľa miesta, ale aj spomaľuje. 8. Správne nastaviť redundanciu dát Opakovanie primárnych a cudzích kľúčov vo viacerých tabuľkách nie je konceptom dátovej redundancie a mnohí si to neuvedomujú 。 Opakovanie polí bez kľúčov je dátová redundancia! A je to nízkoúrovňová redundancia, teda opakujúca sa redundancia. Pokročilá redundancia nie je založená na teréne Opakovane, ale derivácie polí. Príklad 4: Tri polia "jednotková cena, množstvo a množstvo" v produkte, "množstvo" sú odvodené z "jednotkovej ceny" vynásobenej "množstvom" Je to redundancia a je to akýsi pokročilý typ redundancie. Účelom redundancie je zvýšiť rýchlosť spracovania. Len nízkoúrovňová redundancia zvýši počet nekonzistentnosť údajov, pretože tie isté údaje môžu byť zadané viackrát z rôznych časov, miest a úloh. Preto presadzujeme pokročilú redundanciu (pie redundancia prirodzene), a je proti nízkoúrovňovej redundancii (opakujúcej sa redundanci). 9. Neexistuje štandardná odpoveď pre E--R diagramy Neexistuje štandardná odpoveď na E--R diagram informačného systému, pretože jeho návrh a spôsob kreslenia nie sú jedinečné, pokiaľ pokrýva potreby systému Rozsah a funkčný obsah sú uskutočniteľné. Namiesto toho je potrebné upraviť E--R diagram. Aj keď nemá jednotnú štandardnú odpoveď, neznamená to, že môže byť ľubovoľná Dizajn. Kritériá pre dobrý E-R diagram sú: jasná štruktúra, stručná asociácia, stredný počet entít, rozumné rozdelenie atribútov a žiadna nízkoúrovňová redundancia. 10. Techniky zobrazenia sú užitočné pri návrhu databáz Na rozdiel od základných tabuliek, kódových tabuliek a medzitabuliek sú pohľady virtuálne tabuľky, ktoré závisia od skutočných tabuliek dátového zdroja, aby existovali. Zobrazenia sú pre programátorov Okno využívajúce databázu je formou syntézy dát zo základných tabuliek, metódou spracovania dát a druhom dôvernosti používateľských údajov prostriedky. Na vykonanie zložitého spracovania, zvýšenie rýchlosti výpočtov a úsporu úložného miesta by definícia hĺbky pohľadu nemala zvyčajne presiahnuť tri vrstvy. Asi tri poschodia Ak pohľad stále nestačí, mali by ste definovať dočasnú tabuľku na pohľade a potom definovať pohľad na dočasnej tabuľke. Týmto spôsobom sa hĺbka pohľadu opakovane definuje Žiadne obmedzenia. Pre určité informačné systémy súvisiace s národnými politickými, ekonomickými, technologickými, vojenskými a bezpečnostnými záujmami je úloha názorov ešte dôležitejšia. Tieto Po dokončení fyzického návrhu základnej tabuľky systému sa prvá vrstva pohľadov okamžite vytvorí na základnej tabuľke a počet a štruktúra tohto pohľadu sú rovnaké ako v základnej tabuľke Počet a štruktúra sú úplne rovnaké. A je stanovené, že všetci programátori môžu pracovať iba s pohľadom. Iba správca databázy, s "Bezpečnostný kľúč", ktorý drží viacero osôb, je možné ovládať priamo na základnom stole. Čitatelia sú vyzvaní, aby sa zamysleli: prečo je to tak? 11. Medzistolky, príkazy a dočasné tabuľky Medzitabuľka je tabuľka, ktorá uchováva štatistiky, je navrhnutá na skladovanie dát, výstupné reporty alebo výsledky dotazov, a niekedy nemá primárny kľúč s Cudzie kľúče (okrem dátových skladov). Dočasné tabuľky navrhujú programátori na ukladanie dočasných záznamov na osobné použitie. Základné a medzitabuľky spravuje DBA Dočasné tabuľky automaticky udržiava samotný programátor. 12. Obmedzenia integrity sa prejavujú v troch aspektoch Integrita domény: Použite Check na implementáciu obmedzení a v nástroji na návrh databázy je pri definovaní rozsahu hodnôt poľa Ch tlačidlo eck, ktorým je definované hodnotové mesto poľa. Referenčná integrita: Implementovaná pomocou PK, FK a spúšťačov na úrovni tabuľky. Integrita definovaná používateľom: Ide o niektoré obchodné pravidlá, ktoré sa implementujú pomocou uložených procedúr a spúšťačov. 13. Metódou na zabránenie záplatám návrhu databázy je princíp "tri menej" (1) Čím menej tabuliek v databáze, tým lepšie. Len ak sa zníži počet tabuliek, možno povedať, že E-R diagram systému je malý a jemný, a je odstránený Duplicitné a redundantné entity tvoria vysokú mieru abstrakcie objektívneho sveta a systematická integrácia dát sa vykonáva, aby sa zabránilo návrhu záplat; (2) Čím menej polí v tabuľke kombinuje primárne kľúče, tým lepšie. Vzhľadom na úlohu primárneho kľúča je jedným vytvoriť index primárneho kľúča a druhým slúžiť ako podtabuľka cudzie kľúče, čím sa znižuje počet polí v kombinácii primárnych kľúčov, čo nielenže šetrí čas behu, ale aj miesto v indexovej pamäti; (3) Čím menej polí v tabuľke, tým lepšie. Len malý počet polí naznačuje, že v systéme nedochádza k duplikácii dát Dátová redundancia je minimálna a čo je dôležitejšie, čitatelia sú vyzývaní, aby sa naučili "meniť riadky", čo zabraňuje tomu, aby sa polia presúvali do hlavnej tabuľky v podtabuľke , čím zostáva veľa voľných polí v hlavnej tabuľke. Takzvaný "riadok na zmenu stĺpca" slúži na vybratie časti obsahu hlavnej tabuľky a vytvorenie samostatnej tabuľky Podstôl. Táto metóda je veľmi jednoduchá, niektorí ľudia si na ňu jednoducho nezvyknú, neprijmú ju a neimplementujú ju. Praktickým princípom návrhu databáz je nájsť správnu rovnováhu medzi redundanciou dát a rýchlosťou spracovania. "O tri menej" je komplexný prehľad Myšlienka, komplexné pohľady, nemôžu izolovať určitý princíp. Princíp je relatívny, nie absolútny. Princíp "ešte traja" je určite nesprávny. Skús Predstavte si: Ak je pokrytá rovnaká funkcia systému, E--R diagram so 100 entitami (spolu 1 000 atribútov) je určite lepší ako E--R diagram s 200 entitami (spolu 2 000 atribútov) Diagram E--R je oveľa lepší. Presadzovanie princípu "o tri menej" znamená umožniť čitateľom naučiť sa používať technológiu návrhu databáz na systematickú integráciu dát. Kroky integrácie dát sú nasledovné: Súborový systém je integrovaný do aplikačnej databázy, aplikačná databáza je integrovaná do tematickej databázy a tematická databáza je integrovaná do globálnej komplexnej databázy. Čím vyššia je integrácia, tým silnejšie je zdieľanie dát a tým menej je prítomných informačných ostrovov Počet primárnych kľúčov a počet atribútov bude menší. Cieľom presadzovania princípu "o tri menej" je zabrániť čitateľom používať technológiu záplatovania na neustále pridávanie, mazanie a úpravu databázy, aby sa vytvorili podnikové dáta Knižnica sa stala "smetím" ľubovoľne navrhnutých databázových tabuliek alebo "chaosom" databázových tabuliek a nakoniec spôsobuje základné tabuľky a generácie v databáze Kódové tabuľky, medzitabuľky a dočasné tabuľky sú preplnené a nespočetné, čo vedie k neschopnosti udržiavať a paralyzovať informačné systémy podnikov a inštitúcií. Princíp "tri naraz" môže uplatniť ktokoľvek, čo je omyl "metódy záplatovania" pri navrhovaní databáz. Princíp "o tri menej" Je to princíp menej, ale v poriadku, ktorý vyžaduje vysoké zručnosti v návrhu databáz a umenie, čo nie každý dokáže, pretože tento princíp je odstránený Teoretický základ pre návrh databázy pomocou "metódy patchovania". 14. Spôsoby, ako zlepšiť efektivitu prevádzky databázy Za daných hardvérových a systémových softvérových podmienok sú metódy na zlepšenie efektivity prevádzky databázového systému nasledovné: (1) Pri fyzickom návrhu databázy znížiť parametre, zvýšiť redundanciu, použiť menej spúšťačov a viac uložených procedúr. (2) Keď je výpočet veľmi zložitý a počet záznamov je veľmi veľký (napríklad 10 miliónov), musí byť zložitý výpočet najprv mimo databázy Po výpočte a spracovaní metódy súborového systému v jazyku C++ je nakoniec pridaná do tabuľky. Toto je skúsenosť s návrhom telekomunikačných fakturačných systémov. (3) Ak sa zistí, že tabuľka obsahuje príliš veľa záznamov, napríklad viac ako 10 miliónov, mala by byť rozdelená horizontálne. Prax horizontálnej segmentácie je: Rozdeľte záznam tabuľky horizontálne na dve tabuľky podľa určitej hodnoty primárneho kľúčového PK tabuľky. Ak sa zistí, že tabuľka má príliš veľa polí, napríklad presahovanie Osemdesiat, stôl je rozdelený vertikálne a pôvodný stôl je rozdelený na dva stoly. (4) Optimalizácia systému správy databáz DBMS, teda optimalizácia rôznych parametrov systému, ako je počet vyrovnávacích pamätí. (5) Pri používaní dátovo orientovaného SQL jazyka na programovanie sa snažte prijať optimalizačné algoritmy. Stručne povedané, na zlepšenie prevádzkovej efektivity databázy je potrebné optimalizovať databázový systém, návrh databázy a implementáciu programu , tieto tri úrovne pracujú tvrdo súčasne. Vyššie uvedených štrnásť zručností postupne zhrňuje mnoho ľudí v mnohých oblastiach analýzy a návrhu databáz. Za tieto zážitky Čitatelia by nemali byť rigidní alebo mechanickí, ale mali by vstrebávať a rozumieť, hľadať pravdu z faktov a ovládať flexibilne. A postupne to urobte: pošlite žiadosť výstava, aplikácia vo vývoji.
|