Relačný dátový model je jedinečný prístup k riadeniu parametrov pomocou štruktúry a jazyka podľa predikátovej logiky jedného rádu. Prvýkrát ho opísal v roku 1969 anglický vedec Codd. V tomto projekte sú všetky parametre prezentované ako n-tice zoskupené v určitých vzťahoch.
Účel relačného dátového modelu…
…je poskytnúť deklaratívnu metódu na špecifikovanie modelov a dopytov.
Používatelia si priamo všimnú, aké informácie databáza obsahuje a akú teóriu od nej chcú. A tiež nechajte softvér na správu databázy, aby sa postaral o popis štruktúr na jej uloženie. Dôležitý je aj postup získavania informácií pri odpovedi na žiadosti.
Väčšina RDB používa definície údajov SQL a jazyk vyhľadávania. Tieto systémy implementujú to, čo možno považovať za inžinierske priblíženierelačný model.
Tabuľka v schéme databázy SQL zodpovedá predikátovej premennej. Kľúčové obmedzenia a SQL dotazy sa zhodujú s predikátmi.
Takéto databázy sa však v mnohých detailoch odchyľujú od relačného modelu a Codd sa vehementne postavil proti zmenám, ktoré kompromitujú pôvodné princípy.
Prehľad
Hlavnou myšlienkou relačného dátového modelu je popis celej databázy ako súboru predikátov pre konečnú zložku premenných, popisujúcich obmedzenia možných hodnôt a ich kombinácií. Obsah v akomkoľvek danom čase je konečným (logickým) modelom. To znamená množinu vzťahov, jeden na predikátovú premennú, aby boli splnené všetky komponenty. Toto je relačný dátový model.
Alternatívy
Inými modelmi sú hierarchické a sieťové systémy. Niektoré z nich využívajúce staršie architektúry sú stále obľúbené vo veľkokapacitných dátových centrách. Alebo v prípadoch, keď sú existujúce systémy také zložité a abstraktné, že prechod na ne pomocou relačného modelu by bol neúmerne drahý. Za zmienku stoja aj nové objektovo orientované databázy.
Implementácia
Bolo niekoľko pokusov získať skutočnú materializáciu RMD, ktorú pôvodne definoval Codd a vysvetlili inívedci.
Relačný model reprezentácie údajov bol hlavným modelom svojho druhu, ktorý bol opísaný formálne matematickými výrazmi. Hierarchické a sieťové základy existovali pred relačnými systémami, ale ich špecifikácie boli relatívne neformálne. Po definovaní RMD sa uskutočnilo veľa pokusov o porovnanie a porovnanie rôznych modelov - a to viedlo k prísnejším popisom skorých systémov. Hoci procedurálna povaha rozhraní na manipuláciu s údajmi pre hierarchické a sieťové databázy obmedzovala možnosti formalizácie.
Témy
Základným predpokladom konceptu relačného dátového modelu je, že všetky sú reprezentované ako matematické "p" - typické vzťahy, "Cn" - párový vzťah, ktorý je podmnožinou v karteziánskom súčine niekoľkých domén. V matematickom modeli sa úvahy o takýchto údajoch uskutočňujú v dvojhodnotovej predikátovej logike, čo znamená, že pre každú vetu existujú dve možné hodnotenia: buď pravda, alebo nepravda (a neexistuje žiadna tretia hodnota, napríklad neznáma alebo nepoužiteľná)., z ktorých každý sa často spája s pojmom 0). Údaje sa spracúvajú pomocou kalkulu alebo algebry, ktoré sú ekvivalentné vo vyjadrovacej sile.
Typy dátových modelov, relačný dátový model
RMD umožňuje vývojárom vytvoriť konzistentný, logický pohľad na informácie. To všetko sa dosiahne začlenením uvedených obmedzení do návrhu databázy, bežne označovanej ako logická schéma. Teóriou je vyvinúť procesnormalizácia modelu, pričom dizajn s určitými požadovanými vlastnosťami možno vybrať zo súboru logicky ekvivalentných alternatív. V prístupových plánoch a iných implementáciách a operáciách sú podrobnosti spracované motorom DBMS a neodrážajú sa v logickom modeli. To je v rozpore s bežnou praxou, v ktorej ladenie výkonu často vyžaduje zmeny v logickej funkcii.
Základný relačný dátový model predstavuje stavebný blok – ide o doménu alebo typ informácie, zvyčajne zredukovaný na minimum. N-tica je usporiadaná množina hodnôt atribútov. A tie sú zase vzájomnou dvojicou mena a typu. Môže to byť skalárna hodnota alebo komplexnejšia hodnota.
Vzťah pozostáva z hlavičky a tela
Prvý je súbor atribútov.
Telo (s n-tým vzťahom) je množina n-tic.
Tečná hlavička je tiež predmetom každej štruktúry.
Relačný dátový model je definovaný ako množina n-tic. V matematike aj MRD je súbor neusporiadanou zbierkou jedinečných neduplikovaných prvkov, hoci niektoré DBMS ukladajú svojim údajom sekvenciu. V matematike má n-tica poradie a umožňuje duplikáciu. E. F. Codd pôvodne nastavil n-tice pomocou tejto matematickej definície.
Neskôr jedným zo skvelých nápadov E. F. Codda bolo, že používanie názvov atribútov namiesto objednávania by bolo oveľa pohodlnejšie (vo všeobecnostiprípad) v počítačovom jazyku založenom na vzťahoch. Toto vyhlásenie je užitočné aj dnes. Hoci sa koncept zmenil, názov „n-tice“sa nezmenil. Bezprostredným a dôležitým dôsledkom tohto rozlíšenia je, že v relatívnom modeli sa karteziánsky súčin stáva komutatívnym.
Tabuľka je bežnou vizuálnou reprezentáciou vzťahov. N-tica je podobná koncepcii reťazca.
Relvar je pomenovaná premenná nejakého konkrétneho typu dotyčnice, ku ktorej je vždy priradený nejaký vzťah tohto typu, hoci pohľad môže obsahovať nulové n-tice.
Základy relačného dátového modelu: všetky informácie sú reprezentované informačnými hodnotami vo vzťahoch. V súlade s týmto princípom je relačný základ množina relvarov a výsledok každého dotazu je reprezentovaný ako tangencia.
Konzistencia relačnej databázy nie je vynútená pravidlami zabudovanými do aplikácií, ktoré ju používajú, ale skôr obmedzeniami deklarovanými ako súčasť logickej schémy a vynútenými DBMS pre všetky aplikácie. Obmedzenia sú vyjadrené v používaní relačných porovnávacích operátorov, z ktorých iba jeden je podmnožinou (⊆), teoreticky postačujúci. V praxi sa očakáva, že bude k dispozícii niekoľko užitočných skratiek, z ktorých najdôležitejšie sú kandidátske kľúče a obmedzenia externého zdroja. O tom je relačný dátový model.
Výklad
Aby bolo možné plne oceniť RMD, je potrebné pochopiť zamýšľaný výkladako vzťah.
Telo dotyku sa niekedy nazýva jeho predĺženie. Je to preto, že by sa to malo interpretovať tak, že predstavuje zvýšenie nejakého predikátu. Toto je súbor skutočných viet, ktoré možno vytvoriť nahradením každej voľnej premennej názvom.
Medzi objektovo-relačnými dátovými modelmi existuje vzájomná zhoda. Každá n-tica tela vzťahu poskytuje hodnoty atribútov na vytvorenie inštancie predikátu nahradením každej z jeho voľných premenných. Výsledkom je tvrdenie, ktoré sa považuje za pravdivé vzhľadom na výskyt n-tice v tele vzťahu. Naopak, každý proces, ktorého názov sa zhoduje s názvom vzťahu, ale neobjaví sa v tele, sa považuje za nepravdivý.
Tento predpoklad je známy ako hypotéza uzavretého sveta. Často sa porušuje v praktických databázach, kde absencia n-tice môže znamenať, že pravdivosť príslušnej vety nie je známa. Napríklad absencia určitých výrazov („Ján“, „španielčina“) v tabuľke jazykových zručností nemusí byť nevyhnutne dôkazom toho, že chlapec menom John nehovorí po španielsky.
Aplikácia na databázy, teória normalizácie
Predmetom informácií používaným v typickom relačnom RDM môže byť množina celých čísel, množina reťazcov znakov, ktoré tvoria dátumy, alebo dva boolovské hodnoty true a false atď. Zodpovedajúce názvy predmetov pre tieto čísla môžu byť reťazce s názvami "Index", "Urobte potrebnú prácu",„Time“, „Boolean“a tak ďalej a tak ďalej.
Je však dôležité pochopiť, že teória vzťahov nešpecifikuje, ktoré typy by mali byť podporované. A je to skutočne pravda, v súčasnosti sa očakáva, že okrem tých vstavaných, ktoré poskytuje systém, budú ustanovenia dostupné aj pre vlastné subjekty.
Atribút
Toto je termín používaný v teórii pre to, čo sa zvyčajne nazýva stĺpec. Podobne sa namiesto teoretického pojmu tangencia bežne používa tabuľka (hoci v žiadnom prípade nie je synonymom vzťahu v SQL). Dátová štruktúra tabuľky je špecifikovaná ako zoznam definícií stĺpcov, pričom každá má jedinečný názov stĺpca a typ hodnôt, ktoré sú pre ňu povolené.
Hodnota atribútu je položka na konkrétnom mieste, ako napríklad John Doe a 35.
N-tica je v podstate to isté ako riadok, až na to, že v SQL RDBMS, kde sú významy stĺpcov v riadku usporiadané, nie sú n-tice oddelené. Namiesto toho je každá definičná hodnota identifikovaná výhradne svojim názvom, nie svojou ordinálnou pozíciou v n-tici. Názov atribútu môže byť Meno alebo Vek.
Postoj
Je to tabuľka definície štruktúry spolu so vzhľadom údajov v tejto štruktúre. Definícia je hlavička a údaje v nej sú telom, množinou riadkov. Premenná vzťahu sa zvyčajne nazýva hlavná tabuľka. Názov hodnoty, ktorá je mu priradená vkedykoľvek sa zhoduje s tým, ktorý je zadaný v danej bunke, a jeho telo sa zhoduje s telom, ktoré bolo naposledy priradené, čím sa vyvolá nejaký aktualizačný príkaz (zvyčajne INSERT, UPDATE alebo DELETE).
Teoretická formulácia
Základnými pojmami v relačných modeloch vzťahov sú názvy a názvy atribútov. Musia byť reprezentované ako reťazce, ako napríklad "Osoba" a "Meno" a zvyčajne budú musieť použiť premenné na ich rozloženie. Ďalším základným konceptom je súbor atómových hodnôt, ktorý obsahuje potrebné a dôležité významy, ako sú čísla a reťazce.