četrtek, 1. april 2010

Uvodna predavanja z dne 2. marec 2010

Osnove

 Splošno o podatkovnih bazah
 Zgodovina shranjevanja podatkov
 Datotečni sistem in SUPB
 Opisovanje in shranjevanje podatkov v PB
 Poizvedovanje v PB
 Obvladovanje transakcij
 Zgradba SUPB


Splošno o podatkovnih bazah (PB)
 Stanje danes:
– Organizacije odvisne od zmožnosti pridobivanja natančnih in pravočasnih podatkov...
– Podatki predstavljajo konkurenčno prednost.
– Brez zmožnosti za upravljanje z velikimi količinami podatkov in zmožnosti za hitro iskanje ustreznih podatkov postanejo podatki breme za organizacijo.
– Paradoks: zaradi preveč informacij potrebujemo še več informacij
– Potrebujemo ustrezne mehanizme za upravljanje s podatki in učinkovito iskanje po njih  podatkovne baze.
 Definicija: Podatkovna baza je mehanizirana, večuporabniška, formalno definirana in centralno nadzorovana zbirka podatkov (glej [4,15]).



Sistemi za upravljanje s PB
 Sistem za upravljanje s podatkovno bazo – SUPB je programska oprema za obvladovanje velikih količin podatkov.
 Alternativa – shranjevanje v aplikaciji lastni obliki; problemi: neprenosljivost idr.
 Obstaja veliko vrst SUPB. Omejili se bomo predvsem na relacijske ter omenili objektne.
 Primeri SUPB: Oracle, Sybase, DB2, MS SQL, Ingres, Postgres, MySQL, ObjectStore, Jasmine, Objectivity/DB, Versant Object Database,...

Zgodovina shranjevanja podatkov
 Zgodnja 60’: Charles Bachman iz General Electric-a razvije prvi splošno-namenski SUPB (Integrated Data Store).
– Predstavlja osnovo za mrežni podatkovni model, ki je predlagan za standard na konferenci za jezike podatkovnih sistemov (CODASYL).
– Za mrežni podatkovni model Bachman prejme Turingovo nagrado (ACM Turing Award - na področju računalniških znanosti ekvivalent Nobelove nagrade)
– Ima velik vpliv na razvoj SUPB-jev v 60’ letih.

 Pozna 60’: IBM razvije Information Management System (IMS), ki se ponekod uporablja še danes.
– Predstavlja osnovo za hierarhični podatkovni model.
– American Airlines in IBM razvijeta sistem SABRE za rezervacije letalskih kart – sistem omogoča več uporabnikom dostop do skupnih podatkov preko mreže.
– Zanimivost: isti SABRE se še danes uporablja spletna potovalna agencija Travelocity.

 70’ leta: Edgar Codd predlaga relacijski podatkovni mode (IBM).
– Razvije se mnogo relacijskih SUPB.
– Podatkovne baze postanejo akademsko področje. Razvije se izjemno močna teoretična podlaga.
– Codd dobi Turingovo nagrado za svoje delo.
– Relacijske Podatkovne baze postanejo standard za upravljanje s podatki v organizacijskih sistemih.

 80’ leta: Relacijski model si še utrdi položaj kot SUPB.
– Razvije se SQL poizvedovalni jezik (IMB-ov projekt System R)
– SQL postane standardni jezik za izvajanje poizvedb v relacijski PB.
– SQL je bil standardiziran v poznih 80’ – SQL-92.
– Standard prevzamejo American National Standard Institute (ANSI) in International Standards Organization (ISO).
– Skrb za sočasen dostop do podatkov prevzame SUPB. Programerji programirajo, kot bi do podatkov dostopali samo oni. James Grey dobi za dosežke na tem področju Turingovo nagrado.

 Pozna 80’ in 90’: veliko napredka na področju PB.
– Veliko raziskav se opravi na področju poizvedovalnih jezikov in bogatejših (razširjenih) podatkovnih modelov.
– Velik poudarek na kompleksnih analizah podatkov iz vseh področij organizacijskih sistemov.
– Veliko proizvajalcev SUPB-jev (IBM – DB2, Oracle 8, Informix UDS) razširi svoje sisteme s podporo novim podatkovnim tipom: slike, tekst in s podporo kompleksnejšim poizvedbam.
– Pojavijo se podatkovna skladišča, ki združujejo podatke iz več PB in omogočajo izvajanje specializiranih analiz (iskanje zakonitosti v podatkih).
– Pojavijo se ERP (enterprise resource planning) in MRP (management resource planning) paketi
 Podpirajo skupne funkcije v poslovnih sistemih (npr. skladiščno poslovanje, planiranje človeških virov, finančne analize,...).
 Predstavljajo obsežno aplikacijsko plast nad skupno PB.
 Primeri: Baan, Oracle, PeopleSoft, SAP in Siebel.

 Naslednja stopnja: vstop SUPB v svet Interneta
– Prva generacija spletnih mest shranjuje podatke v datotekah OS (operacijski sistem). Uporaba PB za shranjevanje podatkov, ki so dostopni preko Interneta, postaja vsakdanja.
 Poizvedbe se generira preko spletnih form, odgovore pa se nazaj posreduje v obliki jezika HTML, za lažji prikaz v spletnem brskalniku.
– Vsi proizvajalci dodajajo svojim SUPB-jem možnosti za čim lažjo uporabo v spletu.

 Najnovejša področja:
– Multimedijske PB,
– PB za interaktivni video,
– Digitalne knjižnice,
– Odločitveni sistemi, vrtanje po podatkih, odkrivanje zakonitosti
– Raziskovalni projekti:
 Human Genome Project
 GEOSS - The Global Earth Observation
System of Systems (GEOSS)
 ...



Datotečni sistemi in SUPB...
 Omejitve datotečnih sistemov:
– Ločevanje in izolacija podatkov
 Vsaka aplikacija obvladuje svoje podatke
 V okviru ene aplikacije lahko dostopamo le do podatkov te aplikacije (ne vemo za razpoložljive podatke v drugih aplikacijah)
– Podvajanje podatkov
 Podvajanje vnosa – iste podatke vnašamo večkrat in na več mest
 Odvečna poraba prostora na disku ter potencialna možnost za neskladnost
 Isti podatki podani v različnih oblikah
– Podatkovna odvisnost
 Struktura podatkov je definirana v aplikaciji; sprememba v strukturi podatkov zahteva spremembo v aplikaciji
– Neskladnost med oblikami datotek
 Aplikacije, napisane v različnih programskih jezikih, ne morejo enostavno dostopati do datotek drugih sistemov
 Zaradi težav oziroma neučinkovitosti shranjevanja podatkov neposredno v datoteke, se pojavijo Sistemi za upravljanje s podatkovnimi bazami – SUPB.
 Definicija: SUPB je skupek programske opreme, ki omogoča kreiranje, vzdrževanje in nadzor nad dostopom do podatkov v PB.
 SUPB uporablja različne mehanizme za upravljanje s podatki:
– Kreiranje podatkovnih struktur je omogočeno z jezikom
DDL - Data Definition Language.
 Omogoča definiranje podatkovnih struktur in tipov ter omejitev
 Vse specifikacije so shranjene v PB (podatkovni slovar, sistemski katalog). Kreiranje tabele pomeni poseg v sistemski katalog.
– Vzdrževanje podatkov (Create, Insert, Update, Delete) izvajamo z uporabo jezika DML - Data Manipulation Language.
– Za izvajanje povpraševanja obstajajo povpraševalni jeziki (query language)
.SUPB zagotavlja nadzor nad dostopom do podatkov:
– Varnost: dostop do podatkov v skladu z avtorizacijo
– Skladnost: zagotavlja skladnost podatkov
– Sočasni dostop: zagotavlja in nadzira sočasni dostop
– Obnova: zagotavlja mehanizme za obnovo podatkov
 Uporaba SUPB prinaša naslednje prednosti:
– Podatkovna neodvisnost: Programi so neodvisni od predstavitve podatkov in načina shranjevanja podatkov. SUPB zagotavlja abstrakcijo podatkov in ločuje programe od podrobnosti predstavitve podatkov.
– Učinkovit dostop do podatkov: SUPB zagotavlja tehnike za učinkovito hranjenje in dostop do podatkov.
– Varnost in integriteta podatkov: Če se do podatkov dostopa preko SUPB, se lahko uporabi omejitve, ki zagotavljajo skladnost podatkov.
– Administracija podatkov: Če so podatki shranjeni centralno, je upravljanje s podatki lažje.
– Sočasen dostop do podatkov in obnavljanje PB: SUPB razporeja sočasne dostope tako, da izgleda, kot da do podatkov dostopa en uporabnik.
– Skrajša čas razvoja programov: SUPB podpira številne mehanizme za dostop do podatkov.
 Zaključek: SUPB prinaša veliko prednosti v primerjavi s hranjenjem podatkov neposredno v datotekah.
 Obstajajo (redke) izjeme, ko uporaba SUPB ni primerna. Npr.:
– Za specializirane aplikacije (npr.: v realnem času) klasični SUPB niso primerni. Za te aplikacije se raje izdela namensko kodo za rokovanje s podatki.
– Če SUPB ne podpira dela s podatki na način, ki ga zahteva program.

 Komponente SUPB
– Strojna oprema
– Programska oprema
– Podatki
– Postopki
– Ljudje
– Strojna oprema:
 Podatkovni strežnik
 Pomembna parametra za strežnik: hitri pomnilnik in diskovni prostor
 Ostala strojna oprema
– Programska oprema:
 SUPB, operacijski sistem, omrežna programska oprema
 Različna sistemska oprema (razvojna orodja, orodja za dostop do podatkov)
 Specializirane aplikacije
– Postopki
 Načini prijave
 Uporaba posameznih orodij
 Zagon in zaustavitev podatkovne baze
 Izdelava varnostnih kopij
 Obvladovanje nesreč/okvar
– Ljudje, njihove vloge
 Skrbnik podatkov
 Skrbnik Podatkovne baze (DBA – Database Administrator)
 Analitik, načrtovalec PB
 Razvijalci aplikacij
 Končni uporabniki (izkušeni, neizkušeni)

Opisovanje in shranjevanje podatkov v PB
 Model, s katerim opišemo, kaj bi želeli hraniti ter kakšne povezave obstajajo med elementi, ki jih želimo hraniti, se imenuje podatkovni model.
 Podatkovni model je način, kako na visoki ravni abstrakcije opišemo podatke, ki jih želimo hraniti ter skrijemo nepomembne podrobnosti.
 Podatkovni model odraža uporabnikovo percepcijo realnega sveta. V resnici izraža uporabnikovo predstavo, kako naj bodo podatki shranjeni.
Podatkovni model


Logični podatkovni modeli
 Logični podatkovni model je jezik, ki ga razume ciljni SUPB.
 Poznamo več vrst logičnih modelov:
– Relacijski podatkovni model
 Relacijski SUPB: DB2, Informix, Oracle, Sybase, MS Access,...
– Hierarhični podatkovni model (glej [4,181]).
 Hierarhični SUPB: IBM-ov IMS
– Mrežni podatkovni model (glej [4,159]).
 Mrežni SUPB: IDS in IDMS
– Objektni podatkovni model
 Objektni SUPB: Objectstore, Versant,...
– Objektno-relacijski podatkovni model:
 Hibridni SUPB: IBM, Informix, ObjectStore, Oracle, Versant,…

Tri-nivojska predstavitev podatkov...

 Podatki so v PB opisani na treh ravneh:
– Zunanja shema
– Konceptualna ali logična shema
– Fizična shema


Tri-nivojska predstavitev podatkov...
 Konceptualna ali logična shema
– Konceptualna shema opisuje podatke z vidika podatkovnega modela, ki ga PB uporablja. Npr.:
 Podatki o entitetah (profesor, študent, predavalnica,...)
 Podatki o povezavah (predava, posluša,...).
– Proces izdelave konceptualne sheme se
imenuje konceptualno ter logično
načrtovanje.

Tri-nivojska predstavitev podatkov...
 Fizična shema:
– Fizična shema podaja podrobnosti o shranjevanju podatkov  kako so podatki iz konceptualne sheme dejansko shranjene na sekundarnem pomnilniku: trdi disk, magnetni trakovi,...
– Odločiti se je potrebno, kakšno datotečno organizacijo bomo uporabili za shranjevanje podatkov in kreirati indeksne datoteke.
Proces izdelave fizične sheme se imenuje načrtovanje fizične PB.

 Zunanja shema:
– Tudi zunanje sheme uporabljajo koncepte podatkovnega modela (gradnike konceptualne sheme).
– Zunanja shema se uporablja za dostop do podatkov, ki je prilagojen določenemu uporabniku ali skupini uporabnikov.
– Vsaka zunanja shema sestoji iz enega ali več pogledov (view) in entitet iz konceptualne sheme.
– Pogled je logična tabela, ki ne obstaja v fizični podatkovni bazi.
– Izdelava zunanjih shem se izvaja v sodelovanju z uporabniki –
zajemanje uporabniških zahtev.
Podatkovna neodvisnost...
 Zelo pomembna lastnost SUPB je, da omogoča podatkovno neodvisnost - programi so neodvisni od načina shranjevanja in strukturiranja podatkov v PB.
 Podatkovno neodvisnost dosežemo z uporabo tri-nivojske abstrakcije podatkov:
– Če se spremeni konceptualna shema, lahko zunanjo shemo priredimo tako, da pogledi ostanejo nespremenjeni  logična podatkovna neodvisnost.
– Podobno konceptualna shema ločuje uporabnike od sprememb, ki se naredijo na fizični PB  fizična podatkovna neodvisnost.
. Konceptualna shema skrije podrobnosti o tem, kako so podatki dejansko shranjeni na disku, o strukturi datotek in o indeksih.
 Dokler ostaja konceptualna shema nespremenjena, spremembe na fizičnem nivoju ne vplivajo na programe, ki podatke uporabljajo.
 Lahko pa spremembe vplivajo na učinkovitost.
Poizvedovanje v PB
 Enostavnost pridobivanja informacij iz PB je ključna prednost SUPB za uporabnike.
 Relacijske PB omogočajo uporabnikom postavljati enostavna vprašanja (poizvedbe), s katerimi pridobivajo podatke/informacije.
 Poizvedbe se podaja v jeziku, ki je prirejen za opisovanje poizvedb – poizvedovalni jezik.
 Relacijski model podpira zelo močne poizvedovalne jezike
 Ena pomembnih nalog SUPB je optimizacija poizvedb, tako da se te čim hitreje izvedejo.
.Učinkovitost poizvedb je močno odvisna od načina, kako so podatki shranjeni v fizični obliki ter indeksirani.
 SUPB omogoča uporabnikom izvajati poizvedbe ter kreirati in posodabljati vrednosti s pomočjo DML - Data Manipulation Language skupine ukazov iz jezika SQL.
 DML skupina podpira ukaze za vstavljanje, brisanje in posodabljanje zapisov v tabelah.

Upravljanje s transakcijami
 Transakcija predstavlja skupek ažuriranj, ki jih izvede transakcijski program.
 Z vidika SUPB predstavlja transakcija osnovno enoto spremembe  transakcija se mora izvesti cela ali nič.
 Dve pomembni nalogi SUPB pri izvajanju transakcij:
– Zagotavljanje sočasnosti pri izvajanju transakcij in
– Obnavljanje PB po transakcijskih in sistemskih nesrečah (razveljavljanje, ponavljanje transakcij...).

Tipična zgradba SUPB

 Funkcije posameznih enot SUPB:
– Stroj za evaluacijo poizvedb (Query Evaluation Engine)
 Sintaktični analizator (Parser): Sintaktično analizira poizvedbo, ki jo SUPB-ju posreduje aplikacija.
 Optimizator (Optimizer): Na podlagi informacij o tem, kako so podatki shranjeni, izdela učinkovit plan za izvajanje poizvedbe. Plan izvajanja predstavlja načrt za izvedbo poizvedbe in je ponavadi predstavljen kot drevo relacijskih operatorjev.
 Evaluator operatorjev (Operator Evaluator): Na osnovi plana izvajanja analizira poizvedbo.
 Izvajalec plana (Plan Executor): Izvede poizvedbo po navodilih plana poizvedbe.

 Funkcije posameznih enot SUPB (nadaljevanje):
– Datoteke in metode dostopa (Files and Access Methods): enota, ki omogoča delo z datotekami.
– Upravljalec medpomnilnika (Buffer Manager): Prenaša strani iz diska v pomnilnik glede na bralne potrebe.
– Upravljalec prostora na disku (Disk Space Manager): Najnižji nivo SUPB je zadolžen za upravljanje z diskom. Vse operacije višjih plasti se tukaj prevedejo v nizko-nivojske ukaze za delo z diskom.
– Enota za nadzor sočasnosti (Concurrency Control):
 Upravljalec transakcij (Transaction Manager): Zagotavlja zaseganje podatkov z uporabo določenih protokolov in skrbi za razporejanje izvajanja transakcij.
 Upravljalec zaklepanja (Lock Manager): Vzdržuje informacije o zahtevanih in odobrenih zaseženih podatkov.
– Upravljalec obnove podatkov (Recovery Manager): Vzdržuje dnevnik in skrbi za obnavljanje sistema v zadnje skladno stanje pred nesrečo.


Shramba in indeksiranje podatkov

 Diski in diskovna polja
 Upravljanje z diskom in pomnilnikom
 Organizacija datotek in indeksiranje
 Indeksi na osnovi drevesne strukture
 Hash-indeks

Komponente SUPB za delo s podatki
 Podatki iz PB se hranijo na diskih (in trakovih).
 Upravljalec prostora na disku (Disk Space Manager):
– enota, ki upravlja s prostorom na disku,
– ukaze v zvezi z zaseganjem in sproščanjem prostora na disku prejema od upravljavca z datotekami.
 Upravljalec z datotekami (File Manager):
– zasega in sprošča prostor na disku v enotah – straneh.
– je odgovoren za upravljanje strani znotraj datoteke in za urejanje zapisov znotraj strani.
– Velikost strani je eden od parametrov SUPB. Tipično od 4KB od 8 KB.


 Upravljalec medpomnilnika (Buffer manager):
– skrbi za prenos določene strani iz diska v področje v glavnem pomnilniku - medpomnilnik (buffer pool).
– stran, kjer je zapis, poišče upravljalec z datotekami. Prenos v medpomnilnik izvede upravljalec medpomnilnika.

Hierarhija pomnilnika

 Drugi razlogi za shranjevanje podatkov na sekundarnem in terciarnem pomnilniku:
– 32 bitni naslovni prostor omogoča naslavljanje samo 232 = 4Gb podatkov ...
– podatki morajo biti obstojni (primarni pomnilnik se prazni…)
 Stanje glede kapacitete in cene pomnilnikov se hitro spreminja. Najzanesljivejši viri informacij so spletne strani proizvajalcev, preizkuševalcev, trgovin...










Magnetni disk


 Nekaj lastnosti:
– Magnetni disk omogoča neposreden dostop do želene lokacije na disku.
– Podatki na disku so shranjeni v enotah, imenovanih bloki.
– Blok predstavlja zaporedje bajtov in je najmanjša enota, ki se jo lahko bere iz ali piše na disk.
– Bloki so organizirani v koncentrične kroge, imenovane sledi.
– Sledi se nahajajo na eni ali obeh straneh magnetne plošče.
– Vsaka sled je razdeljena na odseke ali sektorje. Sektor je določen z diskom in ga ni mogoče spreminjati.
– Velikost bloka se določi pri formatiranju diska. Njegova velikost je mnogokratnik velikosti sektorja.
– Disk ima lahko več glav, ki se premikajo istočasno.
– Disk je z računalnikom povezan preko krmilnika. Krmilnik izvaja ukaze za branje in pisanje na disk in zagotavlja pravilnost izvajanja ukazov.
– Pri zapisovanju in branju sektorjev se računa kontrolka (checksum)
– Tipična velikost plošč: 3.5 inčev.
 Čas, potreben za dostop do želene lokacije (povprečni dostopni čas):
– iskalni čas (premik glave na ustrezno sled)
– rotacijska zakasnitev (čakalni čas, da se ustrezen blok na sledi zavrti do glave). Povprečno znaša polovico časa rotacije in je manjši od iskalnega časa.
– čas prenosa (dejanski prenos bloka – branje ali pisanje).

 Primerjava:
– Dostopni čas RAM-a ≈ 10ns
– Dostopni čas diska ≈ 10ms.

Magnetni disk
 Organizacija podatkov na disku je pomembna – vpliva na učinkovitost SUPB:
– podatki se morajo pred uporabo prenesti v glavni pomnilnik,
– najmanjša enota podatkov, ki se bere ali piše na disk, je blok.
– Čas za pisanje ali branje podatkov je odvisen od položaja podatkov na disku: dostopni čas=iskalni čas + rotacijska zakasnitev + čas prenosa.
– Čas, ki ga SUPB porabi za prenos podatkov, je navadno večji kot čas, potreben za obdelavo določenega podatka.
– Podatke je potrebno ustrezno razporediti po disku!!!.

Polje diskov
 Disk predstavlja potencialno ozko grlo za učinkovitost SUPB in vpliva na zanesljivost delovanja sistema.
 Učinkovitost CPU raste hitreje kot učinkovitost diskov:
– CPU: 50% na leto
– Diski: 10% na leto
 Diski vsebujejo mehanske elemente  verjetnost za napake večja kot pri notranjem pomnilniku.
 Odpoved diska lahko pomeni katastrofo.
 Možna rešitev: polje diskov (disk array).
Polje diskov
 Polje diskov je povezava več diskov, organiziranih tako, da
– povečajo učinkovitost in
– izboljšajo zanesljivost.
 Učinkovitost povečamo s porazdelitvijo podatkov (data striping):
– podatke se porazdeli po več diskih
 Zanesljivost povečamo z redundanco podatkov:
– Zapisuje se dodatne (redundantne) podatke ali pa se podatke podvaja. V primeru napake omogoča obnovo podatkov.

RAID
 Diskovna polja, ki implementirajo porazdelitev in podvajanje podatkov imenujejo “Redundant Arrays of Independent Disks” – RAID.
 Poznamo več vrst RAID.
 Razlikujejo se po kompromisu med učinkovitostjo in zanesljivostjo.

 RAID s porazdelitvijo podatkov:
– Uporabniku se kaže kot zelo velik disk.
– Podatki se razdelijo na enake enote (striping units), ki se zapišejo na več diskov. Vsaka enota na en disk.
– Enote se po diskih distribuirajo po “round robin” algoritmu: če polje vključuje D diskov, se enota i zapiše na “i mod D” disk.

 Primer:
– RAID z D diski v polju.
– RAID enota = 1 bit.
-Vsakih D zaporednih bitov se porazdeli na D diskov.
– Vsaka I/O operacija vključuje vseh D diskov.
– Najmanjša enota prenosa je 1 blok  vsaka I/O operacija prenese vsaj D blokov.
– Ker lahko beremo na vseh diskih paralelno, je pohitritev prenosa podatkov v primerjavi z enim diskom D-kratna.
– Dostopni čas se v primerjavi z enim diskom ne spremeni.
-Sledi: v primerjavi z enim diskom ne pridobimo bistveno.

 Primer:
– RAID z D diski v polju.
– RAID enota = 1 blok.

– Vsakih D zaporednih blokov se porazdeli na D diskov.
– I/O operacija velikosti 1 blok vključuje le 1 disk.
– Pri več zaporednih I/O operacijah dolžine 1 blok in pri pravilno porazdeljenih blokih lahko operacije izvajamo paralelno.
– Sledi:
 V primerjavi z enim diskom zmanjšamo povprečni dostopni čas I/O operacije.
 Če I/O operacija vključuje več zaporednih blokov, jo lahko procesiramo paralelno na več diskih.


RAID – redundanca podatkov…
 Z več diski se poveča učinkovitost sistema za shranjevanje, vendar zmanjša njegova zanesljivost.
 Primer:
– MTTF (mean-time-to-failure) enega diska ≈ 50.000 ur (5,7 let). Pri 100 diskih v polju znaša MTTF 50.000/100 ≈ 500ur (21 dni).
 Zanesljivost diskovnega polja povečamo z redundanco podatkov.
 Redundantnost lahko močno poveča MTTF.
.Pri odločitvi za redundanco podatkov je potrebno določiti:
– Kje bodo shranjeni redundantni podatki: na manjšem številu diskov ali bodo porazdeljeni po vseh diskih?
– Kako določiti redundantne podatke:
 večina diskovnih polj shranjuje podatke o pariteti (paritetna shema uporablja dodaten – redundanten disk za obnovo po nesrečah)
 Če dodamo prejšnjemu polju 100-ih diskov 10 diskov z redundantnimi podatki, naraste MTTF na več kot 250 let!!!
 Velik MTTF pomeni manjšo verjetnost za napako.

 Kako deluje paritetni bit?
Stopnje redundance…
 V RAID sistemu je diskovno polje razdeljeno na več kontrolnih skupin (reliability groups). Te se sestojijo iz:
– množice podatkovnih diskov in
– množice kontrolnih diskov.
 Število kontrolnih diskov je odvisno od stopnje redundance.

 Primer za obravnavo stopenj redundance:
– Količina podatkov za 4 diske
– Ena sama kontrolna skupina

 RAID 0: porazdeljen, brez redundance (Nonredundant)
– Uporablja porazdeljevanje podatkov za povečanje pasovne širine.
– Ne vzdržuje nobene redundantne informacije.
– PROBLEM: MTTF pada linearno s številom diskov v polju.
– PREDNOSTI: najvišja učinkovitost  ni potrebno vzdrževati nobenih redundantnih podatkov.
– Izraba prostora znaša 100% prostora na disku. V našem primeru rabimo za svoje podatke 4 diske.



 RAID 1: zrcaljen (Mirrored)
– Najdražja rešitev za polje diskov  vzdržujeta se dve kopiji podatkov na dveh diskih.
– Vsako pisanje bloka na disk vključuje pisanje na dva diska.
– Pisanje se ne izvede hkrati, ampak eno za drugo (zaradi primera nesreče med pisanjem).
– Branje lahko vključuje paralelno branje dveh različnih blokov iz dveh diskov. Branje se lahko dodeli na disk, ki ima najmanjši dostopni čas.
– Izraba prostora znaša 50%. V našem primeru potrebujemo 8 diskov (4 + 4).

 RAID 0+1: porazdeljen in zrcaljen
– Imenovan tudi RAID 01.
– Kombinira nivoja RAID 0 in RAID 1.

 RAID 1+0: zrcaljen in porazdeljen
– Imenovan tudi RAID 10.
– Kombinira nivoja RAID 1 in RAID 0.

 Druge stopnje redundance:
– Level 2: Error-Correction Codes
– Level 3: Bit-Interleaved Parity
– Level 4: Block-Interleaved Parity
– Level 5: Block-Interleaved Distributed Parity
– Level 6: P+Q Redundancy

Ni komentarjev:

Objavite komentar

Tu lahko podate svoje mnenje.
Če ste zapis označili kot pomanjkljiv, povejte kaj bi dodali.