Osnove
Splošno o podatkovnih bazah
Zgodovina shranjevanja podatkov
Datotečni sistem in SUPB
Opisovanje in shranjevanje podatkov v PB
Poizvedovanje v PB
Obvladovanje transakcij
Zgradba SUPB
Splošno o podatkovnih bazah (PB)
Stanje danes:
– Organizacije odvisne od zmožnosti pridobivanja natančnih in pravočasnih podatkov...
– Podatki predstavljajo konkurenčno prednost.
– Brez zmožnosti za upravljanje z velikimi količinami podatkov in zmožnosti za hitro iskanje ustreznih podatkov postanejo podatki breme za organizacijo.
– Paradoks: zaradi preveč informacij potrebujemo še več informacij
– Potrebujemo ustrezne mehanizme za upravljanje s podatki in učinkovito iskanje po njih podatkovne baze.
Definicija: Podatkovna baza je mehanizirana, večuporabniška, formalno definirana in centralno nadzorovana zbirka podatkov (glej [4,15]).
Sistemi za upravljanje s PB
Sistem za upravljanje s podatkovno bazo – SUPB je programska oprema za obvladovanje velikih količin podatkov.
Alternativa – shranjevanje v aplikaciji lastni obliki; problemi: neprenosljivost idr.
Obstaja veliko vrst SUPB. Omejili se bomo predvsem na relacijske ter omenili objektne.
Primeri SUPB: Oracle, Sybase, DB2, MS SQL, Ingres, Postgres, MySQL, ObjectStore, Jasmine, Objectivity/DB, Versant Object Database,...
Zgodovina shranjevanja podatkov
Zgodnja 60’: Charles Bachman iz General Electric-a razvije prvi splošno-namenski SUPB (Integrated Data Store).
– Predstavlja osnovo za mrežni podatkovni model, ki je predlagan za standard na konferenci za jezike podatkovnih sistemov (CODASYL).
– Za mrežni podatkovni model Bachman prejme Turingovo nagrado (ACM Turing Award - na področju računalniških znanosti ekvivalent Nobelove nagrade)
– Ima velik vpliv na razvoj SUPB-jev v 60’ letih.
–
Pozna 60’: IBM razvije Information Management System (IMS), ki se ponekod uporablja še danes.
– Predstavlja osnovo za hierarhični podatkovni model.
– American Airlines in IBM razvijeta sistem SABRE za rezervacije letalskih kart – sistem omogoča več uporabnikom dostop do skupnih podatkov preko mreže.
– Zanimivost: isti SABRE se še danes uporablja spletna potovalna agencija Travelocity.
70’ leta: Edgar Codd predlaga relacijski podatkovni mode (IBM).
– Razvije se mnogo relacijskih SUPB.
– Podatkovne baze postanejo akademsko področje. Razvije se izjemno močna teoretična podlaga.
– Codd dobi Turingovo nagrado za svoje delo.
– Relacijske Podatkovne baze postanejo standard za upravljanje s podatki v organizacijskih sistemih.
80’ leta: Relacijski model si še utrdi položaj kot SUPB.
– Razvije se SQL poizvedovalni jezik (IMB-ov projekt System R)
– SQL postane standardni jezik za izvajanje poizvedb v relacijski PB.
– SQL je bil standardiziran v poznih 80’ – SQL-92.
– Standard prevzamejo American National Standard Institute (ANSI) in International Standards Organization (ISO).
– Skrb za sočasen dostop do podatkov prevzame SUPB. Programerji programirajo, kot bi do podatkov dostopali samo oni. James Grey dobi za dosežke na tem področju Turingovo nagrado.
Pozna 80’ in 90’: veliko napredka na področju PB.
– Veliko raziskav se opravi na področju poizvedovalnih jezikov in bogatejših (razširjenih) podatkovnih modelov.
– Velik poudarek na kompleksnih analizah podatkov iz vseh področij organizacijskih sistemov.
– Veliko proizvajalcev SUPB-jev (IBM – DB2, Oracle 8, Informix UDS) razširi svoje sisteme s podporo novim podatkovnim tipom: slike, tekst in s podporo kompleksnejšim poizvedbam.
– Pojavijo se podatkovna skladišča, ki združujejo podatke iz več PB in omogočajo izvajanje specializiranih analiz (iskanje zakonitosti v podatkih).
– Pojavijo se ERP (enterprise resource planning) in MRP (management resource planning) paketi
Podpirajo skupne funkcije v poslovnih sistemih (npr. skladiščno poslovanje, planiranje človeških virov, finančne analize,...).
Predstavljajo obsežno aplikacijsko plast nad skupno PB.
Primeri: Baan, Oracle, PeopleSoft, SAP in Siebel.
Naslednja stopnja: vstop SUPB v svet Interneta
– Prva generacija spletnih mest shranjuje podatke v datotekah OS (operacijski sistem). Uporaba PB za shranjevanje podatkov, ki so dostopni preko Interneta, postaja vsakdanja.
Poizvedbe se generira preko spletnih form, odgovore pa se nazaj posreduje v obliki jezika HTML, za lažji prikaz v spletnem brskalniku.
– Vsi proizvajalci dodajajo svojim SUPB-jem možnosti za čim lažjo uporabo v spletu.
–
Najnovejša področja:
– Multimedijske PB,
– PB za interaktivni video,
– Digitalne knjižnice,
– Odločitveni sistemi, vrtanje po podatkih, odkrivanje zakonitosti
– Raziskovalni projekti:
Human Genome Project
GEOSS - The Global Earth Observation
System of Systems (GEOSS)
...
Datotečni sistemi in SUPB...
Omejitve datotečnih sistemov:
– Ločevanje in izolacija podatkov
Vsaka aplikacija obvladuje svoje podatke
V okviru ene aplikacije lahko dostopamo le do podatkov te aplikacije (ne vemo za razpoložljive podatke v drugih aplikacijah)
– Podvajanje podatkov
Podvajanje vnosa – iste podatke vnašamo večkrat in na več mest
Odvečna poraba prostora na disku ter potencialna možnost za neskladnost
Isti podatki podani v različnih oblikah
– Podatkovna odvisnost
Struktura podatkov je definirana v aplikaciji; sprememba v strukturi podatkov zahteva spremembo v aplikaciji
– Neskladnost med oblikami datotek
Aplikacije, napisane v različnih programskih jezikih, ne morejo enostavno dostopati do datotek drugih sistemov
Zaradi težav oziroma neučinkovitosti shranjevanja podatkov neposredno v datoteke, se pojavijo Sistemi za upravljanje s podatkovnimi bazami – SUPB.
Definicija: SUPB je skupek programske opreme, ki omogoča kreiranje, vzdrževanje in nadzor nad dostopom do podatkov v PB.
SUPB uporablja različne mehanizme za upravljanje s podatki:
– Kreiranje podatkovnih struktur je omogočeno z jezikom
DDL - Data Definition Language.
Omogoča definiranje podatkovnih struktur in tipov ter omejitev
Vse specifikacije so shranjene v PB (podatkovni slovar, sistemski katalog). Kreiranje tabele pomeni poseg v sistemski katalog.
– Vzdrževanje podatkov (Create, Insert, Update, Delete) izvajamo z uporabo jezika DML - Data Manipulation Language.
– Za izvajanje povpraševanja obstajajo povpraševalni jeziki (query language)
.SUPB zagotavlja nadzor nad dostopom do podatkov:
– Varnost: dostop do podatkov v skladu z avtorizacijo
– Skladnost: zagotavlja skladnost podatkov
– Sočasni dostop: zagotavlja in nadzira sočasni dostop
– Obnova: zagotavlja mehanizme za obnovo podatkov
Uporaba SUPB prinaša naslednje prednosti:
– Podatkovna neodvisnost: Programi so neodvisni od predstavitve podatkov in načina shranjevanja podatkov. SUPB zagotavlja abstrakcijo podatkov in ločuje programe od podrobnosti predstavitve podatkov.
– Učinkovit dostop do podatkov: SUPB zagotavlja tehnike za učinkovito hranjenje in dostop do podatkov.
– Varnost in integriteta podatkov: Če se do podatkov dostopa preko SUPB, se lahko uporabi omejitve, ki zagotavljajo skladnost podatkov.
– Administracija podatkov: Če so podatki shranjeni centralno, je upravljanje s podatki lažje.
– Sočasen dostop do podatkov in obnavljanje PB: SUPB razporeja sočasne dostope tako, da izgleda, kot da do podatkov dostopa en uporabnik.
– Skrajša čas razvoja programov: SUPB podpira številne mehanizme za dostop do podatkov.
Zaključek: SUPB prinaša veliko prednosti v primerjavi s hranjenjem podatkov neposredno v datotekah.
Obstajajo (redke) izjeme, ko uporaba SUPB ni primerna. Npr.:
– Za specializirane aplikacije (npr.: v realnem času) klasični SUPB niso primerni. Za te aplikacije se raje izdela namensko kodo za rokovanje s podatki.
– Če SUPB ne podpira dela s podatki na način, ki ga zahteva program.
Komponente SUPB
– Strojna oprema
– Programska oprema
– Podatki
– Postopki
– Ljudje
– Strojna oprema:
Podatkovni strežnik
Pomembna parametra za strežnik: hitri pomnilnik in diskovni prostor
Ostala strojna oprema
– Programska oprema:
SUPB, operacijski sistem, omrežna programska oprema
Različna sistemska oprema (razvojna orodja, orodja za dostop do podatkov)
Specializirane aplikacije
– Postopki
Načini prijave
Uporaba posameznih orodij
Zagon in zaustavitev podatkovne baze
Izdelava varnostnih kopij
Obvladovanje nesreč/okvar
– Ljudje, njihove vloge
Skrbnik podatkov
Skrbnik Podatkovne baze (DBA – Database Administrator)
Analitik, načrtovalec PB
Razvijalci aplikacij
Končni uporabniki (izkušeni, neizkušeni)
Opisovanje in shranjevanje podatkov v PB
Model, s katerim opišemo, kaj bi želeli hraniti ter kakšne povezave obstajajo med elementi, ki jih želimo hraniti, se imenuje podatkovni model.
Podatkovni model je način, kako na visoki ravni abstrakcije opišemo podatke, ki jih želimo hraniti ter skrijemo nepomembne podrobnosti.
Podatkovni model odraža uporabnikovo percepcijo realnega sveta. V resnici izraža uporabnikovo predstavo, kako naj bodo podatki shranjeni.
Podatkovni model
Logični podatkovni modeli
Logični podatkovni model je jezik, ki ga razume ciljni SUPB.
Poznamo več vrst logičnih modelov:
– Relacijski podatkovni model
Relacijski SUPB: DB2, Informix, Oracle, Sybase, MS Access,...
– Hierarhični podatkovni model (glej [4,181]).
Hierarhični SUPB: IBM-ov IMS
– Mrežni podatkovni model (glej [4,159]).
Mrežni SUPB: IDS in IDMS
– Objektni podatkovni model
Objektni SUPB: Objectstore, Versant,...
– Objektno-relacijski podatkovni model:
Hibridni SUPB: IBM, Informix, ObjectStore, Oracle, Versant,…
Tri-nivojska predstavitev podatkov...
Podatki so v PB opisani na treh ravneh:
– Zunanja shema
– Konceptualna ali logična shema
– Fizična shema
Tri-nivojska predstavitev podatkov...
Konceptualna ali logična shema
– Konceptualna shema opisuje podatke z vidika podatkovnega modela, ki ga PB uporablja. Npr.:
Podatki o entitetah (profesor, študent, predavalnica,...)
Podatki o povezavah (predava, posluša,...).
– Proces izdelave konceptualne sheme se
imenuje konceptualno ter logično
načrtovanje.
Tri-nivojska predstavitev podatkov...
Fizična shema:
– Fizična shema podaja podrobnosti o shranjevanju podatkov kako so podatki iz konceptualne sheme dejansko shranjene na sekundarnem pomnilniku: trdi disk, magnetni trakovi,...
– Odločiti se je potrebno, kakšno datotečno organizacijo bomo uporabili za shranjevanje podatkov in kreirati indeksne datoteke.
Proces izdelave fizične sheme se imenuje načrtovanje fizične PB.
Zunanja shema:
– Tudi zunanje sheme uporabljajo koncepte podatkovnega modela (gradnike konceptualne sheme).
– Zunanja shema se uporablja za dostop do podatkov, ki je prilagojen določenemu uporabniku ali skupini uporabnikov.
– Vsaka zunanja shema sestoji iz enega ali več pogledov (view) in entitet iz konceptualne sheme.
– Pogled je logična tabela, ki ne obstaja v fizični podatkovni bazi.
– Izdelava zunanjih shem se izvaja v sodelovanju z uporabniki –
zajemanje uporabniških zahtev.
Podatkovna neodvisnost...
Zelo pomembna lastnost SUPB je, da omogoča podatkovno neodvisnost - programi so neodvisni od načina shranjevanja in strukturiranja podatkov v PB.
Podatkovno neodvisnost dosežemo z uporabo tri-nivojske abstrakcije podatkov:
– Če se spremeni konceptualna shema, lahko zunanjo shemo priredimo tako, da pogledi ostanejo nespremenjeni logična podatkovna neodvisnost.
– Podobno konceptualna shema ločuje uporabnike od sprememb, ki se naredijo na fizični PB fizična podatkovna neodvisnost.
. Konceptualna shema skrije podrobnosti o tem, kako so podatki dejansko shranjeni na disku, o strukturi datotek in o indeksih.
Dokler ostaja konceptualna shema nespremenjena, spremembe na fizičnem nivoju ne vplivajo na programe, ki podatke uporabljajo.
Lahko pa spremembe vplivajo na učinkovitost.
Poizvedovanje v PB
Enostavnost pridobivanja informacij iz PB je ključna prednost SUPB za uporabnike.
Relacijske PB omogočajo uporabnikom postavljati enostavna vprašanja (poizvedbe), s katerimi pridobivajo podatke/informacije.
Poizvedbe se podaja v jeziku, ki je prirejen za opisovanje poizvedb – poizvedovalni jezik.
Relacijski model podpira zelo močne poizvedovalne jezike
Ena pomembnih nalog SUPB je optimizacija poizvedb, tako da se te čim hitreje izvedejo.
.Učinkovitost poizvedb je močno odvisna od načina, kako so podatki shranjeni v fizični obliki ter indeksirani.
SUPB omogoča uporabnikom izvajati poizvedbe ter kreirati in posodabljati vrednosti s pomočjo DML - Data Manipulation Language skupine ukazov iz jezika SQL.
DML skupina podpira ukaze za vstavljanje, brisanje in posodabljanje zapisov v tabelah.
Upravljanje s transakcijami
Transakcija predstavlja skupek ažuriranj, ki jih izvede transakcijski program.
Z vidika SUPB predstavlja transakcija osnovno enoto spremembe transakcija se mora izvesti cela ali nič.
Dve pomembni nalogi SUPB pri izvajanju transakcij:
– Zagotavljanje sočasnosti pri izvajanju transakcij in
– Obnavljanje PB po transakcijskih in sistemskih nesrečah (razveljavljanje, ponavljanje transakcij...).
Tipična zgradba SUPB
Funkcije posameznih enot SUPB:
– Stroj za evaluacijo poizvedb (Query Evaluation Engine)
Sintaktični analizator (Parser): Sintaktično analizira poizvedbo, ki jo SUPB-ju posreduje aplikacija.
Optimizator (Optimizer): Na podlagi informacij o tem, kako so podatki shranjeni, izdela učinkovit plan za izvajanje poizvedbe. Plan izvajanja predstavlja načrt za izvedbo poizvedbe in je ponavadi predstavljen kot drevo relacijskih operatorjev.
Evaluator operatorjev (Operator Evaluator): Na osnovi plana izvajanja analizira poizvedbo.
Izvajalec plana (Plan Executor): Izvede poizvedbo po navodilih plana poizvedbe.
Funkcije posameznih enot SUPB (nadaljevanje):
– Datoteke in metode dostopa (Files and Access Methods): enota, ki omogoča delo z datotekami.
– Upravljalec medpomnilnika (Buffer Manager): Prenaša strani iz diska v pomnilnik glede na bralne potrebe.
– Upravljalec prostora na disku (Disk Space Manager): Najnižji nivo SUPB je zadolžen za upravljanje z diskom. Vse operacije višjih plasti se tukaj prevedejo v nizko-nivojske ukaze za delo z diskom.
– Enota za nadzor sočasnosti (Concurrency Control):
Upravljalec transakcij (Transaction Manager): Zagotavlja zaseganje podatkov z uporabo določenih protokolov in skrbi za razporejanje izvajanja transakcij.
Upravljalec zaklepanja (Lock Manager): Vzdržuje informacije o zahtevanih in odobrenih zaseženih podatkov.
– Upravljalec obnove podatkov (Recovery Manager): Vzdržuje dnevnik in skrbi za obnavljanje sistema v zadnje skladno stanje pred nesrečo.
Shramba in indeksiranje podatkov
Diski in diskovna polja
Upravljanje z diskom in pomnilnikom
Organizacija datotek in indeksiranje
Indeksi na osnovi drevesne strukture
Hash-indeks
Komponente SUPB za delo s podatki
Podatki iz PB se hranijo na diskih (in trakovih).
Upravljalec prostora na disku (Disk Space Manager):
– enota, ki upravlja s prostorom na disku,
– ukaze v zvezi z zaseganjem in sproščanjem prostora na disku prejema od upravljavca z datotekami.
Upravljalec z datotekami (File Manager):
– zasega in sprošča prostor na disku v enotah – straneh.
– je odgovoren za upravljanje strani znotraj datoteke in za urejanje zapisov znotraj strani.
– Velikost strani je eden od parametrov SUPB. Tipično od 4KB od 8 KB.
Upravljalec medpomnilnika (Buffer manager):
– skrbi za prenos določene strani iz diska v področje v glavnem pomnilniku - medpomnilnik (buffer pool).
– stran, kjer je zapis, poišče upravljalec z datotekami. Prenos v medpomnilnik izvede upravljalec medpomnilnika.
Hierarhija pomnilnika
Drugi razlogi za shranjevanje podatkov na sekundarnem in terciarnem pomnilniku:
– 32 bitni naslovni prostor omogoča naslavljanje samo 232 = 4Gb podatkov ...
– podatki morajo biti obstojni (primarni pomnilnik se prazni…)
Stanje glede kapacitete in cene pomnilnikov se hitro spreminja. Najzanesljivejši viri informacij so spletne strani proizvajalcev, preizkuševalcev, trgovin...
Magnetni disk
Nekaj lastnosti:
– Magnetni disk omogoča neposreden dostop do želene lokacije na disku.
– Podatki na disku so shranjeni v enotah, imenovanih bloki.
– Blok predstavlja zaporedje bajtov in je najmanjša enota, ki se jo lahko bere iz ali piše na disk.
– Bloki so organizirani v koncentrične kroge, imenovane sledi.
– Sledi se nahajajo na eni ali obeh straneh magnetne plošče.
– Vsaka sled je razdeljena na odseke ali sektorje. Sektor je določen z diskom in ga ni mogoče spreminjati.
– Velikost bloka se določi pri formatiranju diska. Njegova velikost je mnogokratnik velikosti sektorja.
– Disk ima lahko več glav, ki se premikajo istočasno.
– Disk je z računalnikom povezan preko krmilnika. Krmilnik izvaja ukaze za branje in pisanje na disk in zagotavlja pravilnost izvajanja ukazov.
– Pri zapisovanju in branju sektorjev se računa kontrolka (checksum)
– Tipična velikost plošč: 3.5 inčev.
Čas, potreben za dostop do želene lokacije (povprečni dostopni čas):
– iskalni čas (premik glave na ustrezno sled)
– rotacijska zakasnitev (čakalni čas, da se ustrezen blok na sledi zavrti do glave). Povprečno znaša polovico časa rotacije in je manjši od iskalnega časa.
– čas prenosa (dejanski prenos bloka – branje ali pisanje).
Primerjava:
– Dostopni čas RAM-a ≈ 10ns
– Dostopni čas diska ≈ 10ms.
Magnetni disk
Organizacija podatkov na disku je pomembna – vpliva na učinkovitost SUPB:
– podatki se morajo pred uporabo prenesti v glavni pomnilnik,
– najmanjša enota podatkov, ki se bere ali piše na disk, je blok.
– Čas za pisanje ali branje podatkov je odvisen od položaja podatkov na disku: dostopni čas=iskalni čas + rotacijska zakasnitev + čas prenosa.
– Čas, ki ga SUPB porabi za prenos podatkov, je navadno večji kot čas, potreben za obdelavo določenega podatka.
– Podatke je potrebno ustrezno razporediti po disku!!!.
Polje diskov
Disk predstavlja potencialno ozko grlo za učinkovitost SUPB in vpliva na zanesljivost delovanja sistema.
Učinkovitost CPU raste hitreje kot učinkovitost diskov:
– CPU: 50% na leto
– Diski: 10% na leto
Diski vsebujejo mehanske elemente verjetnost za napake večja kot pri notranjem pomnilniku.
Odpoved diska lahko pomeni katastrofo.
Možna rešitev: polje diskov (disk array).
Polje diskov
Polje diskov je povezava več diskov, organiziranih tako, da
– povečajo učinkovitost in
– izboljšajo zanesljivost.
Učinkovitost povečamo s porazdelitvijo podatkov (data striping):
– podatke se porazdeli po več diskih
Zanesljivost povečamo z redundanco podatkov:
– Zapisuje se dodatne (redundantne) podatke ali pa se podatke podvaja. V primeru napake omogoča obnovo podatkov.
RAID
Diskovna polja, ki implementirajo porazdelitev in podvajanje podatkov imenujejo “Redundant Arrays of Independent Disks” – RAID.
Poznamo več vrst RAID.
Razlikujejo se po kompromisu med učinkovitostjo in zanesljivostjo.
RAID s porazdelitvijo podatkov:
– Uporabniku se kaže kot zelo velik disk.
– Podatki se razdelijo na enake enote (striping units), ki se zapišejo na več diskov. Vsaka enota na en disk.
– Enote se po diskih distribuirajo po “round robin” algoritmu: če polje vključuje D diskov, se enota i zapiše na “i mod D” disk.
Primer:
– RAID z D diski v polju.
– RAID enota = 1 bit.
-Vsakih D zaporednih bitov se porazdeli na D diskov.
– Vsaka I/O operacija vključuje vseh D diskov.
– Najmanjša enota prenosa je 1 blok vsaka I/O operacija prenese vsaj D blokov.
– Ker lahko beremo na vseh diskih paralelno, je pohitritev prenosa podatkov v primerjavi z enim diskom D-kratna.
– Dostopni čas se v primerjavi z enim diskom ne spremeni.
-Sledi: v primerjavi z enim diskom ne pridobimo bistveno.
Primer:
– RAID z D diski v polju.
– RAID enota = 1 blok.
– Vsakih D zaporednih blokov se porazdeli na D diskov.
– I/O operacija velikosti 1 blok vključuje le 1 disk.
– Pri več zaporednih I/O operacijah dolžine 1 blok in pri pravilno porazdeljenih blokih lahko operacije izvajamo paralelno.
– Sledi:
V primerjavi z enim diskom zmanjšamo povprečni dostopni čas I/O operacije.
Če I/O operacija vključuje več zaporednih blokov, jo lahko procesiramo paralelno na več diskih.
RAID – redundanca podatkov…
Z več diski se poveča učinkovitost sistema za shranjevanje, vendar zmanjša njegova zanesljivost.
Primer:
– MTTF (mean-time-to-failure) enega diska ≈ 50.000 ur (5,7 let). Pri 100 diskih v polju znaša MTTF 50.000/100 ≈ 500ur (21 dni).
Zanesljivost diskovnega polja povečamo z redundanco podatkov.
Redundantnost lahko močno poveča MTTF.
.Pri odločitvi za redundanco podatkov je potrebno določiti:
– Kje bodo shranjeni redundantni podatki: na manjšem številu diskov ali bodo porazdeljeni po vseh diskih?
– Kako določiti redundantne podatke:
večina diskovnih polj shranjuje podatke o pariteti (paritetna shema uporablja dodaten – redundanten disk za obnovo po nesrečah)
Če dodamo prejšnjemu polju 100-ih diskov 10 diskov z redundantnimi podatki, naraste MTTF na več kot 250 let!!!
Velik MTTF pomeni manjšo verjetnost za napako.
Kako deluje paritetni bit?
Stopnje redundance…
V RAID sistemu je diskovno polje razdeljeno na več kontrolnih skupin (reliability groups). Te se sestojijo iz:
– množice podatkovnih diskov in
– množice kontrolnih diskov.
Število kontrolnih diskov je odvisno od stopnje redundance.
Primer za obravnavo stopenj redundance:
– Količina podatkov za 4 diske
– Ena sama kontrolna skupina
RAID 0: porazdeljen, brez redundance (Nonredundant)
– Uporablja porazdeljevanje podatkov za povečanje pasovne širine.
– Ne vzdržuje nobene redundantne informacije.
– PROBLEM: MTTF pada linearno s številom diskov v polju.
– PREDNOSTI: najvišja učinkovitost ni potrebno vzdrževati nobenih redundantnih podatkov.
– Izraba prostora znaša 100% prostora na disku. V našem primeru rabimo za svoje podatke 4 diske.
RAID 1: zrcaljen (Mirrored)
– Najdražja rešitev za polje diskov vzdržujeta se dve kopiji podatkov na dveh diskih.
– Vsako pisanje bloka na disk vključuje pisanje na dva diska.
– Pisanje se ne izvede hkrati, ampak eno za drugo (zaradi primera nesreče med pisanjem).
– Branje lahko vključuje paralelno branje dveh različnih blokov iz dveh diskov. Branje se lahko dodeli na disk, ki ima najmanjši dostopni čas.
– Izraba prostora znaša 50%. V našem primeru potrebujemo 8 diskov (4 + 4).
RAID 0+1: porazdeljen in zrcaljen
– Imenovan tudi RAID 01.
– Kombinira nivoja RAID 0 in RAID 1.
RAID 1+0: zrcaljen in porazdeljen
– Imenovan tudi RAID 10.
– Kombinira nivoja RAID 1 in RAID 0.
Druge stopnje redundance:
– Level 2: Error-Correction Codes
– Level 3: Bit-Interleaved Parity
– Level 4: Block-Interleaved Parity
– Level 5: Block-Interleaved Distributed Parity
– Level 6: P+Q Redundancy
četrtek, 1. april 2010
Naročite se na:
Objavi komentarje (Atom)
Ni komentarjev:
Objavite komentar
Tu lahko podate svoje mnenje.
Če ste zapis označili kot pomanjkljiv, povejte kaj bi dodali.