Discussione:
RAID5 + HS o Raid6
(troppo vecchio per rispondere)
l***@gmail.com
2009-04-11 08:46:29 UTC
Permalink
Dunque, mi deve arrivare un serverino con 5 dischi da 146GB.
Meglio fare Raid 5 + 1 hotspare o fare un raid 6?

Sia come performance, sia come sicurezza.

Se non erro, il raid 5 salva la parità sia su ogni disco, sia su un
disco dedicato.
Per cui perdita dei dati si avrebbe solo nel caso si rompesse il disco
di parita contestualmente ad un altro disco della catena. In tal caso
non sarebbe più possibile ricostruire i dati.

Se si rompe solo la parità, dovrei essere protetto. Se si rompe un
disco, dovrei essere protetto ugualmente: i dati sarebbero ricostruiti
dal disco di parità.

Aggiungendo un HS dovrei avere ridondanza maggiore.

Un raid6, con doppia parità, è più sicuro? Dovrebbe però essere meno
performante dato che la parità va scritta su due dischi anzichè 1.

Un vantaggio però potrebbe essere quello di avere il disco di
emergenza subito attivo, nel caso di hotspare invece, esso entrerebbe
in funzione solo con il guasto di uno dei dischi della catena ed in
tal caso bisogna ricostruire tutti i dati sopra di esso e nulla
impedisce che si possa rompere un secondo disco prima che la
ricostruzione del disco hotspare abbia avuto termine.

Che consigliate?
Skull
2009-04-11 08:54:03 UTC
Permalink
Post by l***@gmail.com
Che consigliate?
Per dischi da 146GB non è un grosso problema, e le due soluzioni sono
sostanzialmente coincidenti. Al limite c'è la considerazione che il
disco HS potrebbe rivelarsi non funzionante giusto quando serve, dato
che sta fermo per parecchio tempo, mentre in RAID6 lo stai usando e se
si deve scassare si scassa. Ma statisticamente penso che siamo sullo
stesso piano, perlopiù.

Per dischi di capacità maggiore (750GB, 1TB ecc) particolarmente se SATA
(e quindi più lenti) molto più consigliabile il RAID6: un disco da 1TB
per esser riallineato può impiegare anche una giornata, e se l'array è
in RAID5, sei per tutto quel tempo con il culo alla finestra...
--
http://bofhskull.wordpress.com/
l***@gmail.com
2009-04-11 09:04:46 UTC
Permalink
Post by Skull
Per dischi da 146GB non è un grosso problema, e le due soluzioni sono
sostanzialmente coincidenti. Al limite c'è la considerazione che il
disco HS potrebbe rivelarsi non funzionante giusto quando serve, dato
che sta fermo per parecchio tempo, mentre in RAID6 lo stai usando e se
si deve scassare si scassa. Ma statisticamente penso che siamo sullo
stesso piano, perlopiù.
Sono dischi sas (considerate le dimensioni) da 15k rpm per cui anche
un
raid6 non dovrebbe farmi notare così tanto il calo prestazionale.
Credo sia meglio optare per un raid6, se la PERC me lo fa fare.
Così, come dici te, se il disco si spacca me ne accorgo, se invece il
disco è difettoso o per qualche strano motivo si spacca quando è in
hot-spare
rischio di ritrovarmi giustamente con il raid non "ridondabile"
proprio sul più
bello, ovvero a Natale, in piena notte.
Post by Skull
Per dischi di capacità maggiore (750GB, 1TB ecc) particolarmente se SATA
(e quindi più lenti) molto più consigliabile il RAID6: un disco da 1TB
per esser riallineato può impiegare anche una giornata,
Quindi confermi quello che dicevo sopra...
Grazie.
Post by Skull
e se l'array è
in RAID5, sei per tutto quel tempo con il culo alla finestra...
Pronto ad essere spinto di sotto, o a prendere freddo?!?
Piergiorgio Sartor
2009-04-11 09:00:46 UTC
Permalink
Post by l***@gmail.com
Dunque, mi deve arrivare un serverino con 5 dischi da 146GB.
Meglio fare Raid 5 + 1 hotspare o fare un raid 6?
Sia come performance, sia come sicurezza.
Se non erro, il raid 5 salva la parità sia su ogni disco, sia su un
disco dedicato.
No, il RAID-5 salva *una* parita`, sparpagliata
su tutti i dischi.
Post by l***@gmail.com
Per cui perdita dei dati si avrebbe solo nel caso si rompesse il disco
di parita contestualmente ad un altro disco della catena. In tal caso
non sarebbe più possibile ricostruire i dati.
No, il RAID-5 ti protegge dalla rottura di un
solo disco qualsiasi.
Post by l***@gmail.com
Se si rompe solo la parità, dovrei essere protetto. Se si rompe un
disco, dovrei essere protetto ugualmente: i dati sarebbero ricostruiti
dal disco di parità.
No, vedi sopra... :-)
Post by l***@gmail.com
Aggiungendo un HS dovrei avere ridondanza maggiore.
No, nessuna ridondanza, con un HS, in caso di
rottura di un disco, inizia automaticamente la
ricostruzione dell'array.
Durante il tempo di ricostruzione l'array e`
vulnerabile alla rottura di un altro disco.
Post by l***@gmail.com
Un raid6, con doppia parità, è più sicuro? Dovrebbe però essere meno
performante dato che la parità va scritta su due dischi anzichè 1.
Un RAID-6 ti protegge dalla rottura di due dischi,
le prestazioni sono simili. Credo che un RAID-6
con "n+1" dischi vada, in lettura, come un RAID-5
con "n" dischi.
Post by l***@gmail.com
Un vantaggio però potrebbe essere quello di avere il disco di
emergenza subito attivo, nel caso di hotspare invece, esso entrerebbe
in funzione solo con il guasto di uno dei dischi della catena ed in
tal caso bisogna ricostruire tutti i dati sopra di esso e nulla
impedisce che si possa rompere un secondo disco prima che la
ricostruzione del disco hotspare abbia avuto termine.
Esatto.
Post by l***@gmail.com
Che consigliate?
Personalmente preferisco RAID-6, anche se con 6
dischi ha un overhead "visibile".
Infatti avrai la capacita` di 4 dischi.
D'altro canto un RAID-5 con HS in 6 dischi ha lo
stesso overhead, con meno sicurezza.

bye,
--
piergiorgio
bio
2009-04-11 12:30:45 UTC
Permalink
Post by l***@gmail.com
Dunque, mi deve arrivare un serverino con 5 dischi da 146GB.
Meglio fare Raid 5 + 1 hotspare o fare un raid 6?
Con soli 5 dischi spezzerei una lancia a favore di RAID 10. La
perdita di spazio e' contenuta, affidabilita' e disponibilita'
sono quasi come il 6 (anche meglio, se puoi usare il quinto hd
come hot-spare) e le prestazioni sono nettamente migliori. Non
hai detto la destinazione d'uso, quindi vedi tu (ovviamente).


Fabio
pier
2009-04-11 12:41:28 UTC
Permalink
Con soli 5 dischi spezzerei una lancia a favore di RAID 10. La perdita
di spazio e' contenuta, affidabilita' e disponibilita' sono quasi come
il 6 (anche meglio, se puoi usare il quinto hd come hot-spare) e le
prestazioni sono nettamente migliori.
Anche io concordo sul 10...con un solo disco in piu' guadagni in tutto
(prestazioni ed affidabilita').

Pier
l***@gmail.com
2009-04-11 13:03:59 UTC
Permalink
Post by bio
Con soli 5 dischi spezzerei una lancia a favore di RAID 10. La
perdita di spazio e' contenuta, affidabilita' e disponibilita'
sono quasi come il 6 (anche meglio, se puoi usare il quinto hd
come hot-spare) e le prestazioni sono nettamente migliori. Non
hai detto la destinazione d'uso, quindi vedi tu (ovviamente).
purtroppo ho solo 5 dischi da 146 e con un raid10 otterrei solo 350
giga di spazio.
non che mi serva tutto ma con 10 o 15 macchine virtuali ad uso interno
lo spazio potrebbe scarseggiare.

non so, potrei fare raid 10 con hotspare ed eventualmente convertire
in raid5 se finisco lo spazio. devo valutare.
rimarrebbe però il fattore sfiga con l'hotspare se muore sul più
bello.

piuttosto, meglio raid10 o raid1 con lvm? presumo raid, così facendo
la controller raid si occupa di fare tutto ed il kernel fa altro senza
pensare ad lvm.

l'uso, come detto, è un nodo xen per visualizzare circa 15 server ad
uso nostro, non di clienti.
in futuro finirà in un pool xen con san esterna.
THe_ZiPMaN
2009-04-13 00:01:00 UTC
Permalink
Post by bio
affidabilita' e disponibilita'
sono quasi come il 6 (anche meglio, se puoi usare il quinto hd
come hot-spare)
Affidabilità e disponibilità non sono mai pari o migliori del raid 6, per
nessun livello di raid. Il raid 10 protegge (deterministicamente) sempre e
comunque solo dal fail di un disco.
--
Flavio Visentin

Scientists have finally discovered what's wrong with the female brain:
On the left side, there is nothing right, and on the right side, there
is nothing left.
l***@gmail.com
2009-04-13 08:43:02 UTC
Permalink
Post by THe_ZiPMaN
Affidabilità e disponibilità non sono mai pari o migliori del raid 6, per
nessun livello di raid. Il raid 10 protegge (deterministicamente) sempre e
comunque solo dal fail di un disco.
Già, bisogna però valutare quanto tempo impiega lo spare ad
entrare in funzione, perchè in quel lasso di tempo, si potrebbe
rompere
un secondo disco.

Comunque, il raid 10 protegge dalla rottura di 2 dischi, uno per ogni
raid1...
L'importante è che i dischi si spacchino alternati, ovvero 1 disco nel
primo raid1 ed
1 disco nel secondo raid1. Che dici, se metto una etichetta sopra il
disco con scritto:
"non ti rompere" lui mi ascolta?

Le differenze prestazionali sono così visibili tra raid 10 e raid 6?
Lem Novantotto
2009-04-13 09:10:28 UTC
Permalink
Post by l***@gmail.com
Comunque, il raid 10 protegge dalla rottura di 2 dischi, uno per ogni
raid1...
Occhio, però: AFAIK il raid10 è cosa diversa dal raid1+0 e dal raid0+1...
http://en.wikipedia.org/wiki/Non-standard_RAID_levels#Linux_MD_RAID_10
--
Bye, Lem
Ceterum censeo ISLAM esse delendum
____________________________________________________________________________
Non sprecare i cicli idle della tua CPU: http://boinc.berkeley.edu/index.php
Piergiorgio Sartor
2009-04-13 16:23:12 UTC
Permalink
Post by l***@gmail.com
Post by THe_ZiPMaN
Affidabilità e disponibilità non sono mai pari o migliori del raid 6, per
nessun livello di raid. Il raid 10 protegge (deterministicamente) sempre e
comunque solo dal fail di un disco.
Già, bisogna però valutare quanto tempo impiega lo spare ad
entrare in funzione, perchè in quel lasso di tempo, si potrebbe
rompere
un secondo disco.
Lo spare? Un RAID-6 non ha spare di suo (lo puo`
avere, ovviamente), semplicemente ha una doppia
ridondanza, per cui con uno o due dischi fuori
uso continua a funzionare senza problemi.
Post by l***@gmail.com
Le differenze prestazionali sono così visibili tra raid 10 e raid 6?
Non credo, ma c'e` da dire anche che aggiungere un
disco ad un RAID-6, per aumentarne la capacita`, e`
possibile, ma per un RAID-10 potrebbe essere piu`
difficile, se non impossibile.

bye,
--
piergiorgio
l***@gmail.com
2009-04-13 20:01:57 UTC
Permalink
On 13 Apr, 18:23, Piergiorgio Sartor
Post by Piergiorgio Sartor
Lo spare? Un RAID-6 non ha spare di suo (lo puo`
avere, ovviamente), semplicemente ha una doppia
ridondanza, per cui con uno o due dischi fuori
uso continua a funzionare senza problemi.
Io parlavo di raid10 con spare.
Non di raid6, che, ovviamente, non ha spare.
Piergiorgio Sartor
2009-04-13 20:41:15 UTC
Permalink
Post by l***@gmail.com
Io parlavo di raid10 con spare.
Ah! Avevo capito male io, allora.
Post by l***@gmail.com
Non di raid6, che, ovviamente, non ha spare.
Sai, c'e` gente che confonde RAID-6 con RAID-5 + HS,
oppure con RAID-5E/EE...

bye,
--
piergiorgio
l***@gmail.com
2009-04-13 20:51:57 UTC
Permalink
On 13 Apr, 22:41, Piergiorgio Sartor
Post by Piergiorgio Sartor
oppure con RAID-5E/EE...
E che diavolo è?
Mai sentito.
THe_ZiPMaN
2009-04-13 21:05:39 UTC
Permalink
Post by l***@gmail.com
Post by Piergiorgio Sartor
oppure con RAID-5E/EE...
E che diavolo è?
Mai sentito.
Su wikipedia è spiegato. E' un raid di IBM che è un raid 5 con "hot spare
distribuito".
--
Flavio Visentin

Scientists have finally discovered what's wrong with the female brain:
On the left side, there is nothing right, and on the right side, there
is nothing left.
Piergiorgio Sartor
2009-04-13 21:09:22 UTC
Permalink
Post by l***@gmail.com
Post by Piergiorgio Sartor
oppure con RAID-5E/EE...
E che diavolo è?
Mai sentito.
RAID-5E e` un RAID-5 in cui alla fine di
ogni HD c'e` abbastanza libero totale da
poter essere usato come "spare" in caso
che un disco si rompa.
RAID-5EE e` un RAID-5 in cui lo spazio
libero, sempre sufficiente per rimpiazzare
un disco, e` distribuito fra i vari HD,
come la parita`.

Quindi un RAID-5E/EE ha la capacita` di n-2
HD, come per un RAID-6.

La differenza con un RAID-5 + HS e` che i
dischi sono sempre tutti in uso, quindi si
e` sicuri (?) che in caso di rottura di uno
lo spazio sostitutivo sia gia` in funzione.

http://www.snia.org/tech_activities/standards/curr_standards/ddf/SNIA-DDFv1.2.pdf

bye,
--
piergiorgio
Piergiorgio Sartor
2009-04-13 21:14:22 UTC
Permalink
Post by Piergiorgio Sartor
ogni HD c'e` abbastanza libero totale da
eh? "...abbastanza *spazio* libero..."

bye,
--
piergiorgio
pier
2009-04-13 09:10:55 UTC
Permalink
Post by THe_ZiPMaN
Affidabilità e disponibilità non sono mai pari o migliori del raid 6,
per nessun livello di raid. Il raid 10 protegge (deterministicamente)
sempre e comunque solo dal fail di un disco.
Il raid 10 protegge dal fail di un disco di ogni mirror.
Un raid 10 di 8 dischi, se tutto va bene, protegge fino a 4 dischi andati.
Col raid 1 volendo si possono fare n-level raid 1 (comune e' il triple
mirror).
Il raid 5 era nato per dare una soluzione meno costosa ma quasi simile al
raid 1 ai tempi in cui i dischi costavano parecchio...il raid 6 per
aggiungere un po' piu' di affidabilita' al raid5.

Pier
THe_ZiPMaN
2009-04-13 10:37:31 UTC
Permalink
Post by pier
Post by THe_ZiPMaN
Affidabilità e disponibilità non sono mai pari o migliori del raid 6,
per nessun livello di raid. Il raid 10 protegge (deterministicamente)
sempre e comunque solo dal fail di un disco.
se tutto va bene,
Ecco che quindi "se tutto non va bene" protegge solo dalla rottura di UN
disco. E visto che già in DUE occasioni ho visto le cose non andare bene
posso garantirti che il Raid10 non è assolutamante equivalente al Raid 6

In un caso per esempio erano erano due raid1+0 con dischi EIDE IBM DLTA da
60GB, quella famosissima serie di dischi che avevano un difetto di
fabbricazione.

Il raid 10 è da implementarsi solo dove servono le migliori prestazioni che
può garantire, in tutti gli altri casi non offre vantaggi tangibili rispetto
al raid 5 o al raid 6, ma comporta perdite di spazio considerevoli.
Post by pier
Col raid 1 volendo si possono fare n-level raid 1 (comune e' il triple
mirror).
In quel caso saresti realmente protetto dal guasto di più di un disco, ma al
prezzo di una perdita di spazio realmente eccessiva.
Post by pier
Il raid 5 era nato per dare una soluzione meno costosa ma quasi simile al
raid 1 ai tempi in cui i dischi costavano parecchio...il raid 6 per
aggiungere un po' piu' di affidabilita' al raid5.
Beh, mica solo un po'. Raid 5 andati a puttane per la rottura di due dischi
ne ho visti diversi (la maggior parte delle volte per incuria, ma anche
quello fa parte del gioco).
Un raid6 invece è molto più resistente, perché le probabilità che si rompano
3 dischi nel tempo che ci impieghi a sostituire e ricostruire uno dei dischi
guasti sono veramente bassissime. È più probabile che ti si sputtani lo
storage per qualche altro motivo (a me è si è corrotto tutto per un banale
Gbic andato a donne di facili costumi, ma non abbastanza :-) )
Le performance dei due oggigiorno sono praticamente identiche, almeno su
storage.
--
Flavio Visentin

Scientists have finally discovered what's wrong with the female brain:
On the left side, there is nothing right, and on the right side, there
is nothing left.
l***@gmail.com
2009-04-13 15:20:22 UTC
Permalink
Post by THe_ZiPMaN
Le performance dei due oggigiorno sono praticamente identiche, almeno su
storage.
A be, allora vado con un raid6....
Ci devono girare 10-15-20 VM, preferisco avere affidabilità...
pier
2009-04-13 17:25:23 UTC
Permalink
Post by THe_ZiPMaN
Ecco che quindi "se tutto non va bene" protegge solo dalla rottura di UN
disco. E visto che già in DUE occasioni ho visto le cose non andare bene
posso garantirti che il Raid10 non è assolutamante equivalente al Raid 6
Beh...se le cose non vanno bene c'e'pure il caso della corruzione dei
dati in un raid 5 o 6 (che non tutti i controller riescono a gestire).
A voler vedere bene l'unico che garantisce una affidabilita' certa e' il
raid 1 (magari multi level).
Post by THe_ZiPMaN
Il raid 10 è da implementarsi solo dove servono le migliori prestazioni
che può garantire, in tutti gli altri casi non offre vantaggi tangibili
rispetto al raid 5 o al raid 6, ma comporta perdite di spazio
considerevoli.
Post by pier
Col raid 1 volendo si possono fare n-level raid 1 (comune e' il triple
mirror).
In quel caso saresti realmente protetto dal guasto di più di un disco,
ma al prezzo di una perdita di spazio realmente eccessiva.
Dipende sempre da quello che si vuole ottenere...non esiste una cosa
migliore di un'altra, ma una cosa migliore di un'altra in un determinato
caso.
Se si vuole ottenenere un minimo di affidabilita' senza sacrificare lo
spazio e i costi, il raid 5 o meglio il 6 va benissimo.
Se si vuole avere a tutti i costi una affidabilita' assoluta il raid 1
multi level e' sicuramente il migliore, sacrificando pero' sia i costi
sia lo spazio.
Un buon compromesso di solito e' il 10...ottime prestazioni, buona
affidabilita' e tutto sommato spazio sacrificato minore del raid 1 multi
level.
Post by THe_ZiPMaN
Un raid6 invece è molto più resistente, perché le probabilità che si
rompano 3 dischi nel tempo che ci impieghi a sostituire e ricostruire
uno dei dischi guasti sono veramente bassissime. È più probabile che ti
si sputtani lo storage per qualche altro motivo (a me è si è corrotto
tutto per un banale Gbic andato a donne di facili costumi, ma non
abbastanza :-) )
Io su uno storage di 16 dischi su cui abbiamo raid 6 da 7 tera mi
preoccupo' un po' ;)
Su storage piu' grandi...se dovessi fare il 6 almeno almeno due dischi
hot spare ce li metterei (e punterei ad avere il controller ridondante:-)
).
Post by THe_ZiPMaN
Le performance dei due oggigiorno sono praticamente
identiche, almeno su storage.
Da mie prove veloci, su una stessa macchina con dischi sas da 10k, la
differenza fra il raid 5 e il 10 era di circa 10mbyte/s in scrittura
sequenziale e un migliaio di IOPS in random (entrambi a favore del 10).
Dipende sempre di cosa uno ha bisogno.

Pier
THe_ZiPMaN
2009-04-13 17:46:17 UTC
Permalink
Post by pier
Io su uno storage di 16 dischi su cui abbiamo raid 6 da 7 tera mi
preoccupo' un po' ;)
E di cosa ti preoccupi??? Se hai gli alert in caso di guasto di un disco non
sussiste alcun problema; in 4 ore ti arriva il disco nuovo e in qualche ora
lo ricostruisce. Se se ne rompre un altro sei comunque protetto. E non
dimentichiamo che esiste sempre il backup di cui il raid non è un sostituto.

Se ci si preoccupa oggi cosa bisognava dire quando per avere 20TB di spazio
disco si usavano batterie di *migliaia* di dischi da 9GB e di cui se ne
rompevano almeno 3/4 al giorno?
Post by pier
Su storage piu' grandi...se dovessi fare il 6 almeno almeno due dischi
hot spare ce li metterei
Sarebbe solo un inutile spreco di spazio. Le comuni pratiche di
dimensionamento degli storage, per volumi raid 5, prevedono un disco di
HotSpare ogni 12-16 dischi, ovvero circa uno per cassetto. Con Raid 6 è
sufficiente un disco di HS ogni 30-40 dischi, ovvero ogni 3 cassetti.
Averne di più è solo un costo di acquisto non sfruttato.
Post by pier
(e punterei ad avere il controller ridondante:-) ).
Il controller ridondante viene ben prima dell'Hot Spare su raid 6.
Se non c'è il controller ridondante tanto vale non prendere uno storage ma
affidarsi ad un banale server con un po' di slot per dischi. Penso di non
aver mai visto dal vivo in vita mia uno storage con singolo controller.
E' un controsenso.
Post by pier
Post by THe_ZiPMaN
Le performance dei due oggigiorno sono praticamente
identiche, almeno su storage.
Da mie prove veloci, su una stessa macchina con dischi sas da 10k, la
differenza fra il raid 5 e il 10 era di circa 10mbyte/s in scrittura
La differenza era tra raid 5 e raid 6. Ovvio che un raid 10 sia più veloce
di entrambi. C'è anche da dire che su storage decente le differenze sono
pressoché nulle data la presenza di abbondante cache.
--
Flavio Visentin

Scientists have finally discovered what's wrong with the female brain:
On the left side, there is nothing right, and on the right side, there
is nothing left.
l***@gmail.com
2009-04-13 20:08:31 UTC
Permalink
Post by THe_ZiPMaN
Il controller ridondante viene ben prima dell'Hot Spare su raid 6.
Se non c'è il controller ridondante tanto vale non prendere uno storage ma
affidarsi ad un banale server con un po' di slot per dischi. Penso di non
aver mai visto dal vivo in vita mia uno storage con singolo controller.
E' un controsenso.
Quoto.
Spendere quella cifra (una qualsiasi, tanto di storage di parte da
almeno 5k euro) per non
avere nemmeno ridondanza non ha senso.
Meglio fare due server con drbd, se proprio butta male.
Si spende la metà e si è ridondati. E non serve, forse, nemmeno
l'hotspare dato che drbd stesso
sostituisce il disco rotto con la sua controparte dall'altra parte del
cluster.

Quasi quasi, con drbd non serve nemmeno un raid5, basterebbe un raid0/
lvm per i motivi di cui sopra.
Ma i costi di un raid 5 sono talmente bassi oggigiorno (giusto 1 disco
'buttato via') che non avrebbe senso
non farlo.
Post by THe_ZiPMaN
La differenza era tra raid 5 e raid 6. Ovvio che un raid 10 sia più veloce
di entrambi. C'è anche da dire che su storage decente le differenze sono
pressoché nulle data la presenza di abbondante cache.
(esco un po dal topic, ma su un cluster drbd, l'equivalente della
cache dei controller degli storage, è la RAM?
Non si può usare la ram come cache? Magari con qualche modulo del
kernel o qualche applicativo da installare...
E' una cosa che non ho mai provato a fare ma sarei curioso di sapere
se fosse possibile)
THe_ZiPMaN
2009-04-13 21:13:02 UTC
Permalink
Post by l***@gmail.com
Post by THe_ZiPMaN
La differenza era tra raid 5 e raid 6. Ovvio che un raid 10 sia più veloce
di entrambi. C'è anche da dire che su storage decente le differenze sono
pressoché nulle data la presenza di abbondante cache.
(esco un po dal topic, ma su un cluster drbd, l'equivalente della
cache dei controller degli storage, è la RAM?
Sì.
Post by l***@gmail.com
Non si può usare la ram come cache?
Viene *sempre* usata come cache. Se il sistema è usato come storage però mi
pare si possa fare un po' di tuning sull'uso della cache e della RAM da
parte del kernel.
--
Flavio Visentin

Scientists have finally discovered what's wrong with the female brain:
On the left side, there is nothing right, and on the right side, there
is nothing left.
ValeRyo Saeba
2009-04-14 10:50:01 UTC
Permalink
Post by l***@gmail.com
(esco un po dal topic, ma su un cluster drbd, l'equivalente della
cache dei controller degli storage, è la RAM?
Si, essendo visto come disco locale anche in modalità diskless.
--
ValeRyo
CBR600F "Cerbero" - http://www.slimmit.com/go.asp?6YT
GamerTag: Loading Image...
Sam
2009-04-14 10:32:42 UTC
Permalink
Post by THe_ZiPMaN
Se ci si preoccupa oggi cosa bisognava dire quando per avere 20TB di spazio
disco si usavano batterie di *migliaia* di dischi da 9GB e di cui se ne
rompevano almeno 3/4 al giorno?
Non pensavo che si arrivasse a mettere assieme un numero così elevato di
dischi in un unico storage, ma che i dati venissero suddivisi su più storage
separati (sono abituato ad avere come clienti ditte medio-piccole, per cui
certe esigenze non si sono mai poste). Hai qualche link di questi mega
storage giusto per curiosità?
Mi sono sempre chiesto come gestiscano ad esempio banche o simili le grosse
quantità di dati e soprattutto garantire che neanche una transazione venga
persa.
THe_ZiPMaN
2009-04-14 10:46:17 UTC
Permalink
Post by Sam
Non pensavo che si arrivasse a mettere assieme un numero così elevato di
dischi in un unico storage, ma che i dati venissero suddivisi su più storage
separati (sono abituato ad avere come clienti ditte medio-piccole, per cui
certe esigenze non si sono mai poste).
Oggi difatti è così, ma solo perché 20TB ci stanno in 6U. Una volta non era
così, ma la quantità di dati in certi DB era comunque elevata.
Post by Sam
Hai qualche link di questi mega
storage giusto per curiosità?
Quello era lo storage del DB del 187 di Telecom nel 2002. Storage EMC² con
22TB in tagli da 9GB; occupava praticamente un piano del datacenter e il
personale EMC² era più da noi a cambiare dischi che non in sede (avvevano la
chiamata diretta via modem).
Post by Sam
Mi sono sempre chiesto come gestiscano ad esempio banche o simili le grosse
quantità di dati e soprattutto garantire che neanche una transazione venga
persa.
Oggigiorno le banche in genere hanno sistemi i/zSeries IBM o Sun con comuni
storage di classe enterprise, come l'IBM DS8100. Raramente oggi da noi si
vedono più di 3/4 armadi per lo storage dato che i dischi sono da 300/450GB
e di spazio ce n'è in abbondanza. L'integrità dei dati è garantita dal DB e
a livello applicativo come in tutti gli altri casi; un DB ben ingegnerizzato
può scalare senza molti problemi fino a diversi TB, e comunque i dati "vivi"
non sono in genere tantissimi rispetto al totale.
--
Flavio Visentin

Scientists have finally discovered what's wrong with the female brain:
On the left side, there is nothing right, and on the right side, there
is nothing left.
THe_ZiPMaN
2009-04-13 17:49:15 UTC
Permalink
Post by pier
Post by THe_ZiPMaN
Ecco che quindi "se tutto non va bene" protegge solo dalla rottura di UN
disco. E visto che già in DUE occasioni ho visto le cose non andare bene
posso garantirti che il Raid10 non è assolutamante equivalente al Raid 6
Beh...se le cose non vanno bene c'e'pure il caso della corruzione dei
dati in un raid 5 o 6 (che non tutti i controller riescono a gestire).
Nessun cotroller può gestire la corruzione dei dati se questa avviene a
livello applicativo. A livello di dispositivo invece la corruzione è
rilevata e talvolta corretta da tutti i controller.
Post by pier
A voler vedere bene l'unico che garantisce una affidabilita' certa e' il
raid 1 (magari multi level).
Nemmeno quello. Anche in quel caso possono esserci le stesse corruzioni di
cui sopra.
--
Flavio Visentin

Scientists have finally discovered what's wrong with the female brain:
On the left side, there is nothing right, and on the right side, there
is nothing left.
l***@gmail.com
2009-04-13 20:10:34 UTC
Permalink
Post by pier
Beh...se le cose non vanno bene c'e'pure il caso della corruzione dei
dati in un raid 5 o 6 (che non tutti i controller riescono a gestire).
A voler vedere bene l'unico che garantisce una affidabilita' certa e' il
raid 1 (magari multi level).
Di che corruzione parli?
Se il controller corrompe i dati, raid1,5 o 6 non servono a niente, i
dati vengono scritti corrotti e basta.
Il raid ti protegge da guasti ai dischi, non da eventuali corruzioni
di dati.....
pier
2009-04-13 21:23:35 UTC
Permalink
Post by l***@gmail.com
Post by pier
Beh...se le cose non vanno bene c'e'pure il caso della corruzione dei
dati in un raid 5 o 6 (che non tutti i controller riescono a gestire).
A voler vedere bene l'unico che garantisce una affidabilita' certa e'
il raid 1 (magari multi level).
Di che corruzione parli?
Se il controller corrompe i dati, raid1,5 o 6 non servono a niente, i
dati vengono scritti corrotti e basta. Il raid ti protegge da guasti ai
dischi, non da eventuali corruzioni di dati.....
A volte prima che i dischi si rompano del tutto, questi potrebbero
ritornare dei dati non corretti (se mi ricordo bene si chiama partial
media failure o qualcosa del genere), facendo scrivere magari una parita'
sbagliata, propagando l'errore.
E' per quello che solaris per esempio sui raid5 software fa il checksum
di ogni blocco scritto e letto sul disco...anche emc mi sembra aggiunge
un checksum su ogni blocco.
Vorrei chiarire che non dico che il raid 5-6 non vada bene, ma se la
sicurezza dei dati e' tutto io preferisco altri raid. Tutto qua.

Pier
Piergiorgio Sartor
2009-04-13 21:31:06 UTC
Permalink
Post by pier
Vorrei chiarire che non dico che il raid 5-6 non vada bene, ma se la
sicurezza dei dati e' tutto io preferisco altri raid. Tutto qua.
In questo specifico contesto, meglio RAID-6 rispetto
RAID-1 con 3 dischi.
Infatti se hai un soft error come fai a sapere su
quale disco e` capitato?

Con RAID-1 a 3 dischi, l'unica e` selezionare i 2
uguali come non rovitano, il che potrebbe non essere
corretto, anche se lo e` probabilmente.
Con un RAID-6, invece, e` possibile determinare il
disco rovinato, oppure l'incertezza (2 o piu`).
Vi e` sempre una possibilita` di risolvere in maniera
errata la cosa, ma e` molto meno probabile.

bye,
--
piergiorgio
Piergiorgio Sartor
2009-04-13 21:45:44 UTC
Permalink
Post by Piergiorgio Sartor
uguali come non rovitano, il che potrebbe non essere
miiii! "...non rovinati..."

bye,
--
piergiorgio
bio
2009-04-14 13:36:01 UTC
Permalink
Post by THe_ZiPMaN
Affidabilità e disponibilità non sono mai pari o migliori del raid 6, per
nessun livello di raid.
Per ora mi fido, non ho ne tempo ne voglia [1] di mettermi a far di
calcolo
tenendo conto dei diversi modelli di guasto (con l'hot-spare, poi...
brrr).
Post by THe_ZiPMaN
Il raid 10 protegge (deterministicamente) sempre e comunque solo dal fail
di un disco.
"Deterministicamente" e' una parola priva di senso in un ambito
totalmente
dominato dalla statistica e calcolo delle probabilita' :-) Le
probabilita'
che un secondo (o terzo, o...) guasto in un raid 10 degradato si
verifichi
in uno dei set ancora integri, senza pregiudizio per la funzionalita'
[2],
e' statisticamente rilevante.


Fabio

[1] e sono anche un po' arruginito, se vogliamo dirla tutta
[2] ne per le prestazioni
Piergiorgio Sartor
2009-04-14 14:49:36 UTC
Permalink
"Deterministicamente" e' una parola priva di senso in un ambito totalmente
dominato dalla statistica e calcolo delle probabilita' :-) Le probabilita'
Nessun calcolo delle probabilita`.

Per esempio, un RAID-5 protegge *deterministicamente*
contro la rottura di un solo disco.
Un RAID-10 protegge *deterministicamente* contro la
rottura di un disco e *statisticamente* contro la
rottura di ... due, per esempio.
Un RAID-6 protegge *deterministicamente* contro la
rottura di 2 dischi.

In altre parole, la probabilita` di rottura di uno
o piu` dischi e` cosa diversa dalla certezza o meno
di sopravvivere all'evento.
Cioe` *apriori* hai probabilita`, ma *aposteriori*
hai sopravvivenza (o meno) deterministica.

bye,
--
piergiorgio
bio
2009-04-15 08:27:46 UTC
Permalink
Post by Piergiorgio Sartor
Per esempio, un RAID-5 protegge *deterministicamente*
contro la rottura di un solo disco.
Un RAID-10 protegge *deterministicamente* contro la
rottura di un disco e *statisticamente* contro la
rottura di ... due, per esempio.
Un RAID-6 protegge *deterministicamente* contro la
rottura di 2 dischi.
Certo, ma continua a sfuggirmi come questo approccio posa essere
utile per misurare e confrontare l'affidabilita'. Non vorrei che
si stesse parlando di cose diverse.


Fabio
Piergiorgio Sartor
2009-04-15 10:04:01 UTC
Permalink
Post by bio
Certo, ma continua a sfuggirmi come questo approccio posa essere
utile per misurare e confrontare l'affidabilita'. Non vorrei che
si stesse parlando di cose diverse.
Direi che, nello specifico RAID-6 vs. RAID-10, hai
con il primo la resistenza contro la rottura di due
dischi, indipendentemente da quali due. Mentre con
il secondo, in configurazione "classica", hai la
certezza di resistere contro la rottura di *un*
disco, ed un certa probabilita` di resistere alla
rottura di due.
Detto statisticamente, P(n), dove P e` la probabilita`
di sopravvivere ed "n" numero di dischi rotti, sara`,
per RAID-6 P(2) = 1, per RAID-10 P(2) < 1.

Cioe` la probabilita`, per RAID-6, di resistere
alla rottura di due dischi e` "1", cioe` e` certo,
mentre per un RAID-10 e` < 1, cioe` hai dei casi
in cui l'array muore per la perdita di due dischi.

Quindi RAID-6 e` piu` affidabile di RAID-10.

Nota che questo e` assolutamente indipendente dalla
probabilita` di rottura di un disco (o piu`), in
quanto stiamo considerando la situazione in cui,
*aposteriori*, abbiamo due dischi rotti.

Se ogni array e` fatto da "n" dischi, bisogna prendere
tutte le combinazioni possibili di due dischi rotti,
e, per il RAID-10, verificare quali consentono al
tutto di funzionare e quali no.
Dal rapporto fra casi "OK" e tutti i casi possibili si
ricava P(2).

In particolare, con 4 dischi, ci sono 6 combinazioni
di 2 dischi rotti (0 rotto, 1 funzionante).

00 11
01 01
01 10
10 01
10 10
11 00

Se hai un mirror di stripe, 01 01, 10 10, 01 10 e 10 01
sono fatali, quindi P(2) = (6-4)/6 = 2/6 = 1/3
Se hai uno stripe di mirror, 11 00 e 00 11 sono fatali,
quindi P(2) = (6-2)/6 = 4/6 = 2/3

Ammesso che abbia fatto i conti giusti... :-)

Con un RAID-6 nessuna combinazione e` fatale, quindi P(2) = 1

Ovviamente, si potrebbe fare un RAID-10, con mirror a 3
dischi, per esempio, per cui P(2) = 1 e magari 0 < P(3) < 1,
mentre, per RAID-6, P(3) = 0 sempre.
In questa situazione, pero`, l'efficienza di storage diminuisce,
quindi bisogna valutare il tutto considerando cosa interessa e
la probabilita` di rottura di "n" dischi.

bye,
--
piergiorgio
bio
2009-04-15 21:19:05 UTC
Permalink
Post by Piergiorgio Sartor
Ovviamente, si potrebbe fare un RAID-10, con mirror a 3
dischi, per esempio, per cui P(2) = 1 e magari 0 < P(3) < 1,
mentre, per RAID-6, P(3) = 0 sempre.
In questa situazione, pero`, l'efficienza di storage diminuisce,
quindi bisogna valutare il tutto considerando cosa interessa e
la probabilita` di rottura di "n" dischi.
Ma sarebbe comunque un raid6 vs raid10, no? Stai confrontando casi
particolari e non generali. E se lo facessi a parita' di capacita'
dovremmo tenere in conto che con raid10, per esempio, avremmo piu'
dischi, e quindi una maggiore probabilita' di una seconda rottura,
e la stessa cosa accadrebbe con il mirror a tre dischi.

Ti ringrazio dello scambio di idee, penso che sia la risposta piu'
lunga e articolata che abbia mai avuto su usenet :-) ma, comunque,
la vediamo diversamente su come valutare l'affidabilita'. Se vuoi,
e se non lo conosci gia', prova a leggere "RAID: High-Performance,
Reliable Secondary Storage" di Chen, Lee, Gibson, katz, Patterson.
Non ho un link ma lo dovresti trovare facilmente. [Patterson88] e'
un riferimento in bibliografia che potrebbe essere propedeutico.

Ciao


Fabio

PS: e' meglio fare uno stripe di mirror :-)
Piergiorgio Sartor
2009-04-15 21:52:37 UTC
Permalink
Post by bio
Ma sarebbe comunque un raid6 vs raid10, no? Stai confrontando casi
particolari e non generali. E se lo facessi a parita' di capacita'
dovremmo tenere in conto che con raid10, per esempio, avremmo piu'
dischi, e quindi una maggiore probabilita' di una seconda rottura,
e la stessa cosa accadrebbe con il mirror a tre dischi.
Stai ancora confondendo la probabilita` a priori
con quella a posteriori.

Con 100 dischi aumenta la probabilita` di rotture
singole, doppie, triple o altro, rispetto ad avere
10 dischi.
Qui pero` stiamo supponendo che 2 dischi sia gia`
andati e vogliamo vedere cosa succede.
Anche perche` si considera, in condizioni reali,
che la probabilita` di rottura di un terzo disco,
durante la fase di rimpiazzo, sia quasi nulla.

Ovviamente i due sistemi, RAID-6 e RAID-10, vanno
confrontati a parita` di qualcosa.
Una possibilita` e` parita` di efficienza di storage.
In questo senso 4 dischi hanno la stessa efficienza.
All'aumentare dei dischi, direi che il RAID-6 guadagna,
dato che il RAID-10 rimane al 50%.
Post by bio
Ti ringrazio dello scambio di idee, penso che sia la risposta piu'
lunga e articolata che abbia mai avuto su usenet :-) ma, comunque,
Figurati...
Post by bio
la vediamo diversamente su come valutare l'affidabilita'. Se vuoi,
Beh, il contesto presentato era quello della rottura
doppia, non quello della probabilita` di failure di
un sistema RAID. E` diverso.
Post by bio
e se non lo conosci gia', prova a leggere "RAID: High-Performance,
Reliable Secondary Storage" di Chen, Lee, Gibson, katz, Patterson.
Non ho un link ma lo dovresti trovare facilmente. [Patterson88] e'
un riferimento in bibliografia che potrebbe essere propedeutico.
Grazie, vedro` di darci un'occhiata.
Post by bio
PS: e' meglio fare uno stripe di mirror :-)
Infatti, anche i conti lo hanno confermato!

bye,
--
piergiorgio
Loading...