Liczba GB Danych Na Dysku

Dysk z Plikami Danych

Dla większości użytkowników komputera oczywistym jest, że dane/informacje przechowujemy w plikach.
Pliki są umieszczane/zapisane na dysku jako trwałym nośniku, nie znikają w czasie wyłączenia komputera, zazwyczaj 🙂.
Dyski mogą być wbudowane, wymienne, zewnętrzne, w chmurze …

Ile GB przestrzeni potrzebujemy

Pytanie wydaje się proste, wystarczy zsumować rozmiary plików.
Nie jest prawda – potrzebujemy więcej 😳.
Na dyskach znajduje się obszar w którym zapisane są informacje o plikach i katalogach.
Taki indeks w bibliotece czyli dodatkowa szafa nie z książkami tylko z informacjami o książkach 😀.

Dysk jest podzielony na fragmenty o stałym rozmiarze. W każdym z fragmentów mieści się określona liczba bajtów. Oznacza to, że do zapisania pliku o długości x bajtów potrzebujemy y fragmentów o rozmiarze r, wyliczaną według wzoru

y = ZaokrąglenieWGórę(\frac{x}{r})

czyli mogą być fragmenty zawierające tylko jedne bajt, który nie zmieścił się we wcześniejszych 🙁.

Do tego dochodzą zazwyczaj znaczniki kontrolne.

Podsumowując potrzebujemy trochę więcej przestrzeni na dysku niż suma rozmiarów plików z danymi, które chcemy tam zapisać.
O ile więcej zależy od zastosowanego systemu plików (file system).

Dane są przetwarzane

Dane są wejściowe lub wyjściowe o czym już wspominałem przy okazji Wymagań Funkcjonalnych
Jak chcemy przetwarzać dane to potrzebujemy przestrzeni roboczych na pliki chwilowe, tak zwane WORKDIR (katalog roboczy), TMP (katalog tymczasowy) itp… – oczywiście w różnych rozwiązań nazwy i lokalizacje mogą być różne, ale sens jest taki jak przytoczyłem.

Na te katalogi, a w zasadzie ich zawartość potrzebujemy dodatkowe kilka procent przestrzeni, pod warunkiem, że te katalogi sprzątamy 🙁.

Z doświadczenia mogę powiedzieć, że wprowadzenie okresowego czyszczenia tych katalogów może dać dużo odzyskanej przestrzeni, czyli zmniejszyć koszty 🙂.
Wskaźnika nie będę podawał, aby nie zrobić krzywdy tym, którzy tym zarządzają prawidłowo, czyli robią okresowe czyszczenie 😳.

BTW

  • Kopie na chwilę, których nikt nie usuwa.
  • Logi z przetwarzania od początku świata

to kolejne czynniki nieuzasadnionego wzrostu zapotrzebowania na GB dysków 🙁.
Jak tym zarządzać to odrębny wątek, do którego wrócę później.

Liczba GB Dysku a bezpieczeństwo

Dysk może ulec uszkodzeniu, czyli jak zaadresować ryzyko takiego zdarzenia?

RAID (Redundant Array of Independent Disks – czyli nadmiarowa przestrzeń dyskowa) to sposób organizacji dysków aby zapewnić odpowiednią wielkość i zabezpieczenie zapisanych danych.
Straping -RAID 0 – suma przestrzeni lecz bez zabezpieczenia, każda awaria powoduje utratę danych.
Mirror – RAID 1 – wszystkie dyski powielone, czyli potrzebujemy 2 razy więcej dysków.
Inny – RAID X – potrzebuje więcej, ale przeżywa awarię jednego lub więcej dysków (zależnie od wybranego X), ma również negatywny wpływ na wydajność 🙁.

Decyzja co wybrać

  • wydajność
  • bezpieczeństwo
  • koszty

to decyzja biznesowa, technika tylko to implementuje.

Jeżeli jeszcze chcemy mieć Centrum Zapasowe (Disaster Recovery – DR) to oczywiście musimy podwoić ilość dysków 😳.

Podsumowanie

Reasumując Liczba GB Danych implikuje ilość potrzebnej przestrzeni dyskowej, ale zależnie od sposobu przetwarzania oraz poziomu bezpieczeństwa mnożnik pozwalający oszacować ilość niezbędnej przestrzeni dyskowej na bazie ilości danych wynosi od trochę ponad 1 do nawet 6.

Jeżeli dane te mają być przechowywane w bazie danych, gdzie schemat zapisu jest przystosowany do możliwości szybkiej zmiany dowolnego elementu oraz tworzone są indeksy, aby szybko znajdować poszukiwane dane to mnożnik może wynosić nawet 10, bez uwzględniania bezpieczeństwa (RAID i DR).

Kupując dyski trzeba również pamiętać, że oprócz danych na dyska mamy systemy operacyjne i aplikacje 😀.

Powyższe obrazuje, że ilość danych, która ewidentnie przekłada się na potrzebne dyski czyli koszty nie jest prostą funkcją, a zazwyczaj staramy się wszystko interpolować liniowo co może dać błędne wyniki 😛.

Oczywiście do tego tematu będę wracał.

Komentarze |0|

Legenda *) Pola oznaczone gwiazdką są wymagane
**) Możesz używać tych znaczników i atrybutów HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>
Kategorie: IT w PLN
Etykiety: ,