HBase
 sql >> база данни >  >> NoSQL >> HBase

Топ 6 характеристики на HDFS – урок за HDFS на Hadoop

В предишния ни блог научихме Hadoop HDFS подробно, сега в този блог ще разгледаме характеристиките на HDFS. Hadoop HDFS има функции като отказоустойчивост, репликация, надеждност, висока наличност, разпределено съхранение, мащабируемост и др.

Всички тези функции на HDFS в Hadoop ще бъдат обсъдени в този урок за HDFS на Hadoop.

Въведение в Hadoop HDFS

Разпределена файлова система на Hadoop (HDFS) е основната система за съхранение на Hadoop. Той съхранява много големи файлове, работещи на клъстер от стоков хардуер. HDFS е базиран на GFS (Google FileSystem). Той съхранява данни надеждно дори в случай на повреда на хардуера.

HDFS също така осигурява високопроизводителен достъп до приложението чрез паралелен достъп. Според прогноза до края на 2017 г. 75% от наличните данни на планетата ще се намират в HDFS.

6 важни характеристики на HDFS

След като проучихме въведението на Hadoop HDFS, нека сега да обсъдим най-важните характеристики на HDFS.

1. Толерантност на грешки

Толерантността на грешки в Hadoop HDFS е работната сила на системата при неблагоприятни условия. Той е силно устойчив на грешки. Hadoop Framework разделя данните на блокове. След това създава множество копия на блокове на различни машини в клъстера.

Така че, когато някоя машина в клъстера се повреди, тогава клиентът може лесно да получи достъп до данните си от другата машина, която съдържа същото копие на блокове от данни.

2. Висока наличност

Hadoop HDFS е високодостъпна файлова система. В HDFS данните се репликират между възлите в Hadoop клъстера чрез създаване на реплика на блоковете на другите подчинени устройства, присъстващи в HDFS клъстера. Така че, когато потребител иска да получи достъп до тези данни, той може да получи достъп до данните си от подчинените, които съдържат неговите блокове.

По време на неблагоприятни ситуации като повреда на възел, потребителят може лесно да получи достъп до данните си от другите възли. Тъй като дублиращи се копия на блокове присъстват на другите възли в HDFS клъстера.

3. Висока надеждност

HDFS осигурява надеждно съхранение на данни. Може да съхранява данни в диапазона от 100 петабайта. HDFS съхранява данни надеждно в клъстер. Той разделя данните на блокове. Hadoop Framework съхранява тези блокове на възли, присъстващи в HDFS клъстер.

HDFS съхранява данни надеждно, като създава реплика на всеки блок, присъстващ в клъстера. Следователно осигурява толерантност на грешки. Ако възелът в клъстера, съдържащ данни, падне, тогава потребителят може лесно да получи достъп до тези данни от другите възли.

HDFS по подразбиране създава 3 реплики на всеки блок, съдържащ данни, присъстващи във възлите. Така данните са бързо достъпни за потребителите. Следователно потребителят не се сблъсква с проблема със загубата на данни. По този начин HDFS е много надежден.

4. Репликация

Репликацията на данни е уникална характеристика на HDFS. Репликацията решава проблема със загубата на данни в неблагоприятно състояние като хардуерен отказ, срив на възли и т.н. HDFS поддържа процеса на репликация на редовен интервал от време.

HDFS също така продължава да създава реплики на потребителски данни на различни машини, присъстващи в клъстера. Така че, когато някой възел се повреди, потребителят може да получи достъп до данните от други машини. По този начин няма възможност за загуба на потребителски данни.

5. Мащабируемост

Hadoop HDFS съхранява данни на множество възли в клъстера. Така че, когато изискванията се повишат, можете да мащабирате клъстера. В HDFS са налични два механизма за мащабируемост:Вертикален и Хоризонтална скалируемост.

6. Разпределено съхранение

Всички функции в HDFS се постигат чрез разпределено съхранение и репликация. HDFS съхранява данни по разпределен начин между възлите. В Hadoop данните се разделят на блокове и се съхраняват на възлите, присъстващи в HDFS клъстера.

След това HDFS създава репликата на всеки блок и съхранява на други възли. Когато една машина в клъстера се срине, можем лесно да получим достъп до данните си от другите възли, които съдържат нейната реплика.

Заключение

В заключение можем да кажем, че HDFS е силно устойчив на грешки. Той надеждно съхранява огромно количество данни въпреки хардуерната повреда. Освен това осигурява висока мащабируемост и висока наличност. Следователно HDFS дава възможност за функционалност на Hadoop. Ако намерите друга функция на HDFS, моля, споделете с нас в секцията за коментари по-долу.


  1. Redis
  2.   
  3. MongoDB
  4.   
  5. Memcached
  6.   
  7. HBase
  8.   
  9. CouchDB
  1. Как да:Използвайте HBase Thrift Interface, Част 2:Вмъкване/Получаване на редове

  2. Преглед на репликацията на Apache HBase

  3. Диаграма на потока за изпълнение на задачи Hadoop MapReduce

  4. Дигиталната трансформация е пътуване на данни от ръба до прозрението

  5. Броячи на Hadoop и видове броячи в MapReduce