HBase
 sql >> база данни >  >> NoSQL >> HBase

Оперативна база данни в CDP

Бележка на редактора, август 2020 г.:Центърът за данни на CDP вече се нарича CDP Private Cloud Base. Можете да научите повече за това тук.

Оперативната база данни (OpDB) на Cloudera в CDP предоставя винаги налична, мащабируема OpDB в реално време, която обслужва традиционни структурирани данни заедно с нови неструктурирани данни в рамките на единна оперативна и складова платформа. Cloudera предоставя оперативна база данни, която обслужва традиционни структурирани данни заедно с нови неструктурирани данни в рамките на единна платформа с отворен код.

Оперативната база данни ви помага да:

Операционализирайте машинното обучение/изкуственият интелект, за да революционизирате сектори като здравеопазване, комунални услуги и др. 

  • Обслужвайте съдържание в реално време в уеб мащаб.
  • Одобрете анализа на големи данни за оперативна и офлайн употреба.
  • Използвайте като устойчиво съхранение на записи.

OpDB в CDP в момента се предлага в два форм-фактора:като напълно защитено, полу-управлявано предложение в CDP Public Cloud – Data Hub, и като напълно персонализирано предложение в CDP Data Center – подобно на това, което вече е налично в CDH и HDP. Можете да изберете форм фактор въз основа на вашата стратегия за внедряване и нуждите на OpDB. Оперативната база данни използва хранилище за обекти като Amazon S3  като слой за съхранение за Apache HBase, където HFiles се записват в обектното хранилище, но WAL се записват в HDFS.

Оперативната база данни в CDP има следните компоненти: 

  • Apache Phoenix SQL интерфейс, който работи върху Apache HBase.
  • Apache HBase е проектиран за масивна мащабируемост, така че можете да съхранявате неограничени количества данни в една платформа и да се справяте с нарастващите изисквания за обслужване на данни.
  • Apache ZooKeeper предоставя услуга за разпределено конфигуриране, услуга за синхронизиране и регистър за имена.
  • Apache Knox Gateway осигурява сигурност на периметъра, така че предприятието може уверено да разшири достъпа до нови потребители.
  • Apache HDFS се използва за записване на Apache HBase WAL.
  • Обектното хранилище като Amazon S3 и Microsoft ADLS Gen2 се използва за съхраняване на Apache HBase HFiles.
  • Опитът за споделени данни (SDX) се използва за сигурност и възможности за управление. Политиките за сигурност и управление се задават веднъж и се прилагат към всички данни и работни натоварвания.
  • IDBroker е REST API, изграден като част от услугите за удостоверяване на Apache Knox. Той позволява на удостоверен и оторизиран потребител да обменя набор от идентификационни данни или токен за токени за достъп на доставчици в облак.

Оперативна база данни в серия CDP 

Тази статия ви даде въведение за OpDB на CDP и неговата архитектура. Можете да научите повече за всеки аспект на OpDB и да разберете за новите функции и възможности на OpDB в предстоящите статии от тази серия. Ще актуализираме връзките към всяка публикация в блога, когато бъдат публикувани.

Достъпност

OpDB на Cloudera гарантира, че потребителите имат достъп или извличат съхранени данни. Той поддържа както автоматично, така и предварително дефинирано разделяне, три механизма за заявки и няколко инструмента за интегриране на данни. Тази статия предоставя преглед на тези възможности и други функции, които гарантират постигане на високо ниво на достъпност.

Администрация

OpDB на Cloudera предоставя няколко административни инструменти и функции за администриране на вашето OpDB работно натоварване. Администраторите могат да внедрят OpDB като напълно защитено, полу-управлявано предложение в CDP Public Cloud – Data Hub и като напълно персонализирано предложение в CDP Data Center (подобно на това, което е налично в CDH и HDP). Тази статия ви предоставя преглед на високо ниво на това какви функции и инструменти се поддържат за администриране на OpDB в CDP.

Управление

OpDB на Cloudera предоставя инструменти за управление, които ви помагат ефективно да управлявате вашите OpDB работни натоварвания. Тази статия ви дава общ преглед на инструментите и функциите за управление на OpDB в CDP.

Наличност

OpDB на Cloudera поддържа високо ниво на наличност на данни, като гарантира, че необходимите данни са достъпни, когато и където е необходимо, дори ако възникне повреда. Тази статия предоставя преглед на функциите, които правят възможно високо ниво на наличност, като например висока наличност, репликация на данни и защита от грешки.

Интегритет

OpDB на Cloudera предоставя различни възможности за интегритет на данни, включително интегритет на обект и домейн, ACID транзакции и нерелационен интегритет. Тази статия предоставя преглед на възможностите за интегритет на данни на OpDB.

Поддръжка на приложения

OpDB на Cloudera поддържа различни популярни езици, рамки и приложения, които можете да използвате за достъп до данни, съхранявани във вашата OpDB. Тази статия ви дава общ преглед на поддържаните езици, рамки и приложения.

NoSQL и свързаните възможности

Тъй като OpDB на Cloudera включва базата данни NoSQL HBase за съхранение на данни, тя има възможности за NoSQL, като ключови стойности, възможности в стил на таблица и гъвкави типове данни. Осигурена е и тясна интеграция в екосистемата на Hadoop, включително HDFS, Spark и Kafka. Тази статия предоставя преглед на тези възможности.

Мащабируемост

OpDB на Cloudera е проектирана за висока мащабируемост, като поддържа както вертикална, така и хоризонтална мащабируемост с гъвкав тип данни и без ограничение за размера на данните. Тази статия предоставя преглед на поддържаните функции и инструменти, свързани с мащабируемостта.

Сигурност

OpDB на Cloudera предоставя множество решения за сигурност на различни нива, по отношение на криптиране, удостоверяване, оторизация и одит. Тази статия предоставя общ преглед на тези функции и инструменти, свързани със сигурността.

За повече информация, моля, отидете на:Първи стъпки с оперативна база данни.


  1. Redis
  2.   
  3. MongoDB
  4.   
  5. Memcached
  6.   
  7. HBase
  8.   
  9. CouchDB
  1. Какво следва за Impala след издание 1.1

  2. Cloudera Impala:Заявки в реално време в Apache Hadoop, за реално

  3. Ръководство за използване на Apache HBase портове

  4. Преобразуване на HBase ACL в политики на Ranger

  5. Създаване на отворен стандарт:управление на машинно обучение с помощта на Apache Atlas