Бележка на редактора, август 2020 г.:Центърът за данни на CDP вече се нарича CDP Private Cloud Base. Можете да научите повече за това тук.
Оперативната база данни (OpDB) на Cloudera в CDP предоставя винаги налична, мащабируема OpDB в реално време, която обслужва традиционни структурирани данни заедно с нови неструктурирани данни в рамките на единна оперативна и складова платформа. Cloudera предоставя оперативна база данни, която обслужва традиционни структурирани данни заедно с нови неструктурирани данни в рамките на единна платформа с отворен код.
Оперативната база данни ви помага да:
Операционализирайте машинното обучение/изкуственият интелект, за да революционизирате сектори като здравеопазване, комунални услуги и др.
- Обслужвайте съдържание в реално време в уеб мащаб.
- Одобрете анализа на големи данни за оперативна и офлайн употреба.
- Използвайте като устойчиво съхранение на записи.
OpDB в CDP в момента се предлага в два форм-фактора:като напълно защитено, полу-управлявано предложение в CDP Public Cloud – Data Hub, и като напълно персонализирано предложение в CDP Data Center – подобно на това, което вече е налично в CDH и HDP. Можете да изберете форм фактор въз основа на вашата стратегия за внедряване и нуждите на OpDB. Оперативната база данни използва хранилище за обекти като Amazon S3 като слой за съхранение за Apache HBase, където HFiles се записват в обектното хранилище, но WAL се записват в HDFS.
Оперативната база данни в CDP има следните компоненти:
- Apache Phoenix SQL интерфейс, който работи върху Apache HBase.
- Apache HBase е проектиран за масивна мащабируемост, така че можете да съхранявате неограничени количества данни в една платформа и да се справяте с нарастващите изисквания за обслужване на данни.
- Apache ZooKeeper предоставя услуга за разпределено конфигуриране, услуга за синхронизиране и регистър за имена.
- Apache Knox Gateway осигурява сигурност на периметъра, така че предприятието може уверено да разшири достъпа до нови потребители.
- Apache HDFS се използва за записване на Apache HBase WAL.
- Обектното хранилище като Amazon S3 и Microsoft ADLS Gen2 се използва за съхраняване на Apache HBase HFiles.
- Опитът за споделени данни (SDX) се използва за сигурност и възможности за управление. Политиките за сигурност и управление се задават веднъж и се прилагат към всички данни и работни натоварвания.
- IDBroker е REST API, изграден като част от услугите за удостоверяване на Apache Knox. Той позволява на удостоверен и оторизиран потребител да обменя набор от идентификационни данни или токен за токени за достъп на доставчици в облак.
Оперативна база данни в серия CDP
Тази статия ви даде въведение за OpDB на CDP и неговата архитектура. Можете да научите повече за всеки аспект на OpDB и да разберете за новите функции и възможности на OpDB в предстоящите статии от тази серия. Ще актуализираме връзките към всяка публикация в блога, когато бъдат публикувани.
Достъпност
OpDB на Cloudera гарантира, че потребителите имат достъп или извличат съхранени данни. Той поддържа както автоматично, така и предварително дефинирано разделяне, три механизма за заявки и няколко инструмента за интегриране на данни. Тази статия предоставя преглед на тези възможности и други функции, които гарантират постигане на високо ниво на достъпност.
Администрация
OpDB на Cloudera предоставя няколко административни инструменти и функции за администриране на вашето OpDB работно натоварване. Администраторите могат да внедрят OpDB като напълно защитено, полу-управлявано предложение в CDP Public Cloud – Data Hub и като напълно персонализирано предложение в CDP Data Center (подобно на това, което е налично в CDH и HDP). Тази статия ви предоставя преглед на високо ниво на това какви функции и инструменти се поддържат за администриране на OpDB в CDP.
Управление
OpDB на Cloudera предоставя инструменти за управление, които ви помагат ефективно да управлявате вашите OpDB работни натоварвания. Тази статия ви дава общ преглед на инструментите и функциите за управление на OpDB в CDP.
Наличност
OpDB на Cloudera поддържа високо ниво на наличност на данни, като гарантира, че необходимите данни са достъпни, когато и където е необходимо, дори ако възникне повреда. Тази статия предоставя преглед на функциите, които правят възможно високо ниво на наличност, като например висока наличност, репликация на данни и защита от грешки.
Интегритет
OpDB на Cloudera предоставя различни възможности за интегритет на данни, включително интегритет на обект и домейн, ACID транзакции и нерелационен интегритет. Тази статия предоставя преглед на възможностите за интегритет на данни на OpDB.
Поддръжка на приложения
OpDB на Cloudera поддържа различни популярни езици, рамки и приложения, които можете да използвате за достъп до данни, съхранявани във вашата OpDB. Тази статия ви дава общ преглед на поддържаните езици, рамки и приложения.
NoSQL и свързаните възможности
Тъй като OpDB на Cloudera включва базата данни NoSQL HBase за съхранение на данни, тя има възможности за NoSQL, като ключови стойности, възможности в стил на таблица и гъвкави типове данни. Осигурена е и тясна интеграция в екосистемата на Hadoop, включително HDFS, Spark и Kafka. Тази статия предоставя преглед на тези възможности.
Мащабируемост
OpDB на Cloudera е проектирана за висока мащабируемост, като поддържа както вертикална, така и хоризонтална мащабируемост с гъвкав тип данни и без ограничение за размера на данните. Тази статия предоставя преглед на поддържаните функции и инструменти, свързани с мащабируемостта.
Сигурност
OpDB на Cloudera предоставя множество решения за сигурност на различни нива, по отношение на криптиране, удостоверяване, оторизация и одит. Тази статия предоставя общ преглед на тези функции и инструменти, свързани със сигурността.
За повече информация, моля, отидете на:Първи стъпки с оперативна база данни.