HBase
 sql >> база данни >  >> NoSQL >> HBase

Apache Phoenix за CDH

Apache Phoenix за CDH:Най-добрата нова функция за СУБД

Cloudera приема и ще поддържа Apache Phoenix за CDH, като същевременно го интегрира за своята Cloudera Data Platform на база напредък.

Изданията на Cloudera CDH включват Apache HBase която осигурява устойчива, NoSQL СУБД за клиенти оперативни приложения, които искат да използват силата на големите данни. Тези приложения са прераснали във важни за мисията и критични за мисия приложения, които стимулират най-високите приходи и крайната рентабилност. Тези приложения включват приложения, насочени към клиентите, платформи за електронна търговия, откриване на рискове и измами, използвани зад кулисите в банките или обслужващи AI/ML модели за приложения и позволяващи допълнително обучение за укрепване на същите въз основа на действителните резултати.

Въпреки това, за много клиенти, HBase беше твърде обезсърчително пътуване – изискваше от тях да се научат

  • Нов модел на данни като HBase е схема с широка таблица, поддържаща милиони колони, но без обединения и
  • Използване на Java API вместо ANSI SQL

Те поискаха да могат да използват по-традиционен дизайн на схема, който наподобява този, предоставен от Oracle или MySQL, и бяха готови да направят някои компромиси по отношение на гъвкавостта, напр.

  • Те са готови да използват предоставените типове данни, вместо да дефинират свои собствени
  • Те са готови да се откажат от гъвкавостта една колона да има няколко типа в зависимост от реда в замяна на един тип в един ред

За да се даде възможност на клиентите да имат лесен достъп до другите предимства на Apache HBase (неограничено мащабиране, милиони редове, еволюция на схемата и т.н.), като същевременно предоставят възможности, подобни на RDBMS (ANSI SQL, прости съединения, типове данни извън кутия и т.н.), въвеждаме поддръжка за Apache Phoenix на CDH.

За всички останали приложенията, базирани на Phoenix, също се възползват от задкулисните оптимизации на HBase, което улеснява постигането на по-добра производителност на HBase. Например, Phoenix прилага осоляване на първични ключове – така че потребителите на HBase не трябва да обмислят този аспект на дизайна на ключовете.

Освен това, базираните на Phoenix приложения могат да съществуват съвместно с HBase приложения - което означава, че можете да използвате единичен HBase клъстер, за да поддържате и двете. С Phoenix клиентите могат да продължат да използват любимите си инструменти за бизнес бизнес и табло за управление точно както правеха с Hive &Impala в миналото. Когато използват Phoenix, те могат също да изберат да използват директно Phoenix с тези инструменти в допълнение към опцията за използване на Hive / Impala, като елиминират стъпка за нови реализации.

От гледна точка на сигурността и управлението (SDX), в CDH, Phoenix използва HBase ACL за контрол на достъп, базиран на роли за таблици на Phoenix. Phoenix също използва интеграция на HBase в Cloudera Navigator за информация за одит.

Cloudera пусна колет Phoenix 4.14.1 достъпен за клиенти на CDH 5.16.2 и колет Phoenix 5.0, достъпен за клиенти на CDH 6.2+.

Съществуващите клиенти на HDP вече имат поддръжка на Apache Phoenix и почти половината от потребителите на HBase, които използват HDP, понастоящем използват Phoenix, както и неговата популярност в общността на потребителите на HBase.

Изтеглете Apache Phoenix за CDH 

Създайте критични приложения с помощта на Apache Phoenix. Изтеглете софтуера тук.

Често задавани въпроси за Phoenix

В) За какви натоварвания трябва да се използва Phoenix

Phoenix поддържа същите случаи на използване като HBase, предимно натоварвания с ниска латентност и висока паралелност. Въпреки това, Phoenix улеснява и използването на основните данни за целите на таблото за управление и BI

В) Какъв е механизмът за оторизация с Phoenix?

Phoenix зависи от HBase за оторизация. За клиенти на CDH това използва HBase ACL. За клиентите на HDP това става чрез интеграция на HBase-Ranger

В)  Каква е мащабируемостта на Phoenix? Кой е най-големият известен клъстер?

Phoenix мащабира до стотици TB данни. Най-големият клиент има над 0,5 PB данни, които се управляват от Phoenix. Подробности относно случаите на използване могат да бъдат намерени в архивите на PhoenixCon и в архивите за видеоклипове за ден NoSQL по-рано тази година в собствени думи и слайдове на потребителите.

В) Phoenix поддържа ли геопространствено вторично индексиране? Какво ниво на поддръжка на пространствени данни?

Той има ограничена поддръжка за геопространствени данни. Въпреки това GeoMesa осигурява геопространствен слой на HBase, който може да поддържа тази нужда и да се интегрира с приложения на клиенти. Phoenix, GeoMesa, както и JanusGraph и OpenTSDB могат да съществуват съвместно в един HBase клъстер.

В) Как създавате и използвате индекс?

Вижте страницата за вторично индексиране на Phoenix за подробности относно индексирането. От Phoenix 4.8.0 нататък не са необходими промени в конфигурацията, за да се използва локално индексиране.

В)  Има ли ограничение за броя колони, които можете да поставите в индекс?

Подобно на RDBMS, индексът е по същество отделна таблица с индекса и връзка към изходните данни. Ако индексирате всички колони, побеждавате целта, като поддържате две еднакви таблици. Индексите трябва да се използват разумно, тъй като има някои нетривиални допълнителни разходи при запис (глобални индекси) или четене (локални индекси).


  1. Redis
  2.   
  3. MongoDB
  4.   
  5. Memcached
  6.   
  7. HBase
  8.   
  9. CouchDB
  1. Как да:Управление на HBase данни чрез Hue

  2. Преобразуване на HBase ACL в политики на Ranger

  3. Как да:Тествайте HBase приложения с помощта на популярни инструменти

  4. Hadoop InputFormat &Типове InputFormat в MapReduce

  5. Архитектурни модели за обработка на данни в почти реално време с Apache Hadoop