HBase
 sql >> база данни >  >> NoSQL >> HBase

Как да:Добавете Cloudera Search към вашия клъстер с помощта на Cloudera Manager

Cloudera Manager 4.7 добави поддръжка за управление на Cloudera Search 1.0. По този начин потребителите на Cloudera Manager могат лесно да внедряват всички компоненти на Cloudera Search (включително Apache Solr) и да управляват всички свързани услуги, точно както всяка друга услуга, включена в CDH (разпространението на Cloudera на Apache Hadoop и свързани проекти).

В това ръководство ще научите стъпките, свързани с добавянето на Cloudera Search към клъстер Cloudera Enterprise (CDH + Cloudera Manager).

Инсталиране на SOLR Parcel

В нашия пример клъстерът използва CDH 4.4 колет и изпълнява услугите на Apache ZooKeeper, HDFS и Apache HBase. (Колетките са наистина полезен начин за внедряване на нов софтуер и извършване на безболезнени надстройки чрез Cloudera Manager.)

Ако искате да изтеглите пратката SOLR директно от Cloudera, можете да използвате настройките по подразбиране за „URL адреси на отдалечено хранилище на парцел“ (под Колетки раздел в раздела Администриране), както е показано по-долу:

Задаване на URL адреса на хранилището на парцел

Ако искате да използвате локално хранилище (тоест първо изтеглете пратката от Cloudera и след това инсталирайте от локалното копие), можете да следвате инструкциите тук. Следващите стъпки са "Изтегляне", "Разпространение" и "Активиране" на пратката от страницата Парцели в раздела Хостове.

Разгръщане на пратката SOLR

След като пратката е активирана, имате всички компоненти на Cloudera Search (Solr, Lily HBase Indexer и Morphlines Sink на Apache Flume), готови за използване заедно с CDH.

Следващата стъпка е да добавите услугата Apache Solr към вашия клъстер. В менюто „Действия“ на вашия клъстер в раздела Услуги изберете „Добавяне на услуга“, което ви отвежда до „Помощник за добавяне на услуга“ в Cloudera Manager. След като следвате стъпките в съветника и изберете къде да работят сървърите на Solr, ще се озовете на страница с работен поток, която ще инициализира услугата Solr и ще стартира всички сървъри Solr.

Поставяне и стартиране на услугата Solr

Това е всичко - услугата Solr вече е готова за използване! Следвайте инструкциите в Ръководството за потребителя на Cloudera Search за създаване на колекции и добавяне на документи към тях за индексиране. Екранната снимка по-долу показва как да създадете колекция с помощта на Solr схемата по подразбиране.

Създаване на първата колекция

Добавяне на Lily HBase Indexer

Cloudera Manager 4.7 също така осигурява поддръжка за Lily HBase Indexer, включен в пакета SOLR. Услугата Lily HBase Indexer е гъвкава, мащабируема, устойчива на грешки, транзакционна система в почти реално време за обработка на непрекъснат поток от актуализации на HBase клетки в индекси за търсене на живо. За да го използвате, добавете услугата „Keystore Indexer“ чрез „Помощника за добавяне на услуга“.

Преди да можете да използвате Lily HBase Indexer обаче, трябва да се уверите, че репликацията и индексирането са активирани в услугата HBase в клъстера. Можете да промените тези свойства на страницата за конфигурация на услугата HBase в секцията „Архивиране“.

Задаване на свойства на HBase за Lily HBase Indexer

Също така имайте предвид, че Cloudera Manager включва файл по подразбиране Cloudera Morphlines, който може да се използва от Lily HBase Indexer. За да промените този файл, за да използва вашите собствени функции, трябва да отидете до услугата Keystore Indexer и да промените конфигурацията на Morphlines, както е показано по-долу:

Редактиране на Cloudera Morphlines за Lily HBase Indexer

След като тези промени бъдат направени, можете да започнете да използвате Lily HBase Indexer, за да индексирате всички данни, постъпващи в HBase, като следвате инструкциите в Ръководството за потребителя на Lily HBase Indexer . Тази публикация в блога също така предоставя чудесен пример за това как да индексирате имейли с помощта на HBase и Cloudera Search.

Заключение

Сега знаете колко лесно е да внедрите, конфигурирате и управлявате услуга Cloudera Search във вашия CDH клъстер с помощта на Cloudera Manager. Започвайки с Cloudera Enterprise 5 (в бета версия към момента на писане), Cloudera Search и Lily HBase indexer ще се инсталират и стартират по подразбиране, което прави този процес още по-лесен.

Викрам Сривастава е софтуерен инженер в Cloudera.


  1. Redis
  2.   
  3. MongoDB
  4.   
  5. Memcached
  6.   
  7. HBase
  8.   
  9. CouchDB
  1. Apache Spark идва в Apache HBase с HBase-Spark модул

  2. Ръководство за използване на Apache HBase портове

  3. Двигатели за обработка на големи данни – Коя да използвам?:Част 1

  4. Как да:Използвайте интерфейса REST на Apache HBase, част 3

  5. Архитектура на Apache Hadoop – HDFS, YARN &MapReduce