Cloudera Manager 4.7 добави поддръжка за управление на Cloudera Search 1.0. По този начин потребителите на Cloudera Manager могат лесно да внедряват всички компоненти на Cloudera Search (включително Apache Solr) и да управляват всички свързани услуги, точно както всяка друга услуга, включена в CDH (разпространението на Cloudera на Apache Hadoop и свързани проекти).
В това ръководство ще научите стъпките, свързани с добавянето на Cloudera Search към клъстер Cloudera Enterprise (CDH + Cloudera Manager).
Инсталиране на SOLR Parcel
В нашия пример клъстерът използва CDH 4.4 колет и изпълнява услугите на Apache ZooKeeper, HDFS и Apache HBase. (Колетките са наистина полезен начин за внедряване на нов софтуер и извършване на безболезнени надстройки чрез Cloudera Manager.)
Ако искате да изтеглите пратката SOLR директно от Cloudera, можете да използвате настройките по подразбиране за „URL адреси на отдалечено хранилище на парцел“ (под Колетки раздел в раздела Администриране), както е показано по-долу:
Задаване на URL адреса на хранилището на парцел
Ако искате да използвате локално хранилище (тоест първо изтеглете пратката от Cloudera и след това инсталирайте от локалното копие), можете да следвате инструкциите тук. Следващите стъпки са "Изтегляне", "Разпространение" и "Активиране" на пратката от страницата Парцели в раздела Хостове.
Разгръщане на пратката SOLR
След като пратката е активирана, имате всички компоненти на Cloudera Search (Solr, Lily HBase Indexer и Morphlines Sink на Apache Flume), готови за използване заедно с CDH.
Следващата стъпка е да добавите услугата Apache Solr към вашия клъстер. В менюто „Действия“ на вашия клъстер в раздела Услуги изберете „Добавяне на услуга“, което ви отвежда до „Помощник за добавяне на услуга“ в Cloudera Manager. След като следвате стъпките в съветника и изберете къде да работят сървърите на Solr, ще се озовете на страница с работен поток, която ще инициализира услугата Solr и ще стартира всички сървъри Solr.
Поставяне и стартиране на услугата Solr
Това е всичко - услугата Solr вече е готова за използване! Следвайте инструкциите в Ръководството за потребителя на Cloudera Search за създаване на колекции и добавяне на документи към тях за индексиране. Екранната снимка по-долу показва как да създадете колекция с помощта на Solr схемата по подразбиране.
Създаване на първата колекция
Добавяне на Lily HBase Indexer
Cloudera Manager 4.7 също така осигурява поддръжка за Lily HBase Indexer, включен в пакета SOLR. Услугата Lily HBase Indexer е гъвкава, мащабируема, устойчива на грешки, транзакционна система в почти реално време за обработка на непрекъснат поток от актуализации на HBase клетки в индекси за търсене на живо. За да го използвате, добавете услугата „Keystore Indexer“ чрез „Помощника за добавяне на услуга“.
Преди да можете да използвате Lily HBase Indexer обаче, трябва да се уверите, че репликацията и индексирането са активирани в услугата HBase в клъстера. Можете да промените тези свойства на страницата за конфигурация на услугата HBase в секцията „Архивиране“.
Задаване на свойства на HBase за Lily HBase Indexer
Също така имайте предвид, че Cloudera Manager включва файл по подразбиране Cloudera Morphlines, който може да се използва от Lily HBase Indexer. За да промените този файл, за да използва вашите собствени функции, трябва да отидете до услугата Keystore Indexer и да промените конфигурацията на Morphlines, както е показано по-долу:
Редактиране на Cloudera Morphlines за Lily HBase Indexer
След като тези промени бъдат направени, можете да започнете да използвате Lily HBase Indexer, за да индексирате всички данни, постъпващи в HBase, като следвате инструкциите в Ръководството за потребителя на Lily HBase Indexer . Тази публикация в блога също така предоставя чудесен пример за това как да индексирате имейли с помощта на HBase и Cloudera Search.
Заключение
Сега знаете колко лесно е да внедрите, конфигурирате и управлявате услуга Cloudera Search във вашия CDH клъстер с помощта на Cloudera Manager. Започвайки с Cloudera Enterprise 5 (в бета версия към момента на писане), Cloudera Search и Lily HBase indexer ще се инсталират и стартират по подразбиране, което прави този процес още по-лесен.
Викрам Сривастава е софтуерен инженер в Cloudera.