Въведение
Инструментите Pentaho Data Integration и BA Server идват с много различни драйвери за база данни. Въпреки това, от версия 7 на Community Edition, те не идват с JDBC драйвери за Oracle, SQL Server или MySQL (в инструменти за интеграция на данни). Следващите стъпки очертават как да добавите MySQL JDBC драйверите към Pentaho.
Следвайте тези инструкции за Инсталиране на Pentaho BA сървър и инструменти за интегриране на данни, ако инструментите все още не са инсталирани. След като инсталирате инструментите Pentaho, изключете BA сървъра и софтуера за интеграция на данни.
Получаване на MYSQL JDBC драйвери
JDBC драйверите за MySQL се наричат “Connector/J”
Посетете:https://dev.mysql.com/downloads/connector/j/
Превъртете надолу до секцията с опциите за изтегляне.
Уверете се, че е избрано „Независима от платформата“
За операционна система Windows изтеглете ZIP архив
Влезте с вашия акаунт в уеб сайта на Oracle (или създайте такъв безплатно). Или кликнете върху Просто стартирайте изтеглянето ми връзка.
Запазете ZIP файла в папка:
Разархивирайте (декомпресирайте) ZIP архива:
Инструкциите за копиране на JDBC драйверите в съответните папки в инструментите на Pentaho са описани на следващата страница.
Имайте предвид, че от ноември 2019 г. инструментите на Pentaho версия 8.x няма да работят директно с по-новите драйвери на MySQL Connector версия 8.x. Най-лесното решение е да използвате драйверите на MySQL 5.x Connector. Заобиколно решение е да използвате драйверите на MySQL версия 8.x, но да използвате обща връзка. Някои дискусии можете да намерите на този линк. Друг съвет е да инсталирате PDI MySql Plugin от Pentaho Marketplace в Pentaho Data Integration.
Копиране на файловете с JDBC драйвер в папките Pentaho BA Server и Data Integration Lib
Намерете файла mysql-connector-java-5.1.41-bin.jar (имайте предвид, че той може да има малко по-различно име в зависимост от версията).
Копирайте този .jar файл в съответната папка LIB в дистрибуцията на Pentaho Community Edition.
За Pentaho Data Integration, целевата папка трябва да бъде .\Pentaho\data-integration\lib, както е показано по-долу:
Pentaho BA сървърът съхранява своите драйвери в папката .\pentaho-server\tomcat\lib. Уверете се, че MySQL JDBC драйвер не е вече инсталиран. Ако е така, запазете само най-новото копие на .jar файла. Например, версия 7.0 на Pentaho Server включва MySQL JDBC драйвер версия mysql-connector-java-5.1.17. Тази версия обаче има някои грешки, така че не забравяйте да премахнете този файл mysql-connector-java-5.1.17.jar и да го замените с най-новия файл mysql-connector-java-5.1.41-bin.jar.
След като JDBC драйверите са копирани в съответните папки, рестартирайте Pentaho BA Server (start-pentaho) и стартирайте инструментите за интегриране на данни (Spoon). Инструкции за създаване на връзка с база данни в Pentaho Data Integration Tools са предоставени на следващата страница.
Настройване на MySQL връзка в Pentaho Data Integration
Следвайте този набор от стъпки, за да създадете нова връзка с база данни към MySQL от инструментите за интеграция на данни Pentaho. В Pentaho Data Integration много от стъпките на трансформация изпращат данните към таблица на база данни. Някои примери могат да бъдат намерени в този урок за Pentaho Data Integration.
Преди да започнете, ще ви трябват идентификационни данни за вход в MySQL екземпляр. Може да пожелаете да посетите моя урок за настройка на безплатен екземпляр на MySQL на GearHost или този урок за инсталиране на MySQL на Windows.
В Pentaho Data Integration изберете всяка стъпка на трансформация, която използва база данни като изход, като стъпка Търсене/Актуализиране на измерения, Вмъкване/Актуализиране или Изход на таблица. Кликнете върху Ново бутон до името на връзката, за да изведете диалоговия прозорец за връзка с базата данни, както е показано по-долу.
Дайте име на връзката и след това изберете MySQL като тип на връзка.
Посочете Име на хост на сървъра, работещ с MySQL. Ако имате инсталиран MySQL на вашия локален компютър или сървър, използвайте localhost като Име на хост . Посочете Име на базата данни и използвайте номера на порта по подразбиране от 3306. Накрая дайте на базата данни MySQL Потребителско име и Парола .
Щракнете върху Тест бутон, за да се уверите, че връзката с базата данни функционира правилно.
Ако се появи следната грешка, уверете се, че .jar файлът на MySQL JDBC драйвер е копиран в Pentaho Data Integration lib папка (както е обсъдено на предишната страница на този урок). Излезте от инструмента за интеграция на данни и го стартирайте отново.
Error connecting to database [MySQLConnetion] : org.pentaho.di.core.exception.KettleDatabaseException: Error occurred while trying to connect to the database Driver class 'org.gjt.mm.mysql.Driver' could not be found, make sure the 'MySQL' driver (jar file) is installed.
Имайте предвид, че от ноември 2019 г. инструментите на Pentaho версия 8.x няма да работят директно с по-новите драйвери на MySQL Connector версия 8.x. Най-лесното решение е да използвате драйверите на MySQL 5.x Connector. Заобиколно решение е да използвате драйверите на MySQL версия 8.x, но да използвате обща връзка. Някои дискусии можете да намерите на този линк. Друг съвет е да инсталирате PDI MySql Plugin от Pentaho Marketplace в Pentaho Data Integration.
Не забравяйте да зададете целевата схема във всеки изход на база данни или стъпки за търсене на измерения. В MySQL схемата може да бъде оставена празна, за да се използва MySQL база данни по подразбиране.
Ако сте практикували извършване на трансформация срещу база данни H2 като цел, вие сте направили PUBLIC целевата схема. за MySQL просто оставете целевата схема празна, така че да се използва по подразбиране.
Следващата страница обхваща как да настроите нова връзка с база данни и източник на данни Mondrian в Pentaho BA Server.
Настройване на източник на данни MySQL в Pentaho BA сървър
От началната страница на Pentaho User Console щракнете върху Управление на източници на данни бутон, за да изведете екрана Управление на източници на данни. Първата стъпка от този момент ще бъде създаването на нова връзка с база данни с MySQL база данни.
Щракнете върху иконата на зъбно колело, за да отворите менюто и след това щракнете върху Нова връзка... елемент от менюто, както е показано по-долу.
Посочете име за новата връзка с база данни. Изберете MySQL като Тип база данни и след това щракнете върху опцията Native (JDBC) под Достъп: заглавие. Попълнете Име на хост , Име на базата данни , Номер на порт , Потребителско име и Парола за вашата MySQL база данни. Ако MySQL е инсталиран на вашия локален компютър или сървър, използвайте localhost като Име на хост .
Когато приключите, кликнете върху синия Тест бутон за тестване на връзката с базата данни
Ако има някакви грешки, проверете информацията за връзката (име на хост, потребителско име, парола и т.н.) и след това повторете теста.
Ако получите грешка относно SSL връзките (възможно е изчакване на връзката ви след няколко минути), добавете параметъра useSSL със стойността false, както е показано по-долу.
Когато приключите, щракнете върху OK бутон, за да запазите новата връзка с базата данни. Новата връзка с база данни вече трябва да се появи в списъка:
След като връзката е създадена и тествана, може да се създаде източник на данни на Mondrian. Тези инструкции са предоставени на следващата страница.
Създаване на нов източник на данни в Pentaho BA сървър
В Pentaho BA Server източникът на данни представлява схема на многоизмерна база данни на Mondrian, която се намира върху многоизмерно хранилище на данни или релационна база данни. Източникът на данни изисква връзка с основната база данни и върху нея да бъде изграден модел на данни на Mondrian. Моделът на данните на Mondrian се състои от измерения и мерки. Измеренията съдържат полета, които са подредени в йерархия. Възможно е да имате няколко различни модела на данни, които са изградени върху един и същ основен източник на данни.
За да започнете да създавате нов източник на данни, кликнете върху синия Нов източник на данни бутон. Съветникът за източник на данни ще се стартира.
Попълнете ново име за Източник на данни и изберете Връзка с база данни . Изберете таблица(и) на базата данни като Източник Тип. За този пример ще работим със звездна схема, така че избираме опцията за Отчитане и анализ .
Щракнете върху Напред бутон и Pentaho BA сървърът ще поиска схемата на основната база данни за връзката с базата данни
Следващият екран в съветника ще представи списък с таблиците, които са открити в схемата от връзката с базата данни.
Кликнете върху една от Наличните таблици и след това щракнете върху бутона със стрелка надясно, за да го преместите в Избрани таблици страна. Повторете това за всяка от таблиците, които ще бъдат включени в източника на данни.
Тъй като този пример използва опция „Отчитане и анализ“, една от таблиците на базата данни ще трябва да бъде избрана като Таблица с факти . След като тези промени бъдат направени, кликнете върху Напред бутон, за да преминете към последната стъпка за дефиниране на съединения.
Забележка:Ако не се появят външни ключове, уверете се, че работите с най-новия MySQL JDBC драйвер, тъй като той коригира няколко грешки. mysql-connector-java-5.1.17 е по-стара версия, която се доставя с Pentaho Server 7.0. Ако актуализирате JDBC драйвера, не забравяйте да рестартирате Pentaho BA сървъра.
За всяка двойка таблици щракнете върху Ключово поле в лявата таблица и свързаното ключово поле в дясната маса. След това кликнете върху Създаване на присъединяване връзка. В примера по-долу беше създадено обединяване между таблицата sales_fact и след това таблицата customer_dim с помощта на общия ключ customer_dim_id.
Повторете това за всеки чифт ключове. В този пример има една таблица с факти и 5 таблици с измерения, което води до създаването на 5 присъединявания. Ако направите грешка, маркирайте присъединяването и кликнете върху Изтриване на присъединяване връзка.
Когато приключите, щракнете върху Край бутон.
Щракнете върху OK бутон, за да се върнете към Управление на източници на данни екран.
Вече е създаден нов източник на данни с модел на данни по подразбиране. Този модел на данни обаче ще се нуждае от известно редактиране. Инструкции за редактиране на модел на данни на Mondrian са предоставени на следващата страница.
Редактирайте модела на данните на Mondrian, за да дефинирате измерения и мерки
Маркирайте източника на данни, издърпайте надолу иконата на зъбно колело и изберете Редактиране . Това ще отвори Редактор на модел на източник на данни . Моделът по подразбиране копира всички колони от схемата като размери и мерки. Този модел по подразбиране обаче вероятно няма да работи, тъй като йерархиите все още не са дефинирани.
Изчистване на съществуващия модел на данни
Щракнете върху бутона, показан по-долу, за Изчистване текущия модел.
Когато бъдете подканени да потвърдите, щракнете върху Да за да изчистите модела
Сега моделът ще бъде изчистен и Мерките и Размерите ще покажат предупреждение, тъй като няма съдържание.
Създаване на нова мярка
Създайте нова мярка, като плъзнете и пуснете Факт за продажби от Налично страна на Мерки запис под Анализ раздел.
Премахнете всеки от идентификаторите на величината и ORDER ID от мерките, тъй като това всъщност не са мерки (те са външни ключове). Щракнете върху Customer dim id и след това щракнете върху синия X за да го премахнете. Повторете за идентификаторите на другите измерения.
Създаване на величина КЛИЕНТ
С наличните Мерки могат да се създават Измерения. Кликнете върху Размери запис и след това щракнете върху Добавяне на измерение бутон, както е показано по-долу.
Наименувайте това ново измерение КЛИЕНТ (Уверете се, че използвате имена, различни от множествено число за размерите) и щракнете върху OK бутон.
КЛИЕНТЪТ измерението ще бъде създадено с йерархия КЛИЕНТ под него:
Отворете Customer Dim на панела Available. Плъзнете полето COUNTRY_NAME и го пуснете в Йерархията на CUSTOMER както е показано по-долу. Може да са необходими няколко опита, за да го поставите на правилното място.
Резултатът ще покаже ИМЕТО НА СТРАНАТА, което се появява в йерархията на КЛИЕНТИТЕ.
Повторете горните стъпки, за да добавите STATE_PROVINCE и CITY към йерархията на CUSTOMER. За всяко от полетата в йерархията на КЛИЕНТИТЕ променете типа География, за да съответства. Например COUNTRY_NAME трябва да има тип география „Държава“, а STATE_PROVINCE трябва да има тип география „Щат“.
Създаване на величина за дата
Щракнете върху записа ИЗМЕРЕНИЯ и след това щракнете върху Добавяне на измерение бутон. Наименувайте новото измерение ДАТА. Щракнете върху името на измерението ДАТА и поставете отметка в квадратчето за „Измерение на времето“:
Плъзнете и пуснете годината на продажбите, тримесечието на продажбите, името на месеца на продажбите, деня на продажбите в годината и датата на продажбите до ДАТА
Йерархията . За всяко поле изберете подходящия Тип ниво на времето и Формат на изходна колона .
Попълнената величина DATE трябва да изглежда по следния начин:
Създаване на измерението ПРОДУКТ
Кликнете върху Размери запис и след това щракнете върху Добавяне на измерение бутон. Наименувайте новото измерение ПРОДУКТ. Плъзнете и пуснете CATEGORY_NAME, SUB_CATEGORY_NAME и PRODUCT_NAME под Йерархията на PRODUCT .
Щракнете върху OK бутон, за да затворите редактора на модел на източник на данни.
Излезте от потребителската конзола на Pentaho, изключете Pentaho сървъра с помощта на скрипта stop-pentaho и след това рестартирайте Pentaho Server.
Сега, след като моделът на данните на Mondrian е създаден, новият източник на данни е готов да се използва за създаване на визуализации на табло за управление или за целите на отчитането.
Създаване на проста диаграма с помощта на OLAP Chart Wizard
Създайте ново табло за управление (или редактирайте съществуващо табло) и използвайте съветника за OLAP, за да създадете нова диаграма
По-долу е MDX заявката, която се генерира автоматично от OLAP съветника:
select NON EMPTY({Descendants([CUSTOMER].[All CUSTOMERs] ,[CUSTOMER].[CITY])}) on ROWS, NON EMPTY({Descendants([PRODUCT].[All PRODUCTs] ,[PRODUCT].[SUB CATEGORY NAME])}) on Columns from [Customer_Sales]