Database
 sql >> база данни >  >> RDS >> Database

Визуализация на данни с помощта на Apache Zeppelin – Урок

В днешния свят данните се генерират с експоненциална скорост, дотолкова, че анализаторите прогнозират, че глобалното ни създаване на данни ще се увеличи 10 пъти до 2025 г. Сега фирмите събират данни във всяка вътрешна система и външен източник, който влияе върху тяхната компания; и с него идва непрекъснато нарастващата нужда от анализиране на данните, за да се получи представа как те могат да бъдат използвани за подобряване и подобряване на техните бизнес решения. Apache Zeppelin, платформа за анализ на данни и визуализация с отворен код, може да ни отведе дълъг път към постигането на тази цел.

В тази статия ще научите как да добавите персонализиран интерпретатор за MongoDB и MySQL и как да го използвате за заявки и визуализиране на данни за събиране. Първо, нека започнем с преглед на Apache Zeppelin и неговия набор от функции:

Какво е Apache Zeppelin?

Apache Zeppelin е уеб-базиран „бележник“ с отворен код, който позволява интерактивен анализ на данни и съвместни документи. Ноутбукът е интегриран с разпределени системи за обработка на данни с общо предназначение, като Apache Spark (мащабна обработка на данни), Apache Flink (рамка за обработка на поток) и много други. Apache Zeppelin ви позволява да създавате красиви, управлявани от данни, интерактивни документи със SQL, Scala, R или Python направо в браузъра си.

Функции на Apache Zeppelin

Интерактивен интерфейс

Apache Zeppelin има интерактивен интерфейс, който ви позволява незабавно да видите резултатите от вашите анализи и да имате незабавна връзка с вашето творение:

Преносими компютри с браузър

Създавайте бележници, които се изпълняват във вашия браузър (както на вашата машина и отдалечено) и експериментирайте с различни типове диаграми, за да изследвате вашите набори от данни:

Интеграции

Интегрирайте се с много различни инструменти с отворен код и големи данни, като проекти на Apache Spark, Flink, Hive, Ignite, Lens и Tajo.

Динамични форми

Динамично създавайте формуляри за въвеждане направо във вашия бележник.

Сътрудничество и споделяне

Разнообразна и жизнена общност на разработчиците ви дава достъп до нови източници на данни, които непрекъснато се добавят и разпространяват чрез техния лиценз с отворен код Apache 2.0.

Преводач

Концепцията за интерпретатор на Apache Zeppelin позволява всеки език/бекенд за обработка на данни да бъде включен към Zeppelin. Понастоящем Apache Zeppelin поддържа много интерпретатори като Apache Spark, Python, JDBC, Markdown и Shell.

Сега, нека започнем да създаваме вашия персонализиран интерпретатор за MongoDB и MySQL.

Добавете интерпретатор на MySQL

В платформата Apache Zeppelin отидете на падащото меню в горния десен ъгъл и щракнете върху Interpreter:

Ето къде можете да намерите списък с всички преводачи. Трябва да създадем нов за MySQL, така че кликнете върху бутона „Създаване“ в горния десен ъгъл:

Въведете разпознаваемо име за интерпретатора (например mysql) и изберете група като JDBC:

Запазете всички опции по подразбиране, но въведете необходимите подробности и се уверете, че е установена връзка с вашия MySQL сървър:

Също така трябва да добавим персонализиран артефакт към MySQL конектора JAR, така че Zeppelin да знае откъде да го изпълни. Изтеглете конектора тук, поставете го в папката interpreter/jdbc и след това посочете точния път до артефакта:

И това е! За да тестваме нашия интерпретатор, трябва да създадем нова бележка. Но първо, нека настроим и нашия MongoDB интерпретатор.

Добавете интерпретатор на MongoDB

Върнете се на страницата си за преводач и щракнете върху бутона „Създаване“. Ще използваме този интерпретатор MongoDB с отворен код, така че след това ще трябва да изтеглите .zip файла и да го преименувате на .jar.

След това отидете на interpreters/, създайте папка mongodb/ и поставете .jar в папката.

Вече имате нова група преводачи, наречена mongodb. Отидете на вашата страница за преводач, въведете приятелско име като mongodb, след което изберете mongodb от падащото меню на групата интерпретатори.

Сега, нека въведем нашите новосъздадени подробности за клъстера ScaleGrid MongoDB в „Свойства“, намиращи се на страницата Подробности за клъстера в секцията Преглед/Машини.

И сме готови! Сега е време да изпробваме нашите новосъздадени интерпретатори.

Създайте бележка на Zeppelin

За изпълнение на заявки, които ще помогне да визуализираме нашите данни, трябва да създадем бележки. От заглавния панел на Zeppelin щракнете върху „Бележник“ и след това „Създаване на нова бележка“:

Уверете се, че заглавката на бележника показва свързано състояние като означено със зелена точка в горния десен ъгъл:

Когато създавате бележка, ще ви бъде представен диалогов прозорец за въвеждане на повече информация. Изберете интерпретатора по подразбиране като новосъздадения mysql и щракнете върху „Създаване на бележка“.

Изпълнете заявки в бележката

Преди да можем да стартираме всякакви запитвания, ние също трябва да споменем вида на интерпретатора, който ще използваме за нашата бележка. Можем да направим това, като започнем нашата бележка с „%mysql“. Това ще каже на Zeppelin да очаква MySQL заявки в тази бележка.

И сега сме готови да потърсим нашата база данни. За целите на този пример ще използвам моята инсталация на WordPress, която съдържа типична таблица wp_options, за да потърся и визуализирам нейните данни.

Работи! Вече можете да щракнете върху различните диаграми, за да визуализирате данните в различни графични формати.

По същия начин, за MongoDB се уверете, че имате данни в клъстера MongoDB. Можете да добавите някои, като отидете в раздела Администриране и стартирате заявки за Mongo.

Ето пример за някои данни на MongoDB в бележката:

Споделете връзки към вашите бележки

Сега, когато вашите данни са готови за визуализация и запитване, може да искате да ги покажете на екипа си. Можете да направите това много лесно, като създадете връзка за споделяне към бележката:

Тази връзка за споделяне ще бъде достъпна за преглед от всеки, а също така можете да изберете да споделите връзка само към конкретна графика:

Заключение на Apache Zeppelin

Apache Zeppelin е изключително полезен инструмент, който позволява на екипите да управляват и анализират данни с много различни опции за визуализация, таблици и връзки за споделяне за сътрудничество. Ето някои полезни връзки, за да започнете:

Изтеглете Apache Zeppelin

MongoDB Interpreter

MySQL конектор

Можете също да изследвате други начини за визуализиране на вашите данни чрез MongoDB GUI, включително първите четири:MongoDB Compass, Robomongo, Studio 3T и MongoBooster.

Както винаги, ако създадете нещо страхотно, туитнете ни за това @scalegridio

Ако имате нужда от помощ за хостинг и управление на Redis™*, свържете се с нас на [email protected] за допълнителна информация.


  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Свързване с Lotus Notes от Java

  2. Онлайн инструменти за изпробване на SQL дизайн и заявки

  3. Първи стъпки с Django Channels

  4. Модел на база данни за онлайн проучване. Част 2

  5. Модел на данни за търговия с акции, фондове и криптовалути