Database
 sql >> база данни >  >> RDS >> Database

Продуктова номенклатура и архитектура на IRI

Имената на софтуерните продукти на IRI и начина, по който работят, понякога са били източник на мистерия или дори объркване за непосветените. Тази статия описва частите и изяснява тяхното взаимодействие, осигурявайки бърза подготовка за бъдещи потребители, партньори и анализ на новата индустрия бр.

Откъде започна всичко

Започна с IRI CoSort през 1978 г., помощната програма за сортиране, трансформиране и отчитане на големи данни за Unix и Windows, която все още се използва широко и днес. Преди CoSort този първи IRI продукт се наричаше CO-SORT, COSORT и CoSORT в този ред.

През 1992 г. IRI добави синтаксиса и програма за манипулиране на данните за езика за контрол на сортирането (SortCL) към другите помощни програми и API в пакета CoSort. Днес SortCL е най-широко използваният и пълен с функции потребителски интерфейс в пакета CoSort.

Скриптовете на SortCL дефинират и програмата sortcl изпълнява заданията, които изпълняват и комбинират много общи задачи за движение на данни и картографиране, които потребителите на CoSort трябва да изпълняват. SortCL е не само прост 4GL за учене, четене и модифициране, но също така се поддържа чрез API (наречен sortcl_routine) и графично в безплатната IRI Workbench IDE, изградена на Eclipse.

С разширяването на функционалността на SortCL тя надрасна традиционния пазар на CoSort за миграции на сортиране и BI/DW ускорение. Днес изпълнимият файл SortCL е не само двигателят, който изпълнява повечето задачи на CoSort, но е и биещото сърце на няколко допълнителни продукти, илюстрирани тук:

Спин-оф продукти на CoSort / SortCL

По-конкретно, същата машина на SortCL и съвместими скриптове за работа – обикновено проектирани и често управлявани от IRI Workbench, обработват структурирани източници на данни в:

  1. IRI FieldShield и IRI DarkShield за маскиране на данни
  2. IRI RowGen за синтез на тестови данни и поднабор на база данни
  3. IRI NextForm за преобразуване и репликация на данни и база данни и,
  4. Задачи на платформата за управление на данни IRI Voracity, които включват тези в CoSort и продуктите, свързани по-горе, плюс допълнителни възможности за преден край чрез общия графичен интерфейс на Workbench, като:
  • Откриване на данни (профилиране, класификация и търсене)
  • Склад за данни ETL, CDC и SDC
  • Миграция на Data Vault 2.0 и създаване на прототипи
  • Качество на данните (валидиране, почистване, хомогенизиране)
  • Аналитика или спорове за данни за Splunk и KNIME и други BI инструменти чрез предаване

Друг начин да погледнете йерархията на продуктите е по следния начин:

където Workbench IDE е мястото, където са проектирани всички работни места за продукти на IRI — включително тези допълнителни функции, поддържани в Voracity.

Често задаван въпрос

Тъй като SortCL стартира с CoSort и е общ за всички тези продукти, означава ли това, че мога да използвам CoSort или друг продукт по-горе, за да правя това, което правят и другите продукти?

Отговорът е да и не. Да, имате SortCL и на теория можете да свършите част от същата работа, която друг съвместим със SortCL IRI продукт е предназначен да извърши. Но би било по-трудно и представлява производствен риск. IRI предоставя само документация и поддръжка за задачите, най-добре свързани с вашия лицензиран(и) продукт(и) на IRI.

Следователно възможностите за кросоувър са ограничени на практика. Независимо от това, комбинираната функционалност е често срещана в много случаи (като сортирано подмножество на DB), а в Voracity случаите на използване с много задачи и няколко стъпки (като инкрементално картографиране, маскиране, почистване и преформатиране) са високо ефективни и напълно поддържани.

SortCL е машината по подразбиране във всички IRI Voracity CDC, ETL, CDC, почистване, съгласуване, поднастройка ,
Задачи за маскиране на PII, синтез на тестови данни, преобразуване, преформатиране, спорове, анализиране и отчитане.

Архитектура по време на изпълнение

След като вече знаете имената на продуктите, нека покрием как те са взаимосвързани и се разгръщат.

IRI софтуерът обикновено работи в модел клиент/сървър, където съвместимите със SortCL задания се дефинират в среда за редактиране от преден край като IRI Workbench или друг текстов редактор, или чрез IRI API. Тези работни места обикновено се изпълняват в софтуерната програма SortCL на Linux, Unix или Windows (физически или виртуални) машини, на място или в облака:

Някои задания, скриптирани в синтаксиса на SortCL, могат също да се изпълняват без промяна директно в Map Reduce 2, Spark, Spark Stream, Story или Tez за лицензополучатели на изданието Voracity Grid (VGrid) за Hadoop.

Имайте предвид обаче, че за разлика от много други програми за ETL и маскиране на данни, няма CoSort сървър, където SortCL трябва да се изпълнява или да се управлява централизирано. Лекият изпълним файл SortCL може да работи навсякъде от Raspberry Pi до z/Linux мейнфрейм.

Следователно според диаграмата по-горе е обичайно сайтовете да имат инсталирани тестови и QA SortCL екземпляри на лаптопи за разработчици, работещи с IRI Workbench, както и на централизирани сървъри на файлове или бази данни, за да оптимизират производителността. Този често задаван въпрос обхваща въпроса къде да се лицензира SortCL в контекста на продуктите за маскиране на данни на IRI, например, и как да се вземат предвид съответните разходи.

Ако имате въпроси относно кой продукт на IRI се нуждаете или как най-добре да го внедрите на хардуера, който имате (или планирате да предоставите), моля, свържете се с вашия представител на IRI.


  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Пагинация с OFFSET / FETCH :По-добър начин

  2. Как да гарантираме, че базите данни нямат фрагментирани индекси

  3. Бивш изпълнителен директор на Capgemini, Сунита Рей, се присъединява към ScaleGrid DBaaS, за да разшири корпоративните продажби

  4. Наемане или наемане:Модел на данни за процеса на подбор

  5. Въздействие на плана за изпълнение върху ASYNC_NETWORK_IO изчаквания – част 1