Центърът за данни на Cloudera Data Platform (CDP) е изцяло платформа за данни, която обединява най-новите анализи с отворен код – Spark, Impala, Hive, HBase, Kafka, Hadoop и други – в многофункционална система за анализ и управление на данни, която включва:
- По-високопроизводителен SQL анализ
- Обработка и управление на потоци в реално време
- Подробен контрол на достъп, базиран на атрибути
- Динамично филтриране на колони и маскиране на редове
- 10 пъти увеличение на мащабируемостта на файлове и обекти
Използвах модул Terraform (v0.12), който внедрява CDP Data Center на Oracle Cloud Infrastructure (OCI).
Този шаблон има поддръжка за насочване към съществуващи VCN/подмрежи за внедряване на клъстер. За да включите тази функционалност, просто използвайте системата от менюта на схемата, за да изберете съществуваща VCN цел, след което изберете подходящи подмрежи за всеки тип хост на клъстер.
1. Изтеглете zip файла за внедряването на Cloudera Terraform с Диспечер на ресурси .
2. Влезте в Oracle Cloud Infrastructure (OCI)
3. Изберете Диспечер на ресурси и щракнете върху Stacks
4. Щракнете върху Създаване на стек .
5. В Информация за стека страница качете zip файла, който сте изтеглили в стъпка 1, след което щракнете върху Напред .
6. В Конфигуриране на променливи страница, въведете съдържанието на „SSH предоставен ключ“ (по избор). Забележка:Ако разположите Cloudera Manager в частна подмрежа, ще ви е необходим VPN или SSH тунел през Edge Node за достъп до управлението на клъстера. Когато създавате VPC, трябва да посочите диапазон от IPv4 адреси за VPC под формата на блок за безкласово междудомейнно маршрутизиране (CIDR), например 10.0.0.0/16. Кликнете върху Напред .
7. Проверете конфигурацията си и щракнете върху Създаване.
9. От Действия на Terraform от менюто изберете План
10. Щракнете върху Планиране
11. Изчакайте няколко минути, за да завърши тази задача.
12. Terraform е успешно инициализиран.
13. Работата е завършена успешно
14. Диаграма, показваща какво обикновено се разгръща с помощта на този шаблон. Тези ресурси се разпределят автоматично между „Домейн за грешки“ в „Домейн на наличност“, за да се гарантира устойчивост на грешки.
Препратки
Научете за внедряването на Hadoop в Oracle Cloud Infrastructure. Наличен на https://docs.oracle.com/en/solutions/learn-deploy-hadoop-oci/index.html#GUID-6BC025FF-829B-4BBD-9C80-69044F61F35B
Внедрете Hadoop лесно на Oracle Cloud Infrastructure с помощта на Resource Manager. Предлага се на https://blogs.oracle.com/cloud-infrastructure/deploy-hadoop-easily-on-oracle-cloud-infrastructure-using-resource-manager
Cloudera на Oracle Cloud Infrastructure (шаблон за внедряване на Terraform). Предлага се на https://github.com/oracle-quickstart/oci-cloudera
Преглед на Resource Manager. Достъпно на https://docs.cloud.oracle.com/en-us/iaas/Content/ResourceManager/Concepts/resourcemanager.htm
Център за данни на CDP. Наличен на https://docs.cloudera.com/cdp/latest/overview/topics/cdpdc-overview.html