Cloudera Data Platform (CDP) Data Center is een volledig dataplatform dat de nieuwste open-source analyses - Spark, Impala, Hive, HBase, Kafka, Hadoop en meer - verenigt tot een multifunctioneel analyse- en gegevensbeheersysteem met:
- SQL-analyse met betere prestaties
- Realtime verwerking en beheer van streams
- Nauwkeurige op attributen gebaseerde toegangscontrole
- Dynamische kolomfiltering en rijmaskering
- Een 10x grotere schaalbaarheid van bestanden en objecten
Ik heb een Terraform (v0.12)-module gebruikt die CDP Data Center implementeert op Oracle Cloud Infrastructure (OCI).
Deze sjabloon biedt ondersteuning voor het targeten van bestaande VCN/subnetten voor clusterimplementatie. Om deze functionaliteit te activeren, gebruikt u het schemamenusysteem om een bestaand VCN-doel te selecteren en selecteert u vervolgens de juiste subnetten voor elk type clusterhost.
1. Download het zipbestand voor de Cloudera Terraform-implementatie met Resource Manager .
2. Meld u aan bij de Oracle Cloud Infrastructure (OCI)
3. Selecteer Bronnenbeheer en klik op Stapels
4. Klik op Stack maken .
5. Op de Stapelinformatie pagina upload het zip-bestand dat u in stap 1 heeft gedownload en klik vervolgens op Volgende .
6. Op de Variabelen configureren pagina, voer de inhoud in van een "SSH verstrekte sleutel" (optioneel). Opmerking:als u Cloudera Manager op een privésubnet implementeert, hebt u een VPN of SSH-tunnel nodig via een Edge Node om toegang te krijgen tot clusterbeheer. Wanneer u een VPC maakt, moet u een reeks IPv4-adressen voor de VPC specificeren in de vorm van een Classless Inter-Domain Routing (CIDR)-blok, bijvoorbeeld 10.0.0.0/16. Klik op Volgende .
7. Controleer uw configuratie en klik op Maken.
9. Van de Terraform-acties menu selecteer Plan
10. Klik op Plan
11. Wacht even totdat deze taak is voltooid.
12. Terraform is succesvol geïnitialiseerd.
13. Taak voltooid Geslaagd
14. Diagram dat laat zien wat doorgaans wordt ingezet met behulp van deze sjabloon. Dat bronnen automatisch worden verdeeld over "Fault Domains" in een "Availability Domain" om fouttolerantie te garanderen.
Referenties
Meer informatie over het implementeren van Hadoop op Oracle Cloud Infrastructure. Beschikbaar op https://docs.oracle.com/en/solutions/learn-deploy-hadoop-oci/index.html#GUID-6BC025FF-829B-4BBD-9C80-69044F61F35B
Implementeer Hadoop eenvoudig op Oracle Cloud Infrastructure met Resource Manager. Beschikbaar op https://blogs.oracle.com/cloud-infrastructure/deploy-hadoop-easily-on-oracle-cloud-infrastructure-using-resource-manager
Cloudera op Oracle Cloud Infrastructure (Terraform-implementatiesjabloon). Beschikbaar op https://github.com/oracle-quickstart/oci-cloudera
Overzicht van Resource Manager. Beschikbaar op https://docs.cloud.oracle.com/en-us/iaas/Content/ResourceManager/Concepts/resourcemanager.htm
CDP datacenter. Beschikbaar op https://docs.cloudera.com/cdp/latest/overview/topics/cdpdc-overview.html