sql >> Database >  >> RDS >> Oracle

Cloudera CDP Data Center implementeren op Oracle Cloud Infrastructure (OCI)

Cloudera Data Platform (CDP) Data Center is een volledig dataplatform dat de nieuwste open-source analyses - Spark, Impala, Hive, HBase, Kafka, Hadoop en meer - verenigt tot een multifunctioneel analyse- en gegevensbeheersysteem met:

  • SQL-analyse met betere prestaties
  • Realtime verwerking en beheer van streams
  • Nauwkeurige op attributen gebaseerde toegangscontrole
  • Dynamische kolomfiltering en rijmaskering
  • Een 10x grotere schaalbaarheid van bestanden en objecten

Ik heb een Terraform (v0.12)-module gebruikt die CDP Data Center implementeert op Oracle Cloud Infrastructure (OCI).

Deze sjabloon biedt ondersteuning voor het targeten van bestaande VCN/subnetten voor clusterimplementatie. Om deze functionaliteit te activeren, gebruikt u het schemamenusysteem om een ​​bestaand VCN-doel te selecteren en selecteert u vervolgens de juiste subnetten voor elk type clusterhost.

1. Download het zipbestand voor de Cloudera Terraform-implementatie met Resource Manager .

2. Meld u aan bij de Oracle Cloud Infrastructure (OCI)

3. Selecteer Bronnenbeheer en klik op Stapels

4. Klik op Stack maken .

5. Op de Stapelinformatie pagina upload het zip-bestand dat u in stap 1 heeft gedownload en klik vervolgens op Volgende .

6. Op de Variabelen configureren pagina, voer de inhoud in van een "SSH verstrekte sleutel" (optioneel). Opmerking:als u Cloudera Manager op een privésubnet implementeert, hebt u een VPN of SSH-tunnel nodig via een Edge Node om toegang te krijgen tot clusterbeheer. Wanneer u een VPC maakt, moet u een reeks IPv4-adressen voor de VPC specificeren in de vorm van een Classless Inter-Domain Routing (CIDR)-blok, bijvoorbeeld 10.0.0.0/16. Klik op Volgende .

7. Controleer uw configuratie en klik op Maken.

9. Van de Terraform-acties menu selecteer Plan

10. Klik op Plan

11. Wacht even totdat deze taak is voltooid.

12. Terraform is succesvol geïnitialiseerd.

13. Taak voltooid Geslaagd

14. Diagram dat laat zien wat doorgaans wordt ingezet met behulp van deze sjabloon. Dat bronnen automatisch worden verdeeld over "Fault Domains" in een "Availability Domain" om fouttolerantie te garanderen.

Referenties

Meer informatie over het implementeren van Hadoop op Oracle Cloud Infrastructure. Beschikbaar op https://docs.oracle.com/en/solutions/learn-deploy-hadoop-oci/index.html#GUID-6BC025FF-829B-4BBD-9C80-69044F61F35B

Implementeer Hadoop eenvoudig op Oracle Cloud Infrastructure met Resource Manager. Beschikbaar op https://blogs.oracle.com/cloud-infrastructure/deploy-hadoop-easily-on-oracle-cloud-infrastructure-using-resource-manager

Cloudera op Oracle Cloud Infrastructure (Terraform-implementatiesjabloon). Beschikbaar op https://github.com/oracle-quickstart/oci-cloudera

Overzicht van Resource Manager. Beschikbaar op https://docs.cloud.oracle.com/en-us/iaas/Content/ResourceManager/Concepts/resourcemanager.htm

CDP datacenter. Beschikbaar op https://docs.cloudera.com/cdp/latest/overview/topics/cdpdc-overview.html


  1. Een externe sleutel toevoegen aan een bestaande tabel in SQLite

  2. Zijn er nadelen aan bitvlaggen in databasekolommen?

  3. Hoe Cotd() werkt in PostgreSQL

  4. Identiteitstoename springt in SQL Server-database