sql >> Database >  >> NoSQL >> HBase

Aan de slag met Cloudera Data Platform Operational Database (COD)

Begrippen

Wat is Cloudera Operational Database (COD)?

Operationele database is een relationele en niet-relationele database die is gebouwd op Apache HBase en is ontworpen om OLTP-toepassingen te ondersteunen die gebruikmaken van big data.

De operationele database in Cloudera Data Platform heeft de volgende componenten: 

  • Apache Phoenix biedt een relationeel model dat enorme schaalbaarheid mogelijk maakt. Het maakt gebruik van de schaalbaarheid en veerkracht van Apache HBase.
  • Apache HBase biedt een niet-relationeel model dat is ontworpen voor enorme schaalbaarheid, zodat u onbeperkte hoeveelheden gegevens op één platform kunt opslaan en kunt voldoen aan de groeiende vraag naar het leveren van gegevens.
  • Apache ZooKeeper biedt een gedistribueerde configuratieservice, een synchronisatieservice en een naamgevingsregister.
  • Apache Knox Gateway biedt perimeterbeveiliging zodat de onderneming vol vertrouwen de toegang tot nieuwe gebruikers kan uitbreiden.
  • Apache HDFS wordt gebruikt om de Apache HBase WAL's te schrijven (en in sommige gevallen HBase HFiles).
  • Objectstores zoals Amazon S3 en Microsoft ADLS Gen2 worden gebruikt om de Apache HBase HFiles op te slaan.
  • Shared Data Experience (SDX) wordt gebruikt voor beveiligings- en beheermogelijkheden. Beveiligings- en governancebeleid wordt eenmalig ingesteld en toegepast op alle gegevens en workloads. Net als CDP zelf, is SDX gebouwd op open source-projecten van de gemeenschap, waarbij Apache Ranger en Apache Atlas de hoofdrol spelen.

Atlas biedt open metadatabeheer en beheermogelijkheden om een ​​catalogus van alle activa op te bouwen en deze activa ook te classificeren en te beheren. De SDX-laag van CDP maakt gebruik van het volledige spectrum van Atlas om automatisch alle gegevensactiva te volgen en te beheren.

Ranger biedt beheer van beveiligingssleutels, met een aparte login voor sleutelbeheerders die de Ranger KMS-service gebruiken. Apache Ranger biedt ook de broodnodige beveiligingsfuncties, zoals kolommaskering en rijfiltering uit de doos. Een andere belangrijke factor is dat het toegangsbeleid in Ranger kan worden aangepast met dynamische context met behulp van verschillende attributen zoals 'geografische regio' of 'tijd van de dag'.

  • IDBroker is een REST API die is gebouwd als onderdeel van de authenticatieservices van Apache Knox. Hiermee kan een geverifieerde en geautoriseerde gebruiker een set inloggegevens of een token uitwisselen voor toegangstokens voor cloudleveranciers.

CDP Operationele Database Data Service

CDP Operational Database (COD) is een realtime automatisch schalende operationele database die wordt aangedreven door Apache HBase en Apache Phoenix. Het is een dataservice die draait op Cloudera Data Platform (CDP). U hebt rechtstreeks toegang tot COD vanaf uw CDP-console. Met COD kunt u met één klik een nieuwe operationele database maken en automatisch schalen op basis van uw werklast.

Dit zijn de belangrijkste stappen om aan de slag te gaan met COD:

  • Maak een database in een omgeving met een enkele klik en een database zou binnen een paar minuten beschikbaar moeten zijn.
  • Stel uw werkbelastingwachtwoord in. Voor meer informatie, klik hier.
  • Download en installeer Apache Maven, Java, Python 3.8.
  • Installeer CDP Client op uw computer. Klik hier voor meer informatie.
  • Volg de instructies in de voorbeeldrepository om wijzigingen aan te brengen in uw maven settings-security.xml, settings.xml en pom.xml.
  • Bouw de applicaties en voer ze uit.

Apache HBase

HBase is een kolomgeoriënteerde gegevensopslagarchitectuur die bovenop HDFS is gevormd om de beperkingen ervan te overwinnen. Het maakt gebruik van de basisfuncties van HDFS en bouwt hierop voort om schaalbaarheid te bieden door een groot volume van de lees- en schrijfverzoeken in realtime af te handelen. Hoewel de HBase-architectuur een NoSQL-database is, vereenvoudigt deze het proces van het onderhouden van gegevens door deze gelijkmatig over het cluster te verdelen. Hierdoor gaat het inzien en wijzigen van data in het HBase datamodel snel. Meer informatie over Apache HBase.

Apache Phoenix

Apache Phoenix is ​​een RDBMS- en ANSI SQL-interface. Apache Phoenix implementeert best-practice-optimalisaties om software-engineers in staat te stellen de volgende generatie datagestuurde applicaties te ontwikkelen op basis van HBase. Met Phoenix kunt u tabellen maken en ermee werken in de vorm van typische DDL/DML-statements met behulp van de standaard JDBC API, ODBC en Phoenix DB API.

Phoenix biedt:

  • SQL- en JDBC API-ondersteuning
  • Ondersteuning voor laattijdig, schema-on-read
  • Toegang tot gegevens die zijn opgeslagen en geproduceerd in andere componenten zoals Apache Spark en Apache Hive

Meer informatie over Apache Phoenix.

Procedure

Een operationele database maken

U kunt een operationele database maken in uw geregistreerde omgeving met behulp van CDP Operational Database (COD).

Vereisten

  • U moet zijn aangemeld bij de COD-omgeving als ODAdmin.
  • Zorg ervoor dat u gemachtigd bent om een ​​database aan te maken.

Stappen

  1. Log in op de CDP-webinterface. Bijvoorbeeld CDP-console.
  2. Selecteer operationele database.
  3. Klik in de COD-webinterface op Database maken.
  4. Selecteer de omgeving uit de lijst waarin u de database wilt hebben.
  5. Geef een naam op voor de database in het veld Databasenaam.
  6. Klik op Database maken.

Resultaat

Er wordt een informatiepagina weergegeven die de status van de database toont. Uw nieuwe database is klaar voor gebruik zodra de status Beschikbaar wordt.

Demo

Een databaseverbinding beheren

Nadat u een operationele database hebt gemaakt en deze beschikbaar is, kunt u de databaseverbindingen beheren.

Vereisten

  • Zorg ervoor dat een database actief en beschikbaar is.
  • U bent bevoegd om wijzigingen aan te brengen in de database.

Stappen

  1. Selecteer in de COD-webinterface de database waarvoor u de verbindingen wilt beheren.
  2. Ga onder Verbinden naar elk tabblad en wijzig de parameters.

Referenties

  • Cloudera-documentatie over het maken van een COD-database
  • Operationele database in CDP 

Als u geïnteresseerd bent in het uitproberen van CDP Public Cloud en de operationele database, probeer dan onze Proefrit .


  1. Eenvoudige manier om code te genereren met Mongoose en Node.js en Underscore?

  2. Het ABC van NestJS:een beginnershandleiding met MongoDB (Mongoose).

  3. Groeperen op voorwaarde in MongoDB

  4. Hoe kan ik mijn /sidekiq-route met een wachtwoord beveiligen (d.w.z. authenticatie vereisen voor de Sidekiq::Web-tool)?