sql >> Database >  >> NoSQL >> HBase

Operationele database in CDP

Noot van de redactie, augustus 2020:CDP Data Center heet nu CDP Private Cloud Base. Je kunt er hier meer over leren.

Cloudera's operationele database (OpDB) in CDP levert een realtime, altijd beschikbare, schaalbare OpDB die traditionele gestructureerde gegevens naast nieuwe ongestructureerde gegevens bedient binnen een verenigd operationeel en magazijnplatform. Cloudera levert een operationele database die traditionele gestructureerde gegevens bedient naast nieuwe ongestructureerde gegevens binnen een uniform open-sourceplatform.

De operationele database helpt u om:

Operationaliseer machine learning/kunstmatige intelligentie om een ​​revolutie teweeg te brengen in sectoren zoals de gezondheidszorg, openbare nutsbedrijven, enz. 

  • Realtime content aanbieden op webschaal.
  • Maak analyse van big data mogelijk voor operationeel en offline gebruik.
  • Gebruik als een veerkrachtige archiefopslag.

OpDB in CDP is momenteel beschikbaar in twee vormfactoren:als een volledig veilig, semi-beheerd aanbod in CDP Public Cloud – Data Hub, en als een volledig aanpasbaar aanbod in CDP Data Center – vergelijkbaar met wat al beschikbaar is in CDH en HDP. U kunt een vormfactor kiezen op basis van uw implementatiestrategie en OpDB-behoeften. De operationele database gebruikt een objectstore zoals Amazon S3 als opslaglaag voor Apache HBase, waarbij HFiles naar de objectstore worden geschreven, maar WAL's naar HDFS.

De operationele database in CDP heeft de volgende componenten: 

  • Apache Phoenix een SQL-interface die bovenop Apache HBase draait.
  • Apache HBase is ontworpen voor enorme schaalbaarheid, zodat u onbeperkte hoeveelheden gegevens op één enkel platform kunt opslaan en kunt voldoen aan de groeiende vraag naar het leveren van gegevens.
  • Apache ZooKeeper biedt een gedistribueerde configuratieservice, een synchronisatieservice en een naamgevingsregister.
  • Apache Knox Gateway biedt perimeterbeveiliging zodat de onderneming vol vertrouwen de toegang tot nieuwe gebruikers kan uitbreiden.
  • Apache HDFS wordt gebruikt om de Apache HBase WAL's te schrijven.
  • Objectstore zoals Amazon S3 en Microsoft ADLS Gen2 wordt gebruikt om de Apache HBase HFiles op te slaan.
  • Shared Data Experience (SDX) wordt gebruikt voor beveiligings- en beheermogelijkheden. Beveiligings- en governancebeleid wordt eenmalig ingesteld en toegepast op alle gegevens en workloads.
  • IDBroker is een REST API die is gebouwd als onderdeel van de authenticatieservices van Apache Knox. Hiermee kan een geverifieerde en geautoriseerde gebruiker een set inloggegevens of een token uitwisselen voor toegangstokens voor cloudleveranciers.

Operationele database in CDP-serie 

Dit artikel gaf u een inleiding over OpDB op CDP en zijn architectuur. U kunt meer te weten komen over elk aspect van de OpDB en meer te weten komen over de nieuwe functies en mogelijkheden van OpDB in de komende artikelen van deze serie. We zullen de links naar elke blogpost bijwerken zodra ze worden gepubliceerd.

Toegankelijkheid

Cloudera's OpDB zorgt ervoor dat gebruikers toegang hebben tot opgeslagen gegevens of deze kunnen ophalen. Het ondersteunt zowel auto-sharding als vooraf gedefinieerde sharding, drie query-engines en verschillende tools voor gegevensintegratie. Dit artikel geeft een overzicht van deze mogelijkheden en andere functies die zorgen voor een hoge mate van toegankelijkheid.

Beheer

Cloudera's OpDB biedt verschillende beheertools en functies om uw OpDB-workload te beheren. Beheerders kunnen OpDB inzetten als een volledig veilig, semi-beheerd aanbod in CDP Public Cloud – Data Hub en als een volledig aanpasbaar aanbod in CDP Data Center (vergelijkbaar met wat beschikbaar is in CDH en HDP). Dit artikel biedt u een overzicht op hoog niveau van welke functies en hulpprogramma's worden ondersteund om OpDB in CDP te beheren.

Beheer

OpDB van Cloudera biedt beheertools waarmee u uw OpDB-workloads effectief kunt beheren. Dit artikel geeft u een overzicht van de OpDB-beheertools en -functies in CDP.

Beschikbaarheid

Cloudera's OpDB handhaaft een hoog niveau van gegevensbeschikbaarheid, zodat de vereiste gegevens toegankelijk zijn wanneer en waar nodig, zelfs als er een node-fout optreedt. Dit artikel geeft een overzicht van features die een hoge beschikbaarheid mogelijk maken, zoals kant-en-klare High Availability, Data Replicatie en Error Protection.

Integriteit

Cloudera's OpDB biedt verschillende mogelijkheden voor gegevensintegriteit, waaronder integriteit van entiteiten en domeinen, ACID-transacties en niet-relationele integriteit. Dit artikel geeft een overzicht van de mogelijkheden van OpDB-gegevensintegriteit.

Applicatie-ondersteuning

Cloudera's OpDB ondersteunt verschillende populaire talen, frameworks en applicaties die u kunt gebruiken om toegang te krijgen tot gegevens die zijn opgeslagen in uw OpDB. Dit artikel geeft je een overzicht van de ondersteunde talen, frameworks en applicaties.

NoSQL en gerelateerde mogelijkheden

Omdat Cloudera's OpDB de NoSQL-database HBase bevat om gegevens op te slaan, heeft het NoSQL-mogelijkheden, zoals sleutelwaarden, tabelachtige mogelijkheden en flexibele gegevenstypen. Er wordt ook gezorgd voor nauwe integratie in het Hadoop-ecosysteem, inclusief HDFS, Spark en Kafka. Dit artikel geeft een overzicht van deze mogelijkheden.

Schaalbaarheid

Cloudera's OpDB is ontworpen voor hoge schaalbaarheid en ondersteunt zowel verticale als horizontale schaalbaarheid met een flexibel gegevenstype en geen limiet op de gegevensgrootte. Dit artikel biedt een overzicht van ondersteunde functies en hulpprogramma's voor schaalbaarheid.

Beveiliging

Cloudera's OpDB biedt meerdere beveiligingsoplossingen op verschillende niveaus, met betrekking tot encryptie, authenticatie, autorisatie en audit. Dit artikel geeft een overzicht van deze beveiligingsgerelateerde functies en tools.

Ga voor meer informatie naar:Aan de slag met Operational Database.


  1. Heeft de lengte van de naam invloed op de prestaties in Redis?

  2. Verkrijg de index van een item op waarde in een redis-lijst

  3. Ingesloten documenteigenschap bijwerken in Mongodb

  4. Efficiënte manier om gegevens uit Redis . in kaart te brengen