Apache Phoenix voor CDH:beste nieuwe functie voor DBMS
Cloudera adopteert en zal Apache Phoenix voor CDH ondersteunen, terwijl het het integreert voor zijn Cloudera Data Platform op een go-forward-basis.
De CDH-releases van Cloudera omvatten Apache HBase, dat een veerkrachtig NoSQL DBMS biedt voor operationele applicaties van klanten die de kracht van big data willen benutten. Deze applicaties zijn uitgegroeid tot missie-belangrijke en missiekritieke applicaties die de omzet en de winstgevendheid stimuleren. Deze applicaties omvatten klantgerichte applicaties, e-commerceplatforms, risico- en fraudedetectie die achter de schermen bij banken wordt gebruikt of AI/ML-modellen voor applicaties en het mogelijk maken van verdere versterkingstraining hiervan op basis van werkelijke resultaten.
Voor veel klanten was HBase echter een te ontmoedigende reis, waardoor ze moesten leren
- Een nieuw gegevensmodel als HBase is een schema met brede tabellen dat miljoenen kolommen ondersteunt, maar geen joins en
- Java API's gebruiken in plaats van ANSI SQL
Ze hebben gevraagd om een meer traditioneel schemaontwerp te kunnen gebruiken dat lijkt op dat van Oracle of MySQL en waren bereid om een aantal compromissen te sluiten op het gebied van flexibiliteit, bijvoorbeeld
- Ze zijn bereid om verstrekte gegevenstypen te gebruiken in plaats van hun eigen te definiëren
- Ze zijn bereid de flexibiliteit op te geven om een enkele kolom meerdere typen te laten hebben, afhankelijk van de rij, in ruil voor een enkel type in een enkele rij
Om klanten in staat te stellen gemakkelijk toegang te krijgen tot de andere voordelen van Apache HBase (onbeperkt uitschalen, miljoenen rijen, schema-evolutie, enz.) box, enz.), introduceren we ondersteuning voor Apache Phoenix op CDH.
Voor alle anderen profiteren op Phoenix gebaseerde applicaties ook van HBase-optimalisaties achter de schermen, waardoor het gemakkelijker wordt om betere HBase-prestaties te krijgen. Phoenix implementeert bijvoorbeeld salting van primaire sleutels, zodat HBase-gebruikers niet hoeven na te denken over dit aspect van sleutelontwerp.
Verder kunnen op Phoenix gebaseerde applicaties naast HBase-applicaties bestaan, wat betekent dat u een enkel HBase-cluster kunt gebruiken om beide te ondersteunen. Met Phoenix kunnen klanten hun favoriete BI- en dashboardingtools blijven gebruiken, net zoals ze dat in het verleden met Hive &Impala deden. Wanneer ze Phoenix gebruiken, kunnen ze er ook voor kiezen om Phoenix rechtstreeks met die tools te gebruiken, naast de optie om Hive / Impala te gebruiken, waardoor een stap voor nieuwe implementaties wordt geëlimineerd.
Vanuit een beveiligings- en governanceperspectief (SDX) gebruikt Phoenix in CDH HBase ACL's voor op rollen gebaseerde toegangscontrole voor Phoenix-tabellen. Phoenix gebruikt ook HBase-integratie in Cloudera Navigator voor controle-informatie.
Cloudera heeft een Phoenix 4.14.1-pakket vrijgegeven dat beschikbaar is voor CDH 5.16.2-klanten en een Phoenix 5.0-pakket dat beschikbaar is voor CDH 6.2+ klanten.
Bestaande HDP-klanten hebben al Apache Phoenix-ondersteuning en bijna de helft van de HBase-gebruikers die HDP gebruiken, gebruikt momenteel ook Phoenix en spreekt over zijn populariteit in de HBase-gebruikersgemeenschap.
Apache Phoenix voor CDH downloaden
Bouw bedrijfskritische applicaties met Apache Phoenix. Download de software hier.
Veelgestelde vragen over Phoenix
V) Voor welke werkbelastingen zou Phoenix moeten worden gebruikt
Phoenix ondersteunt dezelfde gebruiksscenario's als HBase, voornamelijk workloads met lage latentie en hoge gelijktijdigheid. Phoenix maakt het echter eenvoudiger om de onderliggende gegevens ook te gebruiken voor dashboarding en BI-doeleinden
V) Wat is het autorisatiemechanisme met Phoenix?
Phoenix is voor autorisatie afhankelijk van HBase. Voor CDH-klanten maakt dit gebruik van HBase ACL's. Voor HDP-klanten is dit via HBase-Ranger-integratie
V) Wat is de schaalbaarheid van Phoenix? Wat is de grootste bekende cluster?
Phoenix schaalt naar honderden TB aan gegevens. De grootste klant heeft meer dan 0,5 PB aan data die wordt beheerd door Phoenix. Specifieke gebruiksscenario's zijn te vinden in de PhoenixCon-archieven en in de archieven voor NoSQL-dagvideo's eerder dit jaar in eigen woorden en dia's van gebruikers.
V) Ondersteunt Phoenix secundaire geografische indexering? Welk niveau van ondersteuning ruimtelijke gegevens?
Het heeft beperkte ondersteuning voor geospatiale gegevens. GeoMesa biedt echter een geospatiale laag op HBase die deze behoefte kan ondersteunen en kan worden geïntegreerd met klantapplicaties. Phoenix, GeoMesa evenals JanusGraph en OpenTSDB kunnen allemaal naast elkaar bestaan in een enkel HBase-cluster.
V) Hoe maak en gebruik je een index?
Zie de Phoenix Secondary Indexing-pagina voor meer informatie over indexeren. Vanaf Phoenix 4.8.0 zijn er geen configuratiewijzigingen nodig om lokale indexering te gebruiken.
V) Is er een limiet voor het aantal kolommen dat u in de index kunt plaatsen?
Net als in een RDBMS is een index in wezen een aparte tabel met de index en een link naar de brongegevens. Als u alle kolommen indexeert, verslaat u het doel door twee identieke tabellen te onderhouden. Indexen moeten oordeelkundig worden gebruikt, aangezien er enige niet-triviale overhead is bij schrijven (algemene indexen) of lezen (lokale indexen).