sql >> Database >  >> RDS >> Sqlserver

Wat machine learning betekent voor databaseprofessionals

Machine learning-databases worden nu volwassen. Dit biedt enorme kansen voor databaseprofessionals die kunnen evolueren om van deze verandering te profiteren.

Momenteel zijn databaseprofessionals, zoals databasebeheerders (DBA) en databaseontwikkelaars, enkele van de belangrijkste functies in elke IT-organisatie. Een databaseprofessional is verantwoordelijk voor het creëren, beheren en gecontroleerd toegang verlenen tot een database. Het hebben van de juiste persoon als DBA kan bedrijven helpen tijd te besparen en de ontwikkeltijd van applicaties te verkorten. Met de toenemende toegang tot een enorme hoeveelheid gegevens, evolueren de verantwoordelijkheden van een databaseprofessional echter snel.

Er zijn verschillende technologieën ontwikkeld die kunnen worden gebruikt om niet alleen data te beheren en te verkennen, maar die kunnen helpen om weloverwogen beslissingen te nemen op basis van data. Machine learning is zo'n technologie die de afgelopen tien jaar een grote vlucht heeft doorgemaakt. Dit artikel geeft een kort overzicht van de invloed van machine learning op databaseberoepen en wat de voordelen zijn van het gebruik van machine learning als vaardigheden.

Wat is machine learning?

Machine learning is een proces van het begrijpen en extraheren van bruikbare patronen uit gegevens met behulp van verschillende statistische algoritmen. Machine learning is verder onderverdeeld in gesuperviseerde en niet-gesuperviseerde leertechnieken. Machine learning wordt momenteel gebruikt om veel complexe problemen op te lossen, zoals het classificeren van ham- en spam-e-mails, het voorspellen van huizenprijzen, het genereren van poëzie, het classificeren van afbeeldingen, enzovoort.

Zal machinaal leren databaseberoepen vervangen?

Een van de meest voorkomende misvattingen over machine learning is dat het bij veel banen mensen gaat vervangen. Hoewel dit voor sommige repetitieve taken waar kan zijn, zullen AI en machine learning in feite het menselijk brein aanvullen, niet vervangen. Voor databaseprofessionals zullen machine learning-databases ze niet vervangen, maar ze zullen hen enorm helpen.

Het stelt databaseprofessionals in staat zich veel meer te concentreren op planning en strategische taken, omdat het saaiere en autonomere taken zoals installatie, configuratie en regelmatige database-updates zal automatiseren. Daarom moeten databaseprofessionals, in plaats van bang te zijn voor de impact van machine learning op hun werk, het omarmen als een manier om minder uitdagende taken veel sneller en efficiënter uit te voeren. .

Omgaan met big data is een uitdaging

Door de opkomst van het wereldwijde web in de afgelopen twee decennia zijn data in alle soorten en maten beschikbaar. In feite wordt de term big data vaak gebruikt voor de dataset die enorm in volume is, met een hoge snelheid komt en een verscheidenheid aan inhoud bevat.

Het verwerken van enorme hoeveelheden van dergelijke ongestructureerde gegevens is een uitdaging geworden voor DBA. Algoritmen die op machine learning-databases worden uitgevoerd, blijken ook goed te werken met ongestructureerde gegevens. Een enorme hoeveelheid gegevens kan eenvoudig worden opgesplitst in zinvolle informatie via machine learning-technieken die de noodzaak voor databaseprofessionals benadrukken om machine learning-vaardigheden te verwerven.

Machine Learning-databases zijn er

Bedrijven zoals Microsoft en Oracle zijn al begonnen met het integreren van verschillende machine learning-mogelijkheden in databases. Microsoft Azure SQL Database heeft bijvoorbeeld een module die verschillende strategieën voor prestatieverbetering suggereert en aanbeveelt die automatisch kunnen worden toegepast. Op dezelfde manier biedt de SQL Server Query Store een plan om query's te identificeren die prestatieknelpunten veroorzaken. Oracle 18c-database bevat zelfherstelmogelijkheden en kan zelfpatches toepassen en upgraden wanneer zich een databaseprobleem voordoet. Een goede kennis van machine learning helpt databaseontwikkelaars de grondgedachte achter de verschillende aanbevelingen van de databasetools voor machine learning te begrijpen.

De komst van volledig autonome databases

De huidige machine learning-databases hebben beperkte mogelijkheden. De focus van het huidige onderzoek is het ontwikkelen van volledig geautomatiseerde databases. Zou het niet fijn zijn om een ​​database te hebben die kan anticiperen op de problemen die zich gaan voordoen en proactief genoeg is om vooraf preventieve maatregelen te nemen? Of zou het het leven van een databaseprofessional niet veel gemakkelijker maken als de database automatisch een back-up maakt wanneer er een cruciale transactie plaatsvindt? Er zijn veel scenario's waarin machine learning-databases uiterst nuttig zijn.

Bestaande databases voeren bijvoorbeeld automatische back-ups uit op een bepaald tijdstip, maar niet alle databasetransacties zijn het waard om te back-uppen. In dit soort scenario kunnen machine learning-databases slim genoeg worden om te weten wanneer ze een back-up moeten maken en wanneer niet.

Bovendien kunnen veel databaseproblemen vooraf worden geanticipeerd. In de scenario's waarin meerdere gebruikers toegang hebben tot verschillende databasebronnen, wordt de kans op een impasse bijvoorbeeld vele malen groter. Als dit zou gebeuren, zou een machine learning-database kunnen veranderen in het bieden van gecontroleerde toegang tot bronnen en een impasse voorkomen.

Er zijn verschillende academische onderzoeksgroepen die hebben geprobeerd om volledig autonome databases te ontwikkelen.

Carnegie Mellon Database Research Group heeft project OtterTune . ontwikkeld die machine learning-technieken en werklastgegevens uit een groot aantal oude databases gebruikt om modellen te maken die automatisch nieuwe werklasten kunnen afstemmen. De machine learning-database van OtterTune beveelt ook automatisch de optimale instellingen aan voor verbeterde doorvoer en verminderde latentie voor nieuwe databasetoepassingen.

MIT heeft ook een open-source databasebeheerraamwerk ontwikkeld met de naam DBSee r die de prestaties voor een bepaalde set databasebronnen voorspelt en ook prestatieknelpunten identificeert.

Leercurve

Machine learning wordt vaak gedefinieerd als het snijvlak van informatica en statistiek. Iedereen met kennis van informatica kan zijn machine learning-vaardigheden relatief snel opbouwen tot een gemiddeld niveau als hij een redelijk begrip van statistiek ontwikkelt.

Veel GUI-tools en cloudplatforms zoals Google AI, IBM Watson, Amazon Sagemaker en Azure ML hebben het proces van het implementeren van machine learning-technieken vereenvoudigd door op GUI gebaseerde drag-and-drop-interfaces voor machine learning-databases te bieden. Gebruikers hoeven alleen te weten hoe ze de tool moeten gebruiken, aangezien het grootste deel van het werk (datasets toevoegen, voorbewerkingstechnieken selecteren, het model trainen en ten slotte het model evalueren) met een paar muisklikken kan worden gedaan.

Als een databaseprofessional echt een carrière in geavanceerde machine learning wil opbouwen, zal hij een grondig begrip van statistiek moeten opbouwen. De computerwetenschappelijke achtergrond van een databaseprofessional zal meer dan goed genoeg zijn om de CS-gerelateerde concepten van machine learning snel te begrijpen.

Echter, zoals we hierboven al zeiden, als een databaseprofessional alleen geïnteresseerd is in het gebruik van machine learning om repetitieve taken te automatiseren, is kennis van op GUI gebaseerde machine learning-tools meer dan voldoende.

Meerdere loopbaantrajecten

Het succes van machine learning en kunstmatige intelligentie heeft organisaties ertoe aangezet om toegewijde datawetenschapsteams te ontwikkelen met bekwame machine learning-experts.

Momenteel hebben machine learning-experts en databaseprofessionals verschillende loopbaantrajecten, maar steeds meer organisaties zullen verwachten dat machine learning- of datawetenschapsexperts een bepaald niveau van database-expertise hebben, en vice versa.

Aangezien dit momenteel volop in beweging is, hebben databaseprofessionals met kennis van machine learning-vaardigheden de voorkeur en hebben ze betere kansen om te worden aangenomen als databaseprofessional, machine learning-expert of iemand met beide functieverantwoordelijkheden.

Eindoordeel

De komst van big data en gerelateerde machine learning-technieken zal waarschijnlijk substantiële veranderingen met zich meebrengen in de taakverantwoordelijkheden van databaseprofessionals, aangezien hun focus in de loop van de tijd zal verschuiven naar de gegevens uit de database, aangezien machine learning-databases zichzelf steeds meer beheren.

Machine learning zal databaseprofessionals helpen om veel handmatige en arbeidsintensieve taken te automatiseren en hen tijd en moeite vrij te maken om machine learning-vaardigheden te omarmen en in gebruik te nemen.

Het leren van de statistieken die nodig zijn om je te ontwikkelen van een databaseprofessional naar een bredere database en machine learning is niet eenvoudig, maar zal grote voordelen opleveren in termen van carrièregroei en kansen.


  1. Wat is een gratis tool om twee SQL Server-databases te vergelijken?

  2. PostgreSQL – Herhaalde waarden elimineren?

  3. Hoe ADDDATE() werkt in MariaDB

  4. Cross Domain SQL Server-aanmeldingen met Windows-verificatie