sql >> Database >  >> RDS >> Oracle

De waarde van gegevens in de loop van de tijd

Inmiddels weet iedereen dat data erg waardevol is. Grote bedrijven gebruiken gegevens om beslissingen te nemen die hopelijk het bedrijf vooruit helpen en een hoger niveau van winstgevendheid bereiken. Als databasebeheerders beschermen we de gegevens, met name persoonlijk identificeerbare informatie (PII). Systemen worden gehackt om gegevens te verkrijgen. Gegevens hebben veel waarde en je zou onder de spreekwoordelijke steen moeten leven om dit vandaag te leren.

Waar ik zelden over lees, en het onderwerp van deze blogpost, is hoe de waarde van gegevens in de loop van de tijd verandert. De waarde van de gegevens moet worden gebruikt om uw bewaarbeleid aan te sturen.

De meeste gegevens verliezen hun waarde naarmate ze ouder worden. Ik werkte onlangs aan een project over applicatieprestaties en de metrische gegevens die we vastleggen om die prestaties te meten. Sommige mensen in het project wilden die statistieken langer dan vijf jaar behouden. Ik nam het woord en liet de groep weten dat prestatiestatistieken van vijf jaar oud nul waarde hebben. Onze applicatie verandert door de jaren heen teveel. We kunnen de prestaties van de applicatie vandaag niet vergelijken met de prestaties van de applicatie vijf jaar geleden. Het zal geen appels-met-appels vergelijking zijn.

Niet alle gegevenswaarde neemt in hetzelfde tempo af. In het voorbeeld dat ik in de vorige paragraaf gaf, zijn de metrische gegevens voor applicatieprestaties over vijf jaar nul waard. Een winkelier die gegevens heeft waaruit blijkt dat een klant vijf jaar geleden luiers heeft gekocht, weet nu dat de klant tegenwoordig waarschijnlijk kleding koopt voor een kind van vijf of zes jaar. Dat kind zit waarschijnlijk op de basisschool en heeft mogelijk schoolspullen nodig. In dit geval hebben de gegevens van de aankopen van die klant van vijf jaar geleden nog enige waarde. De gegevens zijn niet waardeloos. Dat gezegd hebbende, we hebben niet alle datapunten van vijf jaar geleden nodig. We hebben alleen een samenvatting van de activiteit van die klant nodig om zinvolle conclusies te trekken over hun huidige en toekomstige aankopen.

Ik zie maar al te vaak dat mensen databasesystemen als een vuilstortplaats beschouwen. Gegevens worden daar gewoon gedumpt en maar heel weinig mensen denken goed na over wat ze op de lange termijn met die gegevens moeten doen. Er zijn maar weinig mensen die nadenken over hoeveel die gegevens op de lange termijn waard zijn. Er zijn kosten verbonden aan het opslaan van die gegevens. Als de gegevens weinig of geen waarde hebben vanwege hun leeftijd, is het dan de kosten waard om die gegevens in de database te bewaren?

Er zijn mitigerende strategieën die kunnen worden gebruikt voor oudere gegevens. De databasebeheerder kan oudere, minder waardevolle gegevens naar een goedkopere opslaglaag verplaatsen. Als de gegevens nul waarde hebben, moeten de gegevens worden vernietigd. Vaak hebben we de volledige details van die oude gegevens niet meer nodig wanneer samenvattingen voldoende zijn. In dat geval voegen we de gegevens samen en slaan we de resultaten op. Ontdoe je dan van de details.

Als databasebeheerder is het uw verantwoordelijkheid om de beheerder te zijn van uw gegevens en de middelen die nodig zijn om deze te hosten. U moet altijd vragen om de juiste stappen die nodig zijn om voor die gegevens te zorgen naarmate ze ouder worden.


  1. Wat is een opmaakstring in SQL Server?

  2. Pyodbc - Naam gegevensbron niet gevonden en geen standaardstuurprogramma opgegeven

  3. Maak een Excel-bestand (.xlsx) met PL/SQL

  4. Hoe kan ik deze fout oplossen:niet-ondersteunde SQL92?