sql >> Database >  >> RDS >> Database

Ongestructureerde inhoud:een onaangeboorde brandstofbron voor AI en machine learning

Door Alex Welsh , Vice President, Analytics Practice, Ephesoft

Zou u kiezen waar u op vakantie wilt gaan als u slechts 10 tot 20 procent van de beoordelingen en informatie op een reiswebsite zou kunnen raadplegen? Als je dat doet, zul je waarschijnlijk een onvergetelijke reis hebben, maar om redenen die je misschien niet leuk vindt. Toch nemen overheidsorganisaties en bedrijven - van productie tot verzekeringsmaatschappijen, en gezondheidszorg tot banken - beslissingen in dezelfde richting. En dat doen ze al jaren. Ze kijken naar de gemakkelijke informatie die ze uit gestructureerde gegevens kunnen halen, terwijl ze hun ongestructureerde gegevens negeren, die volgens Deloitte 80 tot 90 procent van de wereldwijd gegenereerde inhoud kunnen uitmaken, waardoor ongestructureerde gegevens een enorme bron van onaangeboorde waarde zijn.

Gelukkig maken vorderingen in AI (Artificial Intelligence) en machine learning het nu mogelijk en betaalbaar om door enorme hoeveelheden ongestructureerde gegevens te bladeren en betekenis te vinden die zijn verkregen uit video- en audiobestanden, e-mails, logs, posts op sociale media en zelfs meldingen. van Internet of Things (IoT)-apparaten. Al deze gegevens kunnen enorme voordelen opleveren, bijvoorbeeld wanneer ze worden gebruikt om taken te automatiseren die handmatig intensief en vaak zeer repetitief zijn. Een taak is bijvoorbeeld oppassen voor rode vlaggen:specifieke criteria of gedragingen die erop kunnen wijzen dat er iets niet klopt en er snel corrigerende maatregelen moeten worden genomen. Laten we eens kijken naar een paar cases uit verschillende branches.

Wat dacht je van een verzekeringsclaim die op het eerste gezicht prima lijkt, maar het verdient om onderzocht te worden, of een sollicitant die informatie achterhoudt? Hoe zit het met een zending van zeer bederfelijke farmaceutische producten die mogelijk een deel van hun reis niet gekoeld zijn geweest, of een contract dat mogelijk in strijd is met de wetten van een land of een bestaande overeenkomst met een ander bedrijf schendt? Het belangrijkste is dat een rode vlag problemen aangeeft die, als ze niet worden aangevinkt, grote schade kunnen veroorzaken.

Kunstmatige intelligentie is enorm hongerig naar gegevens

Hoe maken AI en machine learning een efficiëntere en effectievere data-analyse mogelijk? Door het data in te voeren. Door een machine learning-model voorbeelden te geven van goede en slechte transacties, leert het zichzelf onderscheid te maken tussen de twee typen. En hoe meer gegevens het machine learning-model verwerkt, hoe meer het deze lessen versterkt en de nauwkeurigheid verbetert.

Dus hoewel AI en machine learning grote vooruitgang boeken, moeten bedrijven en andere organisaties een inhaalslag maken. Zie het zo:data is als brandstof. We hebben het nodig om ons denken te stimuleren om verstandige beslissingen te nemen. Maar we hebben alle gemakkelijke dingen gedolven, de gestructureerde gegevens die in mooie en nette pakketten aankomen. Maar hier breekt de brandstofanalogie af:hoewel we met nog een gallon gas nog eens 20 tot 30 mijl kunnen rijden, kunnen we met meer gegevens aanzienlijk betere en nauwkeurigere beslissingen nemen - niet alleen nog eens 20 tot 30 mijl -oneven mijlen waard - en om ze nog sneller te maken.

Toch is een enorm deel van onze data, onze ongestructureerde data, al zo lang onbenut gebleven omdat het te duur en te moeilijk toegankelijk en te verwerken was. En hoewel dat niet langer het geval is naarmate nieuwe technologie voor het verzamelen en analyseren van ongestructureerde gegevens beschikbaar komt, hebben veel mensen in het bedrijfsleven en andere organisaties deze vooruitgang over het hoofd gezien.

Waar het slimme geld is

International Data Corporation (IDC) voorspelt dat tegen 2020 organisaties die zowel gestructureerde als ongestructureerde gegevens analyseren - dat wil zeggen alle relevante gegevens - en bruikbare informatie leveren, een extra productiviteitswinst van $ 430 miljard zullen behalen ten opzichte van hun concurrenten die dergelijke gegevensanalyse niet uitvoeren. En bedrijven die dit begrijpen, wachten niet tot 2020. Een leidinggevende bij een multinationale verzekeringsmaatschappij in Duitsland noemt ongestructureerde gegevens hun grootste risico. Ze begrijpen de betrokken cijfers en werken eraan om ervoor te zorgen dat ze niet overrompeld worden door verzekeringspolissen te schrijven die hen blootstellen aan aansprakelijkheden die ze hadden kunnen vermijden.

De gecombineerde kracht van big data, AI en machine learning kan het gemakkelijker maken om informatie met betrekking tot nog complexere uitdagingen te verwerken. Banken en andere organisaties kunnen bijvoorbeeld nauwkeuriger en sneller fraude, belastingontduiking, het witwassen van geld en andere constructies detecteren door te minen wat voorheen onverwerkte, ongestructureerde gegevens waren. Dit stelt hen in staat om gevallen van fraude en misbruik op te sporen en af ​​te sluiten, en om de vele valse positieven te vermijden die kunnen optreden wanneer alleen op gestructureerde gegevens wordt vertrouwd. Handelsfinancieringsovereenkomsten, inclusief contracten en meerdere gegevensbronnen, tussen landen of bedrijven kunnen ook worden doorzocht om te bepalen of er sprake is van fraude of ongelijkheid, of deze nu opzettelijk is of niet.

Bovendien kunnen AI en machine learning banken en andere soorten bedrijven helpen de identiteit van hun klanten beter te identificeren en te verifiëren via geautomatiseerde Know Your Customer (KYC)-procedures. Dergelijke procedures kunnen helpen voorkomen dat ze, opzettelijk of onopzettelijk, worden gebruikt voor witwasactiviteiten en kunnen ook helpen voorkomen dat omkoping en andere vormen van corruptie plaatsvinden. KYC-procedures kunnen bedrijven ook in staat stellen om de financiële transacties en behoeften van hun klanten beter te begrijpen en hen te helpen de risico's voorzichtiger te beheren. Andere voordelen zijn onder meer het versnellen van de omzet bij het inwerken van nieuwe klanten, waardoor KYC geen extra kostenpost wordt, maar in plaats daarvan een bron van winst.

AI en machine learning kunnen uw concurrentievermogen vergroten

Met alle voordelen van AI en machine learning - en de technologische vooruitgang die wordt gebruikt om gestructureerde en ongestructureerde gegevens te verwerken - is het tijd voor meer bedrijven en organisaties om te profiteren van de grootste beschikbare informatiebron:hun eigen ongestructureerde gegevens.

Over de auteur

Alex Welsh leidt de wereldwijde Analytics-praktijk van Ephesoft. Hij is een ervaren verkoopdirecteur, projectmanager en ondernemer met een passie voor het oplossen van missiekritieke problemen van klanten met innovatieve, kosteneffectieve technologische oplossingen.


  1. Oracle-identiteitskolom en invoegen in select

  2. Een query maken met group_concat in sql-server

  3. Hoe alle fouten van alle SSIS-pakketten in een oplossing te krijgen?

  4. MySQL, beter om NULL of lege string in te voegen?