dat kan werken, maar er kunnen valse overeenkomsten zijn, zonder manier om ze te voorkomen, omdat je alleen een algoritme-oplossing hebt. Je kunt het beste een aliastabel maken. Voeg elke variatie toe die ooit is gevonden voor elke bedrijfsnaam en een FK voor de echte bedrijfs-ID. Voeg ook een rij toe voor de werkelijke naam.
AliasID CompanyID CompanyAlias
------- --------- ------------
1 1 Company X, Inc <<--actual real company name
2 1 Company X Inc
3 1 Company X
Als er geen exacte naamovereenkomst wordt gevonden in deze tabel bij het importeren van gegevens, kunt u uw voorgestelde algoritme of een ander gebruiken, of menselijke input gebruiken, enz. om een overeenkomst te vinden of een nieuw bedrijf te genereren. Op dat moment invoegen in de aliastabel. Als je merkt dat je match om de een of andere reden niet klopt, kun je de aliastabel wijzigen om de juiste toewijzing te maken. Als u alleen met een algoritme werkt, moet u uitzonderingen opnemen en zou uw algoritme groot en langzaam worden. Met deze tabel en een goede index zou het vinden van je matches snel moeten gaan.