Deze enkele opdracht zou het allemaal moeten doen:
WITH blacklist AS ( -- identify duplicate IDs and their master
SELECT *
FROM (
SELECT transcription_id
, min(transcription_id) OVER (PARTITION BY text, citation) AS master_id
FROM transcription
) sub
WHERE transcription_id <> master_id
)
, upd AS ( -- redirect referencing rows
UPDATE town_transcription tt
SET transcription_id = b.master_id
FROM blacklist b
WHERE b.transcription_id = tt.transcription_id
)
DELETE FROM transcription t -- kill dupes (now without reference)
USING blacklist b
WHERE b.transcription_id = t.transcription_id;
Bij gebrek aan definitie koos ik de rij met de kleinste ID per groep als overgebleven hoofdrij.
FK-beperkingen staan niet in de weg, tenzij u niet-standaardinstellingen heeft. Gedetailleerde uitleg:
- Hoe dubbele rijen met externe sleutelafhankelijkheden te verwijderen?
- Duplicaten verwijderen en verwijzende rijen omleiden naar nieuwe master
Nadat je de dupes hebt verwijderd, wil je nu misschien een UNIQUE
. toevoegen beperking om te voorkomen dat dezelfde fout zich opnieuw voordoet:
ALTER TABLE transcription
ADD CONSTRAINT transcription_uni UNIQUE (text, citation);