Als de tekenset, als je kunt, zeker UTF-8.
Als sortering - dat is een beetje vervelend voor talen met speciale tekens. Er zijn verschillende soorten sorteringen. Ze kunnen allemaal alle Umlauts en andere karakters opslaan, maar ze verschillen in de manier waarop ze Umlauts behandelen in vergelijkingen, d.w.z. of
u = ü
is waar of onwaar; en bij het sorteren (waar in de alfabetten de trema's in de sorteervolgorde staan).
Om een lang verhaal kort te maken, je kunt het beste ofwel
utf8_unicode_ci
Het maakt hoofdletterongevoelige zoekopdrachten mogelijk; Het behandelt ß
als ss
en maakt gebruik van DIN-1 sortering. Helaas behandelt het, net als alle niet-binaire Unicode-sorteringen, u = ü
wat erg vervelend is omdat een zoekopdracht naar "Muller" ook "Müller" zal opleveren. U zult dat moeten omzeilen door in realtime een Umlaut-bewuste sortering in te stellen.
of utf8_bin
Deze sortering heeft niet de u = ü
probleem, maar alleen hoofdlettergevoelig zoeken is mogelijk.
Ik weet niet helemaal zeker of er nog andere bijwerkingen zijn bij het gebruik van de binaire sortering; Ik heb daar hier .
Deze mySQL-handleiding geeft een goed overzicht van de verschillende sorteringen en de gevolgen die ze met zich meebrengen in het dagelijks gebruik.
Hier is een algemeen overzicht van beschikbare sorteringen in mySQL.