De sortering is de minste van je zorgen, waar je aan moet denken is de tekenset voor de kolom/tabel/database. De sortering (regels die bepalen hoe gegevens worden vergeleken en gesorteerd ) is daar slechts een uitvloeisel van.
MySQL ondersteunt verschillende Unicode-tekensets, utf8
en utf8mb4
het interessantst zijn. utf8
ondersteunt Unicode-tekens in de BMP
, d.w.z. een subset van heel Unicode. utf8mb4
, beschikbaar sinds MySQL 5.5.3, ondersteunt alle van Unicode.
De sortering te gebruiken met een van de Unicode-coderingen is hoogstwaarschijnlijk xxx_general_ci
of xxx_unicode_ci
. De eerste is een algemeen sorteer- en vergelijkingsalgoritme onafhankelijk van de taal, de laatste is een completer taalonafhankelijk algoritme dat meer Unicode-functies ondersteunt (bijv. "ß" en "ss" als equivalent behandelen), maar is daarom ook langzamer.
Zie https://dev.mysql.com/ doc/refman/5.5/en/charset-unicode-sets.html .