Ja dat is correct. UTF-8 is een codering voor de Unicode-tekenset, die vrijwel elke taal ter wereld ondersteunt.
Ik denk dat het enige verschil zit in het sorteren van je resultaten, verschillende letters kunnen in andere talen in een andere volgorde komen (accenten, umlauten, enz.). Vergelijk ook a
naar ä
kan zich anders gedragen in een andere sortering.
De _ci
achtervoegsel betekent sorteren en vergelijken c als ik ongevoelig.
http://www.collation-charts.org/ misschien interessant voor u.