sql >> Database >  >> RDS >> Mysql

Verschillen tussen utf8 en latin1

UTF-8 is voorbereid op wereldheerschappij, Latin1 is niet.

Als je niet-Latijnse tekens zoals Chinees, Japans, Hebreeuws, Russisch, enz. probeert op te slaan met Latin1-codering, dan zullen ze eindigen als mojibake . Mogelijk vindt u de inleidende tekst van dit artikel nuttig (en zelfs meer als je een beetje Java kent).

Merk op dat volledige 4-byte UTF-8-ondersteuning alleen werd geïntroduceerd in MySQL 5.5. Vóór die versie gaat het maar tot 3 bytes per teken, niet 4 bytes per teken. Het ondersteunde dus alleen het BMP-vlak en niet b.v. het Emoji-vliegtuig. Als je volledige 4-byte UTF-8-ondersteuning wilt, upgrade dan MySQL naar minimaal 5.5 of ga voor een ander RDBMS zoals PostgreSQL. In MySQL 5.5+ heet het utf8mb4 .



  1. PostgreSQL 11 implementeren en beheren:nieuw in ClusterControl 1.7.1

  2. Oracle-query sequentiële sommatie per rijen

  3. SQL Server cumulatieve som per groep

  4. Essentials en gebruik van NOLOCK-hint in SQL Server