sql >> Database >  >> RDS >> Mysql

Bengaalse tekst wordt niet weergegeven in Unicode CSV-bestand

Volgens de antwoorden op de vraag Excel naar CSV met UTF8-codering , moet Google Documenten CSV correct opslaan, in tegenstelling tot Excel, dat alle tekens vernietigt die niet representatief zijn in de "ANSI"-codering die wordt gebruikt. Maar misschien hebben ze dit veranderd, of is er iets mis, of is de analyse van de situatie niet juist.

Voor correct gecodeerd Bangla (Bengaals) dat wordt verwerkt in MS Office-programma's, zouden geen "Bangla-lettertypen" nodig moeten zijn, aangezien het Arial Unicode MS-lettertype (meegeleverd met Office) de Bangla-tekens bevat. Dus zijn de gegevens eigenlijk in een niet-standaard codering die afhankelijk is van een speciaal gecodeerd lettertype? In dat geval moet het eerst worden geconverteerd naar Unicode, hoewel het mogelijk op de een of andere manier kan worden beheerd met programma's die consequent dat specifieke lettertype gebruiken.

Als u in Excel Opslaan als gebruikt, kunt u "Unicode-tekst (*.txt)" selecteren. Het slaat de gegevens op als TSV (door tabs gescheiden waarden) in UTF-16-codering. Mogelijk moet u het dan converteren om komma's als scheidingsteken te gebruiken in plaats van tab, en/of van UTF-16 naar UTF-8. Maar dit werkt alleen als de originele gegevens correct zijn gecodeerd.




  1. Een SQL Plus-script uitvoeren in PowerShell

  2. Hernoem een ​​primaire sleutel in SQL Server (T-SQL)

  3. PL/SQL-verzameling:geneste tabel in Oracle-database

  4. VBA Alchemie:methoden omzetten in eigenschappen