Bij het testen van Talend met de Easysoft JDBC-ODBC Bridge ondervonden we tekstcorruptie bij het schrijven van niet-ASCII-gegevens van een SQL Server-database naar een CSV-bestand.
De oplossing was om het gegevenstype voor de probleemkolom in het Talend-schema te wijzigen van een String
naar een byte[]
. Om dit te doen, hebben we:
- Toegang tot de eigenschappen van de component tJDBCInput.
- Kies de knop Schema bewerken.
- De definitie van het gegevenstype voor de relevante kolom gewijzigd.
De standaard karaktercodering van Talend is UTF-8. Zolang de gegevens die door een JDBC-stuurprogramma worden geretourneerd ASCII zijn, zijn gegevens die zijn gecodeerd met een andere tekencodering geen probleem:UTF-8-gegevens die alleen ASCII-tekens bevatten, zijn identiek aan gegevens.