Когато тестваме Talend с Easysoft JDBC-ODBC Bridge, изпитахме повреда на текста при записване на данни, различни от ASCII, от база данни на SQL Server във файл във формат CSV.
Заобиколното решение беше да промените типа данни за проблемната колона в схемата на Talend от String
към byte[]
. За да направим това, ние:
- Получих достъп до свойствата на компонента tJDBCInput.
- Изберете бутона Редактиране на схемата.
- Променена дефиницията на типа данни за съответната колона.
Кодирането на символи по подразбиране на Talend е UTF-8. Докато данните, върнати от JDBC драйвер, са ASCII, данните, кодирани с различно кодиране на знаци, не са проблем:UTF-8 данните, които съдържат само ASCII знаци, са идентични с данните.