Колекция е най-малкото от вашите притеснения, това, за което трябва да помислите, е набора от знаци за колоната/таблицата/базата данни. Съпоставянето (правила, уреждащи как данните се сравняват и сортирани ) е само следствие от това.
MySQL поддържа няколко набора от символи Unicode, utf8
и utf8mb4
е най-интересното. utf8
поддържа Unicode знаци в BMP
, т.е. подмножество от целия Unicode. utf8mb4
, наличен от MySQL 5.5.3, поддържа всички на Unicode.
Колекция да се използва с някое от кодирането на Unicode най-вероятно е xxx_general_ci
или xxx_unicode_ci
. Първият е общ алгоритъм за сортиране и сравнение, независим от езика, вторият е по-пълен независим от езика алгоритъм, поддържащ повече функции на Unicode (напр. третиране на "ß" и "ss" като еквивалент), но поради това е и по-бавен.
Вижте https://dev.mysql.com/ doc/refman/5.5/en/charset-unicode-sets.html .