-
...general_ci
е просто. Това не отъждествява комбинации от 2 знака (например със знак без интервал) с еквивалента на един знак. -
...unicode_520_ci
идва от версия на Unicode 5.20, най-новата версия, налична, когато MySQL я вдигна. Той обработва неща като поръчка за емоджи, каквито предишни версии не са имали. -
С MySQL 8.0 предпочитаното съпоставяне е
utf8mb4_0900_ai_ci
, базиран на Unicode 9.0. -
...<language>_ci
обработва вариации, открити на дадения език. Например трябва даch
иll
на испански да се третира като "букви" и да се сортира междуcz
иd
иlz
иm
. -
За обща употреба не използвайте
...general_ci
, използвайте най-новата версия, извлечена от Unicode. За специфични за езика ситуации изберете едно от другите съпоставяния. -
Знам как (или дори дали) китайският и арабският са сортирани по различен начин в различните съпоставки. Виждам обаче
...persion_ci
, така че подозирам, че има проблем. -
Използвайте
utf8mb4
, а неutf8
, особено след като имате нужда от китайски.