Да това е вярно. UTF-8 е кодиране за набора символи Unicode, който поддържа почти всеки език в света.
Мисля, че единствената разлика идва при сортирането на вашите резултати, различните букви може да идват в различен ред на други езици (акценти, умлаути и т.н.). Също така, сравняване на a
до ä
може да се държи по различен начин в друго съпоставяне.
_ci
суфикс означава сортиране и сравнение се случва c ase i нечувствителен.
http://www.collation-charts.org/ може да представлява интерес за вас.