Windows 1252 е един от многото набори от символи с фиксиран размер. Mac има свой собствен набор. има няколко ISO за различни части на Европа и за някои други части на света. Повечето от тях имат леки вариации.
Хубавото е, че имате символ с фиксиран размер, което означава 1 знак =1 байт независимо от всичко.
Лошите страни са:
- Някои хора може да не са инсталирали вашето кодиране
- Някои хора може да използват малко по-различно кодиране, което води до много малко проблеми, неочевидни за виждане, но много грозни в дългосрочен план
- Можете да поддържате само няколко езика
Това включва всеки цитат, който искате да направите. В windows-1252 не можете да показвате руски, гръцки, полски ...
UTF-8 е стандартното кодиране за unicode представяне на 1+ байта. Той може да представлява много голямо мнозинство от знаците, които може да срещнете, въпреки че е проектиран за базирани на латиница езици, тъй като други езици заемат повече място за съхранение.
Използва се в XML, JSON и повечето видове уеб услуги, които можете да намерите. Това е добра настройка по подразбиране, когато не знаете какво кодиране да използвате. Позволява да се ограничи броя на проблемите с кодирането, като например „Мислех, че сте на латиница-1 / Не, използвах latin-9, но след това този човек на mac използва латиница“. Ако имате повече от 1 души, които работят върху съдържанието на уебсайта, те може да имат различни кодировки на своите плочи и следователно съдържанието ви може да бъде объркано в даден момент.
UTF-8 е, доколкото знам, единственият начин за лесно стандартизиране на кодирането, използвано между хората, без обсъждане.
Типичен пример е, че ако уебсайтът ви е кодиран в windows1252 и новият разработчик има mac, вероятно ще имате проблеми.