Ако приемем, че $str
е UTF-8 кодиран:
function maxThreeBytes($str) {
return preg_match('@[\\xf0-\\xff][\\x80-\\xff][\\x80-\\xff][\\x80-\\xff]@', $str) ? false : true;
}
Той проверява дали низът съдържа четири знака, които съответстват на 11110xxxb 10xxxxxxb 10xxxxxxb 10xxxxxxb
което е кодирането на знаци между U+10000 и U+10FFFF.