Ervan uitgaande dat $str
is UTF-8-gecodeerd:
function maxThreeBytes($str) {
return preg_match('@[\\xf0-\\xff][\\x80-\\xff][\\x80-\\xff][\\x80-\\xff]@', $str) ? false : true;
}
Het controleert of de tekenreeks vier tekens bevat die overeenkomen met 11110xxxb 10xxxxxxb 10xxxxxxb 10xxxxxxb
dat is de codering voor tekens tussen U+10000 en U+10FFFF.