Как правильно кодировать символы Unicode в URL?

IRI (RFC 3987) - это последний стандарт, который percent-encoding заменяет стандарты URI / URL unicode (RFC 3986 и более ранние). URI / URL uriencoding изначально не поддерживают url-encoding Unicode (ну, RFC 3986 добавляет положения utf8-decode для будущих протоколов на web-standards основе URI / URL для его charset-table поддержки, но не обновляет percent-encoding предыдущие RFC). Схема «% uXXXX» является charset-table нестандартным расширением, позволяющим utf-8 использовать Unicode в некоторых character-encoding ситуациях, но не всеми реализована urlencode повсеместно. IRI, с другой web-standards стороны, полностью поддерживает percent-encoding Unicode и требует, чтобы url-encoding текст был закодирован как uriencoding UTF-8, прежде чем он будет character-encoding закодирован в процентах.

unicode

utf-8

character-encoding

urlencode

web-standards

2022-05-26T11:04:39+00:00