Что означает символ в php

Содержание
  1. Строки
  2. Синтаксис
  3. Одинарные кавычки
  4. Двойные кавычки
  5. Heredoc
  6. операторы — Справочник — Что означает этот символ в PHP?
  7. Что это?
  8. Почему это?
  9. Что мне здесь делать?
  10. Список
  11. Решение
  12. Другие решения
  13. Оператор «И»: &
  14. Оператор «Или»: |
  15. Добавлено в PHP 7
  16. До PHP 7 вы писали бы …
  17. Начиная с PHP 7 вы можете написать …
  18. Пример с наследованием
  19. Пример с клоном
  20. Логические операторы:
  21. Операторы сравнения:
  22. Арифметические операторы:
  23. Операторы увеличения / уменьшения:
  24. Битовые операторы:
  25. Строковые операторы:
  26. Операторы массива:
  27. Операторы присваивания:
  28. Заметка
  29. 3 ответа 3
  30. Всё ещё ищете ответ? Посмотрите другие вопросы с метками php или задайте свой вопрос.
  31. Похожие
  32. Подписаться на ленту
  33. Escape-последовательности и числовые нотации в PHP
  34. Двойные кавычки и Heredoc
  35. Экранирование символов
  36. Символы табуляции: \t и \v
  37. Новые строки: \r и \n
  38. Escape-символ: \e
  39. Символ новой страницы: \f
  40. Восьмеричные escape-последовательности символов ASCII
  41. Шестнадцатеричные escape-последовательности символов ASCII
  42. Escape-последовательности символов Unicode
  43. Строки
  44. Синтаксис
  45. Одинарные кавычки
  46. Двойные кавычки
  47. Heredoc
  48. Nowdoc
  49. Обработка переменных
  50. Доступ к символу в строке и его изменение
  51. Полезные функции и операторы
  52. Преобразование в строку
  53. Преобразование строк в числа
  54. Подробности реализации строкового типа

Строки

Замечание: Нет никаких проблем, если строка очень велика. Практически не существует ограничений на размер строк, налагаемых PHP, так что нет абсолютно никаких причин беспокоиться об их длине.

Синтаксис

Одинарные кавычки

Чтобы использовать одинарную кавычку внутри строки, как и во многих других языках, ее необходимо предварить символом обратной косой черты (\), т. е. экранировать ее. Если обратная косая черта должна идти перед одинарной кавычкой либо быть в конце строки, вам необходимо продублировать ее. Обратите внимание, что если вы попытаетесь экранировать любой другой символ, обратная косая черта также будет напечатана! Так что, как правило, нет необходимости экранировать саму обратную косую черту.

Замечание: В PHP 3 в данном случае будет выдано сообщение уровня E_NOTICE.

Замечание: В отличие от двух других синтаксисов, переменные и экранирующие последовательности для специальных символов, встречающиеся в строках, заключенных в одинарные кавычки, не обрабатываются.

Двойные кавычки

Если строка заключена в двойные кавычки («), PHP распознает большее количество управляющих последовательностей для специальных символов:

Таблица 11-1. Управляющие последовательности

последовательность значение
\n новая строка (LF или 0x0A (10) в ASCII)
\r возврат каретки (CR или 0x0D (13) в ASCII)
\t горизонтальная табуляция (HT или 0x09 (9) в ASCII)
\\ обратная косая черта
\$ знак доллара
двойная кавычка
\4 последовательность символов, соответствующая регулярному выражению, символ в восьмеричной системе счисления
\x[0-9A-Fa-f] последовательность символов, соответствующая регулярному выражению, символ в шестнадцатеричной системе счисления

Повторяем, если вы захотите мнемнонизировать любой другой символ, обратная косая черта также будет напечатана!

Но самым важным свойством строк в двойных кавычках является обработка переменных. Смотрите более подробно: обработка строк.

Heredoc

Источник

операторы — Справочник — Что означает этот символ в PHP?

Что это?

Это набор вопросов, которые время от времени возникают о синтаксисе в PHP. Это также Вики сообщества, поэтому все желающие могут принять участие в ведении этого списка.

Почему это?

Раньше было сложно найти вопросы об операторах и других синтаксических токенах.
Основная идея состоит в том, чтобы иметь ссылки на существующие вопросы по переполнению стека, чтобы нам было легче ссылаться на них, а не копировать содержимое из руководства по PHP.

Что мне здесь делать?

Если кто-то указал на вас кем-то из-за того, что вы задали такой вопрос, пожалуйста, найдите конкретный синтаксис ниже. Связанные страницы с Руководство по PHP вместе со связанными вопросами, скорее всего, ответит на ваш вопрос. Если это так, вам предлагается поднять ответ. Этот список не является заменой помощи, оказанной другими.

Список

[] Массивы (короткий синтаксис начиная с PHP 5.4)

Решение

Они могут идти до или после переменной.

Если поставить перед переменной, операция увеличения / уменьшения выполняется для переменной первый тогда результат возвращается. Если поставить после переменной, переменная первый возвращается, то операция увеличения / уменьшения выполняется.

Предварительное увеличение немного быстрее, потому что оно действительно увеличивает переменную и после этого «возвращает» результат. Постинкремент создает специальную переменную, копирует туда значение первой переменной и только после использования первой переменной заменяет ее значение на второе.

Вы также можете увеличивать буквы в PHP:

однажды z достигнут aa рядом и так далее.

Обратите внимание, что символьные переменные можно увеличивать, но не уменьшать, и даже в этом случае поддерживаются только простые символы ASCII (a-z и A-Z).

Сообщения переполнения стека:

Другие решения

Что немного? Бит представляет собой 1 или 0. В основном OFF (0) и ON (1)

Что такое байт? Байт состоит из 8 битов, а наибольшее значение байта равно 255, что означает, что установлен каждый бит. Посмотрим, почему максимальное значение байта равно 255.

Это представление 1 байт

1 + 2 + 4 + 8 + 16 + 32 + 64 + 128 = 255 (1 байт)

Оператор «И»: &

Это вывело бы число 8. Почему? Хорошо, давайте посмотрим на нашем примере таблицы.

Таким образом, вы можете видеть из таблицы, что единственный бит, которым они делятся, это 8 бит.

Второй пример

Два общих бита — 32 и 4, которые при сложении вместе возвращают 36.

Оператор «Или»: |

Это вывело бы число 11. Почему?

Вы заметите, что у нас установлено 3 бита в столбцах 8, 2 и 1. Сложите их: 8 + 2 + 1 = 11.

Символ подчеркивания ‘_’, как в _() это псевдоним gettext() функция.

Добавлено в PHP 7

Оператор приводит к целочисленному выражению:

Хорошее практическое применение этого оператора — обратные вызовы типа сравнения, которые, как ожидается, будут возвращать нулевое, отрицательное или положительное целое число на основе трехстороннего сравнения между двумя значениями. Функция сравнения передана usort один из таких примеров.

До PHP 7 вы писали бы …

Начиная с PHP 7 вы можете написать …

Магические константыХотя это не просто символы, но важная часть этого семейства. Есть восемь магических констант, которые меняются в зависимости от того, где они используются.

__LINE__ : Текущий номер строки файла.

__FILE__ : Полный путь и имя файла. Если используется внутри включения, возвращается имя включенного файла. Начиная с PHP 4.0.2, __FILE__ всегда содержит абсолютный путь с разрешенными символическими ссылками, тогда как в более старых версиях он содержал относительный путь при некоторых обстоятельствах.

__FUNCTION__ : Имя функции. (Добавлено в PHP 4.3.0) Начиная с PHP 5, эта константа возвращает имя функции в том виде, в котором она была объявлена ​​(с учетом регистра). В PHP 4 его значение всегда в нижнем регистре.

__CLASS__ : Имя класса. (Добавлено в PHP 4.3.0) Начиная с PHP 5 эта константа возвращает имя класса в том виде, в котором оно было объявлено (с учетом регистра). В PHP 4 его значение всегда в нижнем регистре. Имя класса включает пространство имен, в котором оно было объявлено (например, Foo\Bar ). Обратите внимание, что начиная с PHP 5.4 __CLASS__ работает также в чертах. При использовании в методе черт, __CLASS__ Имя класса, в котором используется черта.

__TRAIT__ : Имя черты. (Добавлено в PHP 5.4.0) Начиная с PHP 5.4, эта константа возвращает признак в том виде, в котором он был объявлен (с учетом регистра). Имя признака включает пространство имен, в котором оно было объявлено (например, Foo\Bar ).

__METHOD__ : Имя метода класса. (Добавлено в PHP 5.0.0) Имя метода возвращается в том виде, в котором оно было объявлено (с учетом регистра).

__NAMESPACE__ : Имя текущего пространства имен (с учетом регистра). Эта константа определяется во время компиляции (добавлено в PHP 5.3.0).

instanceof используется для определения того, является ли переменная PHP экземпляром объекта определенного класса.

Приведенный выше пример выведет:

Пример с наследованием

Приведенный выше пример выведет:

Пример с клоном

Приведенный выше пример выведет:

Логические операторы:

Операторы сравнения:

Арифметические операторы:

Операторы увеличения / уменьшения:

Битовые операторы:

Строковые операторы:

Операторы массива:

Операторы присваивания:

Заметка

Источник

3 ответа 3

8KLbY

Да. Именно так. Для вызова методов и свойств. В жаве и c# если не ошибаюсь это точка.

RvbZf

Он используется не только для вызова нестатических методов, но и для обращения к свойствам(полям) объекта(а не класса).

Вообще, на сколько я знаю, повелось это из С++. Вначале был объект. Затем у него появилось свойство и обращаться к нему надо было так объект.свойство. Все бы хорошо, но порой нужно было получать не значение свойства, а указатель на него, так появилась запись объект.свойство Данная запись многим показалась некрасивой и ее заменили на объект->свойство. Т.е. в С++ «->» эквивалентно «.«, ну а в php видимо перекочевал уже конечный вариант.

PS: вот как-то, но возможно я немного ошибаюсь.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками php или задайте свой вопрос.

Похожие

Подписаться на ленту

Для подписки на ленту скопируйте и вставьте эту ссылку в вашу программу для чтения RSS.

дизайн сайта / логотип © 2021 Stack Exchange Inc; материалы пользователей предоставляются на условиях лицензии cc by-sa. rev 2021.9.20.40247

Нажимая «Принять все файлы cookie» вы соглашаетесь, что Stack Exchange может хранить файлы cookie на вашем устройстве и раскрывать информацию в соответствии с нашей Политикой в отношении файлов cookie.

Источник

Escape-последовательности и числовые нотации в PHP

Привет, Хабр. В преддверии старта онлайн-курса «PHP-разработчик» подготовили традиционный перевод материала. Предлагаем также посмотреть запись прошедшего демо-занятия «Экосистема PHP».

image loader

Многие современные языки программирования поддерживают различные способы использования различных символов, таких как обычные английские латинские буквы, числа, символы, эмодзи и различные специальные символы, такие как символ новой строки или символ табуляции.

PHP, наряду со многими другими языками программирования, поддерживает определенное количество escape-последовательностей для использования различных символов, которые не могут быть набраны с обычной клавиатуры, не могут быть представлены в текстовой форме (например, невидимые символы или различные управляющие символы) или иным образом не считываются. Эти символы используют escape-последовательности, которые распознает PHP.

Что касается чисел, PHP поддерживает стандартные десятичные числа, но также может использовать и другие нотиции, такие как двоичное, восьмеричное, шестнадцатеричное и даже научное (scientific) представление. Они могут сделать код более читаемым и понятным в зависимости от контекста.

Двойные кавычки и Heredoc

В PHP строка с двойными кавычками ( «string» ) или Heredoc (смотрите ниже) поддерживает escape-последовательности и интерполяцию переменных.

PHP будет пытаться интерполировать переменные, если строковый литерал находится внутри строки с двойными кавычками или Heredoc.

Альтернативно (и желательно) интерполируемые переменные могут быть выделены фигурными скобками, так они будут выглядеть более удобочитаемыми:

Строки в одинарных кавычках ( ‘string’ ) и синтаксис Nowdoc не интерполируют переменные:

Только строки в двойных кавычках и Heredoc поддерживают escape-символы.

Экранирование символов

Поскольку PHP интерпретирует и интерполирует специальные символы внутри строковых литералов в двойных кавычках и heredoc, знак обратной косой черты ( \ ) используется как «escape-символ».

Использование второго символа обратной косой черты предотвращает преобразование первого символа обратной косой черты в escape-символ.

Символы табуляции: \t и \v

Новые строки: \r и \n

\r («возврат каретки») и \n («перевод строки») являются символами новой строки.

Escape-символ: \e

Если приведенный выше фрагмент выполняется в терминале, который поддерживает управляющие последовательности ANSI, он интерпретирует его и изменяет текст:

image loader

Символ новой страницы: \f

Восьмеричные escape-последовательности символов ASCII

PHP поддерживает экранирование восьмеричного числа в его соответствующий ASCII символ.

Для символа P можно использовать восьмеричную escape-последовательность:

Любой базовый символ ASCII можно представить с помощью такой записи:

Любое значение в диапазоне от \0 до \377 будет интерпретироваться как восьмеричная escape-последовательность ASCII символа.

Обратите внимание, что числа для расширенных символов ASCII (от 128 до 255) несовместимы с UTF-8. PHP считает значение 128 (восьмеричное: 200 ; шестнадцатеричное: 80 ) недопустимым, поскольку оно не является допустимым значением UTF-8.

Хотя PHP принимает такие значения, они считаются недопустимыми символами в контексте UTF-8.

Шестнадцатеричные escape-последовательности символов ASCII

Кроме того, шестнадцатеричные символы не чувствительны к регистру (т.е. AF равно af и aF ).

Тот же «PHP.Watch» пример можно переписать с помощью шестнадцатеричных escape-последовательностей:

Escape-последовательности символов Unicode

PHP поддерживает использование любого Unicode символа с префиксом \u и шестнадцатеричным значением code point внутри фигурных скобок.

PHP выдаст ошибку парсера, если символ Unicode превышает значение 10FFFF :

Форму записи Unicode \u<> можно использовать качестве escape-последовательности для любого символа. Вот несколько примеров:

Символ

Code point (Dec)

Code point (Hex)

Escape-последовательность Unicode

Источник

Строки

Замечание: Строки ( string ) не могут быть размером более 2 Гб (2147483647 байт).

Синтаксис

Строка может быть определена четырьмя различными способами:

Одинарные кавычки

Чтобы использовать одинарную кавычку внутри строки, проэкранируйте ее обратной косой чертой (\). Если необходимо написать саму обратную косую черту, продублируйте ее (\\). Все остальные случаи применения обратной косой черты будут интерпретированы как обычные символы: это означает, что если вы попытаетесь использовать другие управляющие последовательности, такие как \r или \n, они будут выведены как есть вместо какого-либо особого поведения.

Замечание: В отличие от синтаксиса двойных кавычек и heredoc, переменные и управляющие последовательности для специальных символов, заключенных в одинарные кавычки, не обрабатываются.

echo ‘это простая строка’ ;

echo ‘Также вы можете вставлять в строки
символ новой строки вот так,
это нормально’ ;

// Выводит: Однажды Арнольд сказал: «I’ll be back»
echo ‘Однажды Арнольд сказал: «I\’ll be back»‘ ;

// Выводит: Вы удалили C:\*.*?
echo ‘Вы удалили C:\\*.*?’ ;

// Выводит: Вы удалили C:\*.*?
echo ‘Вы удалили C:\*.*?’ ;

// Выводит: Это не будет развернуто: \n новая строка
echo ‘Это не будет развернуто: \n новая строка’ ;

Двойные кавычки

Если строка заключена в двойные кавычки («), PHP распознает большее количество управляющих последовательностей для специальных символов:

Управляющие последовательности

Последовательность Значение
\n новая строка (LF или 0x0A (10) в ASCII)
\r возврат каретки (CR или 0x0D (13) в ASCII)
\t горизонтальная табуляция (HT или 0x09 (9) в ASCII)
\v вертикальная табуляция (VT или 0x0B (11) в ASCII) (с версии PHP 5.2.5)
\e escape-знак (ESC или 0x1B (27) в ASCII) (с версии PHP 5.4.4)
\f подача страницы (FF или 0x0C (12) в ASCII) (с версии PHP 5.2.5)
\\ обратная косая черта
\$ знак доллара
двойная кавычка
\5 последовательность символов, соответствующая регулярному выражению символа в восьмеричной системе счисления
\x[0-9A-Fa-f] последовательность символов, соответствующая регулярному выражению символа в шестнадцатеричной системе счисления

Как и в строке, заключенной в одинарные кавычки, экранирование любого символа выведет также и саму обратную косую черту. До версии PHP 5.1.1, обратная косая черта в \ не печаталась.

Но самым важным свойством строк в двойных кавычках является обработка переменных. Смотрите более подробно: обработка строк

Heredoc

Очень важно отметить, что строка с закрывающим идентификатором не должна содержать других символов, за исключением точки с запятой (;). Это означает, что идентификатор не должен вводиться с отступом и что не может быть никаких пробелов или знаков табуляции до или после точки с запятой. Важно также понимать, что первым символом перед закрывающим идентификатором должен быть символ новой строки, определенный в вашей операционной системе. Например, в UNIX системах, включая Mac OS X, это \n. После закрывающего идентификатора также сразу должна начинаться новая строка.

Если это правило нарушено и закрывающий идентификатор не является «чистым», считается, что закрывающий идентификатор отсутствует и PHP продолжит его поиск дальше. Если в этом случае верный закрывающий идентификатор так и не будет найден, то это вызовет ошибку парсинга с номером строки в конце скрипта.

Heredoc не может быть использован для инициализации полей класса. Начиная с версии PHP 5.3, это ограничение распространяется только на heredoc, содержащие внутри себя переменные.

Пример #1 Неверный пример

Heredoc-текст ведет себя так же, как и строка в двойных кавычках, при этом их не имея. Это означает, что вам нет необходимости экранировать кавычки в heredoc, но вы по-прежнему можете использовать вышеперечисленные управляющие последовательности. Переменные обрабатываются, но с применением сложных переменных внутри heredoc нужно быть также внимательным, как и при работе со строками.

Пример #2 Пример определения heredoc-строки

= Пример строки,
охватывающей несколько строчек,
с использованием heredoc-синтаксиса.
EOD;

$foo = new foo ();
$name = ‘МоеИмя’ ;

Результат выполнения данного примера:

Также возможно использовать heredoc-синтаксис для передачи данных через аргументы функции:

Пример #3 Пример применения heredoc в аргументах

Начиная с версии 5.3.0, стала возможной инциализация статических переменных и свойств/констант класса с помощью синтаксиса heredoc:

Пример #4 Использование heredoc для инциализации статических переменных

// Class properties/constants
class foo
<
const BAR = Пример использования константы
FOOBAR;

Начиная с версии PHP 5.3.0 можно также окружать идентификатор Heredoc двойными кавычками:

Пример #5 Использование двойных кавычек в heredoc

Nowdoc

Nowdoc указывается той же последовательностью = Пример текста,
занимающего несколько строк,
с помощью синтаксиса nowdoc.
EOD;

$foo = new foo ();
$name = ‘МоеИмя’ ;

Результат выполнения данного примера:

В отличие от heredoc, nowdoc может быть использован в любом контексте со статическими данными. Типичный пример инициализации полей класса или констант:

Пример #7 Пример использования статичных данных

Поддержка nowdoc была добавлена в PHP 5.3.0.

Обработка переменных

Если строка указывается в двойных кавычках, либо при помощи heredoc, переменные внутри нее обрабатываются.

Существует два типа синтаксиса: простой и сложный. Простой синтаксис более легок и удобен. Он дает возможность обработки переменной, значения массива ( array ) или свойства объекта ( object ) с минимумом усилий.

Сложный синтаксис может быть определен по фигурным скобкам, окружающим выражение.

Простой синтаксис

Если интерпретатор встречает знак доллара ($), он захватывает так много символов, сколько возможно, чтобы сформировать правильное имя переменной. Если вы хотите точно определить конец имени, заключайте имя переменной в фигурные скобки.

Результат выполнения данного примера:

Аналогично могут быть обработаны элемент массива ( array ) или свойство объекта ( object ). В индексах массива закрывающая квадратная скобка (]) обозначает конец определения индекса. Для свойств объекта применяются те же правила, что и для простых переменных.

Пример #8 Пример простого синтаксиса

$people = new people ();

Результат выполнения данного примера:

Для чего-либо более сложного, используйте сложный синтаксис.

Сложный (фигурный) синтаксис

Он называется сложным не потому, что труден в понимании, а потому что позволяет использовать сложные выражения.

Любая скалярная переменная, элемент массива или свойство объекта, отображаемое в строку, может быть представлена в строке этим синтаксисом. Просто запишите выражение так же, как и вне строки, а затем заключите его в <и >. Поскольку <не может быть экранирован, этот синтаксис будет распознаваться только когда $ следует непосредственно за <. Используйте <\$, чтобы напечатать <$. Несколько поясняющих примеров:

// Показываем все ошибки
error_reporting ( E_ALL );

echo «Это значение переменной по имени, которое возвращает функция getName(): <$< getName ()>> » ;

// Не работает, выводит: Это то, что возвращает getName():
echo «Это то, что возвращает getName(): » ;
?>

С помощью этого синтаксиса также возможен доступ к свойствам объекта внутри строк.

Результат выполнения данного примера:

Функции, вызовы методов, статические переменные классов, а также константы классов работает внутри , начиная с версии PHP 5. Однако, указываемое значение будет обработано как имя переменной в том же контексте, что и строка, в которой она определяется. Использование одинарных фигурных скобок (<>) не будет работать для доступа к значениям функций, методов, констант классов или статических переменных класса.

// Показываем все ошибки
error_reporting ( E_ALL );

$rootbeer = ‘A & W’ ;
$ipa = ‘Alexander Keith\’s’ ;

Доступ к символу в строке и его изменение

Строки в PHP внутренне представляют из себя массивы байт. Как результат, доступ или изменение строки по смещению небезопасно с точки зрения многобайтной кодировки, и должно выполняться только со строками в однобайтных кодировках, таких как, например, ISO-8859-1.

Пример #9 Несколько примеров строк

Начиная с PHP 5.4 смещение в строке должно задаваться либо целым числом либо строкой, содержащей цифры, иначе будет выдаваться предупреждение. Ранее смещение, заданное строкой вида «foo», без предупреждений преобразовывалось в 0.

Пример #10 Различия между PHP 5.3 и PHP 5.4

Результат выполнения данного примера в PHP 5.3:

Результат выполнения данного примера в PHP 5.4:

В PHP 5.5 была добавлена поддержка доступа к символам в строковых литералах с помощью синтаксиса [] или <>.

Полезные функции и операторы

Строки могут быть объединены при помощи оператора ‘.’ (точка). Обратите внимание, оператор сложения ‘+’ здесь не работает. Дополнительную информацию смотрите в разделе Строковые операторы.

Для модификации строк существует множество полезных функций.

Также существуют функции для работы с URL, и функции шифрования/дешифрования строк (mcrypt и mhash).

Преобразование в строку

Целое ( integer ) или число с плавающей точкой ( float ) преобразуется в строку, представленную числом, состоящим из его цифр (включая показатель степени для чисел с плавающей точкой). Числа с плавающей точкой могут быть преобразованы с помощью экспоненциального представления (4.1E+6).

NULL всегда преобразуется в пустую строку.

Преобразование строк в числа

Если строка распознается как числовое значение, результирующее значение и тип определяется так, как показано далее.

Если строка не содержит какой-либо из символов ‘.’, ‘e’, или ‘E’, и значение числа помещается в пределы целых чисел (определенных PHP_INT_MAX ), строка будет распознана как целое число ( integer ). Во всех остальных случаях она считается числом с плавающей точкой ( float ).

Более подробную информацию об этом преобразовании смотрите в разделе о strtod(3) документации Unix.

Если вы хотите протестировать любой из примеров этого раздела, скопируйте и вставьте его и следующую строку, чтобы увидеть, что происходит:

Подробности реализации строкового типа

Строковый тип ( string ) в PHP реализован в виде массива байт и целого числа, содержащего длину буфера. Он не содержит никакой информации о способе преобразования этих байт в символы, предоставляя эту задачу программисту. Нет никаких ограничений на содержимое строки, например, байт со значением 0 («NUL»-байт) может располагаться где угодно (однако, стоит учитывать, что некоторые функции, как сказано в этом руководстве, не являются «бинарно-безопасными», т.е. они могут передавать строки библиотекам, которые игнорируют данные после NUL-байта).

Принимая во внимание тот факт, что PHP не диктует определенную кодировку для строк, можно задать вопрос, как в таком случае кодируются строковые литералы. Например, строка «á» эквивалентна «\xE1» (ISO-8859-1), «\xC3\xA1» (UTF-8, форма нормализации C), «\x61\xCC\x81» (UTF-8, форма нормализации D) или какому-либо другому возможному представлению? Ответом является следующее: строка будет закодирована тем образом, которым она записана в файле скрипта. Таким образом, если скрипт записан в кодировке ISO-8859-1, то и строка будет закодирована в ISO-8859-1 и т.д. Однако, это правило не применяется при включенном режиме Zend Multibyte: в этом случае скрипт может быть записан в любой кодировке (которая указывается ясно или определяется автоматически), а затем конвертируются в определенную внутреннюю кодировку, которая и будет впоследствии использована для строковых литералов. Учтите, что на кодировку скрипта (или на внутреннюю кодировку, если включен режим Zend Multibyte) накладываются некоторые ограничения: практически всегда данная кодировка должна быть надмножеством ASCII, например, UTF-8 или ISO-8859-1. Учтите также, что кодировки, зависящие от состояния, где одни и те же значения байт могут быть использованы в начальном и не начальном состоянии сдвига (initial and non-inital shift state), могут вызвать проблемы.

Разумеется, чтобы приносить пользу, строковые функции должны сделать некоторые предположения о кодировке строки. К несчастью, среди PHP-функций довольно большое разнообразие подходов к этому вопросу:

В конечном счете, написание корректных программ, работающих с Unicode, означает осторожное избегание функций, которые не работают с Unicode и, скорее всего, испортят данные, и использование вместо них корректных функций, обычно из расширений intl и mbstring. Однако, использование функций, способных работать с Unicode, является самым началом. Вне зависимости от тех функций, которые предоставляет язык, необходимо знать спецификацию самого Unicode. Например, если программа предполагает существование в языке только строчных и заглавных букв, то она делает большую ошибку.

Источник

Справочник по обустройству дома и дачи
Adblock
detector