Регулярні вирази в PHP. Функція preg_match і utf-8

24

Від автора: вітаю вас, друзі. У попередній статті ми з вами говорили про специфіку роботи регулярних виразів в PHP з кирилицею. Однак ми використовували при цьому кодування windows-1251. У цій статті ми вже будемо працювати з кодуванням utf-8 і використовуємо функцію preg_match для пошуку кирилиці в тексті. Почнемо?

Отже, в попередній статті ми з вами використовували в якості піддослідного кролика наступний рядок тексту: «Іван Народив Дівчинку, Наказав Тягти Пелюшку». І ось таке формальний вираз:

$pattern = ‘#[А-Яа-яЕе]+#’;

Цей шаблон цілком коректно працював з текстом в кодуванні windows-1251, тобто з однобайтовим кодуванням. Зараз ця кодування використовується все рідше і рідше. Практично стала стандартом кодування utf-8. Давайте використаємо її: