В Chrome 73 представлен метод String.prototype.matchAll()
. Он ведет себя аналогично match()
, но возвращает итератор со всеми совпадениями регулярных выражений в глобальном или закрепленном регулярном выражении. Это предлагает простой способ перебора совпадений, особенно если вам нужен доступ к группам захвата.
Что не так с match()?
Короткий ответ: ничего, если только вы не пытаетесь вернуть глобальные совпадения с группами захвата. Вот вам головоломка по программированию. Рассмотрим следующий код:
const regex = /t(e)(st(\d?))/g;
const string = 'test1test2';
const results = string.match(regex);
console.log(results);
// → ['test1', 'test2']
Запустите это в консоли и обратите внимание, что он возвращает массив, содержащий строки 'test1'
и 'test2'
. Если я удалю флаг g из регулярного выражения, я получу все мои группы захвата, но получу только первое совпадение. Это выглядит так:
['test1', 'e', 'st1', '2', index: 0, input: 'test1test2', groups: undefined]
Эта строка содержит второе возможное совпадение, начинающееся с 'test2'
но у меня его нет. Теперь вот загадка: как мне получить все группы захвата для каждого совпадения? Объяснение предложения String.prototype.matchAll() показывает два возможных подхода. Я не буду их описывать, потому что, надеюсь, они вам больше не понадобятся.
String.prototype.matchAll()
Как будут выглядеть примеры объяснения с помощью matchAll()
? Посмотрите.
const regex = /t(e)(st(\d?))/g;
const string = 'test1test2';
const matches = string.matchAll(regex);
for (const match of matches) {
console.log(match);
}
По этому поводу следует отметить несколько вещей. В отличие от match()
, который возвращает массив при глобальном поиске, matchAll()
возвращает итератор, который прекрасно работает с циклами for...of
. Итератор создает массив для каждого совпадения, включая группы захвата с некоторыми дополнениями. Если вы распечатаете их на консоли, они будут выглядеть так:
['test1', 'e', 'st1', '1', index: 0, input: 'test1test2', groups: undefined]
['test2', 'e', 'st2', '2', index: 5, input: 'test1test2', groups: undefined]
Вы можете заметить, что значение каждого совпадения представляет собой массив точно такого же формата, который возвращается match()
для неглобальных регулярных выражений.
Бонусный материал
Это в основном для людей, которые плохо знакомы с регулярными выражениями или не являются в этом экспертами. Возможно, вы заметили, что результаты match() и matchAll() (для каждой итерации) представляют собой массивы с некоторыми дополнительными именованными свойствами. Готовя эту статью, я заметил, что у этих свойств есть некоторые недостатки документации на MDN (которые я исправил ). Вот краткое описание.
-
index
- Индекс первого результата в исходной строке. В приведенном выше примере
test2
начинается с позиции 5, следовательно,index
имеет значение 5. -
input
- Полная строка, для которой выполнялся
matchAll()
. В моем примере это было'test1test2'
. -
groups
- Содержит результаты любых именованных групп захвата, указанных в регулярном выражении.
Заключение
Если я что-то пропустил, пожалуйста, дайте мне знать в комментариях ниже. Подробнее о последних изменениях в JavaScript можно прочитать в предыдущих обновлениях или на сайте V8 .