Регулярные выражения применяются для указания шаблонов строк. Их можно использовать всякий раз, когда требуется отыскать строки, соответствующие конкретному шаблону. Например, одна из наших демонстрационных программ умеет отыскивать в HTML-файле все гиперссылки путем поиска строк, соответствующих следующему шаблону: <a href=»…»>.
Конечно, для определения шаблона обозначение … является не достаточно точным. Необходимо как можно конкретнее указывать, какая именно последовательность символов должна считаться настоящим совпадением. Этот требует применения при каждом описании шаблона специального синтаксиса.Ниже приведен простой пример. Регулярное выражение:
[Jj]ava.+ указывает считать совпадение любую строку, которая отвечает следующим условиям:
- имеет в начале букву J или j
- в качестве трех следующих букв содержит буквы ava;
- в остальной части состоит из одного или более других(произвольных) символов.
Например, строка «javanese» будет являться соответствующим данному регулярному выражению совпадением, а строка «Core Java» — нет.
Как видите, для того чтобы понять смысл регулярного выражения, нужно хотя бы немного разбираться в синтаксис. К счастью, для большинства целей вполне хватает небольшого набора довольно простых конструкций.
- Класс символов(character class) — набор вариантов символов, заключенный в квадратные скобки, например: [Jj], [0-9], [A-Za-z] или [^0-9]. Здесь символом — обозначается диапазон (все символы, значение Unicode которых вписывается в указанные рамки), а символом ^ — дополнение(все символы кроме указанных).
- Существует много предопределенных классов символов, вроде класса \d(для цифр) и класса \p{Sc}(для валютного символа Unicode).
- Многие символы указывают считать совпадением самих себя, подобно ava в предыдущем примере.
- Символ . указывает считать совпадение любой символ(кроме, возможно, символов окончания строки, что зависит от параметров флагов).
- Символ \ служит символом отмены, например, комбинация \. означает, что совпадением должна считаться точка, а комбинация \\, соответственно — что символом должен считаться символом обратной косой черты.
- Символы ^ и $ означают, что совпадением должны считаться, соответственно, начало и конец строки.
- Если X и Y являются регулярными выражениями, тогда XY означает, что совпадением должно считаться «любое совпадение для X, за которым следует совпадение для Y», а X | Y — что совпадение должно считаться «любое совпадение для X или Y».
- К выражению X можно применять квантификаторы(quantifiers), наподобие X+(1 или больше), X*(0 или больше) и X?(0 или 1).
У вас проблемы с зубами? Советуем вам качественное выравнивание зубов от компании club32.com.ua. Все по очень выгодным ценам.