Regular Expressions Cheat Sheet 1.0 Cheat Sheet

Główne klasy znaków

Literały, znaki dosłowne	Znaki mające taką samą wartość jak w piśmie, z którego pochodzą
Metaznaki	Znaki lub ich kombinacje opisujące literały
Znaki ucieczki	Zamieniają metaznak na literał (zob. niżej)

Metaznaki

.	Dowolny znak (zob. niżej)
a\|b	Alternatywa (a lub b)
[^-]	Klasy znaków (zob. niżej)
*+?	Kwantyfikatory (zob. niżej)
{}	Kwantyfikatory (zob. niżej)
()	Grupa znaków (zob. niżej)
^$	Granice tekstu (zob. niżej)
\	Klasa znaków, znak ucieczki, znak biały (zob. niżej)

Znaki ucieczki

\\	Ukośnik lewy
\.	Kropka
\[ \]	Nawiasy kwadratowe
\{ \}	Klamry
	Nawiasy okrągłe
\\|	Rura
\-	Łącznik (dywiz)
\^	Karetka
\$	Znak dolara
\*	Gwiazdka (asterysk)
\+	Plus

Znaki sterujące (białe)

\t	Tabulacja (pozioma; ASCII: 9)
\v	Tabulacja pionowa, dowolny pionowy znak biały
\V	Każdy znak za wyjątkiem pionowego znaku białego*
\n	Koniec akapitu (new line, line feed; ASCII: 10)**
\N	Każdy znak za wyjątkiem znaku końca akapitu*
\r	Powrót karetki (carriage return; ASCII: 13)
\R	Dowolna sekwencja znaków Unicode oznaczająca nowy akapit
\a	Dzwonek (alarm; ASCII: 7)
\0	Znak null (ASCII: 0)

*) Nie wszystkie implementacje.
**) W niektórych tekstach koniec akapitu (enter) to 2 znaki: \r\n.

Kropka – dowolny znak

Kropka oznacza każdy znak za wyjątkiem znaku (znaków) końca akapitu, a więc \n lub \r\n. Może jednak oznaczać również te znaki po włączeniu odpowiedniej funkcji (np. single line, dotall) lub dodaniu flagi /s lub modyfikatora (?s).

Klasy znaków

[abc]	1 znak: a albo b, albo c
[a-c]	1 znak z zakresu od a do c
[^abc]	1 znak różny od a oraz b, oraz c
[^a-c]	1 znak różny od każdego z zakresu od a do c
\d	Cyfry: \d = [0-9] = [0123456789]
\D	Niecyfry: \D = [^{0-9] = [}0123456789]
\w	Znak wyrazowy: \w = [a-zA-Z0-9_]
\W	Znak niewyrazowy: \W = [^a-zA-Z0-9_]
\s	Biały znak (spacja, enter, tabulacja i in.)
\S	Znak niebiały: \S = \w + !, ?, @ i in.
\L*	Małe litery
\U*	Wielkie litery
\E*	Wyłącza działanie \U oraz \L
\b	Granice wyrazu
\B	Granice niewyrazu

*) Działa tylko w oknie "Zamień na".

Kwantyfikatory

Zachłanne	Leniwe	Zaborcze	Znak a...
a*	a*?	a*+	0 razy lub więcej
a+	a+?	a++	1 raz lub więcej
a?	a??	a?+	0 lub 1 raz
a{3}	a{3}?	a{3}+	3 razy
a{3,}	a{3,}?	a{3,}+	3 lub więcej razy
a{3,6}	a{3,6}?	a{3,6}+	od 3 do 6 razy

Kwantyfikatory zachłanne - zwracają maksymalne możliwe dopasowanie.
Kwantyfikatory leniwe - zwracają minimalne możliwe dopasowanie.
Kwantyfikatory zaborcze - zwracają tylko maksymalne dopasowanie lub żadne.

Grupy znaków

Grupy przechwycone
(abc)	Nienazwana grupa abc
(?\|ab\|cd)	Nienazwane grupy ab i cd
(?'x'ab)	Grupa ab o nazwie x
(?<x>ab)	Grupa ab o nazwie x
(?'x'ab\|cd)	Grupy ab i cd o nazwie x
(?<x>ab\|cd)	Grupy ab i cd o nazwie x
Grupy nieprzechwycone
(?:abc)	Nienazwana grupa abc

Odwołania do przechwyconych grup znaków

\1 \g<1> \g{1}	Pierwsza grupa nienazwana
\g{-1}	Ostatnia grupa nienazwana (przed odwołaniem)
\g<x>	Grupa o nazwie x
\g<0>	Wszystkie wyszukania (także grupy nieprzechwycone)

Granice (kotwice)

Początek	Koniec
Granice niekonsumujące znaku (sprawdzają tylko obecność znaku granicznego)
^	$	Cały tekst lub akapit*
\b	\b	Wyraz
\B	\B	Niewyraz
\<	\>	Wyraz
[[:<:]]	[[:>:]]	Wyraz (zob. POSIX)
\A	\Z	Cały tekst
\Q	\E	Wyłączenie metaznaków
Granice konsumujące znaki (zwracają sam znak graniczny)
(**)	\W	Wyraz
	\n lub \r\n	Akapit

*) Znaki ^, $ oznaczają granice akapitu tylko w niektórych implementacjach lub przy użyciu flagi /m lub modyfikatora (?m) (multiline).
**) Konsumujące znaki końca wyrazu i akapitu wskazują też początek niepierwszego wyrazu i akapitu. Znakiem końca ostatniego wyrazu i akapitu są $ oraz \Z.

Asercje (assertions)

Przewidywania postępowe (lookaheads)
a(?=b)	Zwróć a, jeśli PO nim jest b
a(?!b)	Zwróć a, jeśli PO nim NIE ma b
Przewidywania wsteczne (lookbehinds)
(?<=b)a	Zwróć a, jeśli PRZED nim jest b
(?<!b)a, (?!=b)a	Zwróć a, jeśli PRZED nim NIE ma b
Wyrażenie warunkowe
(?(w)a\|b)	Jeśli dopasowano w, znajdź a, jeśli nie, znajdź b
(?(w)a)	Jeśli dopasowano w, znajdź a
(?w)\|b)	Jeśli NIE dopasowano w, znajdź b
(g)(?(1)a)	Warunek jako grupa nienazwana
(?'n')(?(n)a)	Warunek jako grupa nazwana
(?(?<=w)a)	Warunek jako przewidywanie

Opcje (modifiers)

(?i)	Pominięcie wielkości liter
(?-i)	Uwzględnienie wielkości liter
(?x)	Ignorowanie spacji i napisów po # (komentarzy)
(?-x)	Traktuj spacje i # jak literały
(?m)	^ i $ wskazują początek/koniec akapitu
(?-m)	^ i $ wskazują tylko początek/koniec tekstu
(?J)	Możliwe duplikaty nazw grup*
Zapis modyfikatorów
(?ism) ≡ (?i)(?s)(?m)	Kilka modyfikatorów
(?is) ≡ (?si)	Kolejność modyfikatorów
(?-im) ≡ (?-i)(?-m)	Negacja modyfikatorów
(?i:te)st ≡ (?i)te(?-i)st	Zawężenie działania modyfikatorów

* Nie we wszystkich silnikach.

Opcje silnika PCRE (verbs)

(*UCP)	Poszerzenie klas znaków o znaki z całego Unicode*
(*LIMIT_MATCH=(5)	Ograniczenie liczby dopasowań do 5
(*LIMIT_RECURSION=5)	Ograniczenie liczby dopasowywanych podwzorców
Ustawienia znaków i sekwencji oznaczających koniec akapitu:
(*CR)	Koniec akapitu to znak \r
(*LF)	Koniec akapitu to znak \n
(*CRLF)	Koniec akapitu to sekwencja \r\n
(*ANYCRLF)	Koniec akapitu to \r lub \n, lub \r\n
(*ANY)	Koniec akapitu do dowolny znak oznaczający w Unicode koniec akapitu**

) Klasy \d, \w, \s, \h, \v oznaczają domyślnie znaki z zakresu ASCII. Opcja (UCP) poszerza ich zakresy na całą tablicę Unicode.
**) Znakami końca akapitu stają się: \r\n, \r, \n, \v, \f, U-0085, U-2028, U-2029.

Definicje wyszukiwań

(?(DEFINE)(?'x'abc))	Zdefiniowanie wyszukiwania abc o nazwie x
\g'x' \g<x>	Wywołanie wyszukiwania o nazwie x

Same definicje są ignorowane podczas wyszukiwania.

Macierz podstawiania

Zamiana wielu znaków w 2 krokach, np. a, b, c na, odpowiednio, x, y, z.
Krok:	Znajdź:	Zamień na:
1	([abc])	``\1`ax`by`cz`
2	``(.).?`\1(.).?``	\2

Kody znaków

\x##	2-cyfrowy kod szesnastkowy (Unicode)
\x{#}	kod szesnastkowy (Unicode)
\o{#}	kod ósemkowy (Unicode)

Znaki POSIX

[[:digit:]]	Cyfry
[[:xdigit:]]	Cyfry szesnastkowe [0-9a-fA-F]
[[:alpha:]]	Litery
[[:lower:]]	Małe litery
[[:upper:]]	Wielkie litery
[[:alnum:]]	Litery i cyfry
[[:ascii:]]	Znaki z tablicy ASCII
[[:punct:]]	Nielitery i niecyfry
[[:word:]]	Znaki wyrazowe (litery, cyfry i podkreślnik)
[[:graph:]]	Znaki widoczne (niebiałe)
[[:print:]]	Znaki widoczne (niebiałe) i spacje
[[:blank:]]	Spacja i tabulacja
[[:space:]]	Białe znaki
[[:cntrl:]]	Znaki kontrolne
[[:<:]]	Początek wyrazu
[[:>:]]	Koniec wyrazu

Grupy znaków Unicode

Główne grupy znaków Unicode
\pC	Znaki niewidoczne i nieużywane (kody bez znaków)
\pL	Litery
\pN	Liczby
\pM	Łączące znaki diakrytyczne
\pP	Znaki przestankowe (nielitery i niecyfry)
\pS	Symbole matematyczne, znaki walut, piktogramy, semigrafika itp.
\pZ	Białe znaki
Podgrupy znaków Unicode
\p{Cc}	Znaki kontrolne
\p{Cf}	Niewidoczne znaki formatowania
\p{Cn}	Kody bez przypisanych znaków
\p{Co}	Znaki do użytku prywatnego
\p{Cs}	Kody wykluczone z użytku (dot. kompatybilności z UTF-16)
\p{Ll}	Litery małe z dowolnych języków
\p{Lu}	Litery wielkie z dowolnych języków
\p{Lo}	Litery bez odpowiednika wielkiego/małego
\p{Lt}	Dwuznaki o pojedynczym kodzie
\p{Mc}	Łączący znak diakrytyczny o szerokości litery
\p{Me}	Znak, w który wpisywany jest inny znak
\p{Mn}	Łączący znak diakrytyczny wpisywany w pole innej litery
\p{Nd}	Liczby dziesiętne
\p{No}	Cyfry w górnym i dolnym indeksie
\p{Pc}	Znak przestankowy łączący słowa (np. "_")
\p{Pd}	Dowolny myślnik lub łącznik
\p{Ps}	Dowolny nawias otwierający
\p{Pe}	Dowolny nawias zamykający
\p{Pi}	Dowolny znak otwierający cytat
\p{Pf}	Dowolny znak zamykający cytat
\p{Po}	Pozostałe widoczne znaki niealfanumeryczne
\p{Sc}	Symbole walut
\p{Sk}	Znaki modyfikujące odstępy (diakryty dopisywane)
\p{Sm}	Symbole matematyczne
\p{So}	Pozostałe symbole
\p{Zl}	Separator wiersza (U+2028)
\p{Zp}	Separator akapitu (U+2029)
\p{Zs}	Niewidoczny znak mający pewną szerokość

Regular Expressions Cheat Sheet 1.0 Cheat Sheet (DRAFT) by PiotrRybka82

Główne klasy znaków

Metaznaki

Znaki ucieczki

Znaki sterujące (białe)

Kropka – dowolny znak

Klasy znaków

Kwantyfikatory

Grupy znaków

Odwołania do przechwyconych grup znaków

Granice (kotwice)

Asercje (assertions)

Opcje (modifiers)

Opcje silnika PCRE (verbs)

Definicje wyszukiwań

Macierz podstawiania

Kody znaków

Znaki POSIX

Grupy znaków Unicode

Latest Cheat Sheet

Random Cheat Sheet

About Cheatography

Behind the Scenes

Recent Cheat Sheet Activity

Please Disable Your Ad Blocker

Regular Expressions Cheat Sheet 1.0 Cheat Sheet (DRAFT) by PiotrRybka82

Główne klasy znaków

Metaznaki

Znaki ucieczki

Znaki sterujące (białe)

Kropka – dowolny znak

Klasy znaków

Kwanty­fik­atory

Grupy znaków

Odwołania do przech­wyc­onych grup znaków

Granice (kotwice)

Asercje (asser­tions)

Opcje (modif­iers)

Opcje silnika PCRE (verbs)

Definicje wyszukiwań

Macierz podsta­wiania

Kody znaków

Znaki POSIX

Grupy znaków Unicode

Latest Cheat Sheet

Random Cheat Sheet

About Cheatography

Behind the Scenes

Recent Cheat Sheet Activity

Please Disable Your Ad Blocker

Kwantyfikatory

Odwołania do przechwyconych grup znaków

Asercje (assertions)

Opcje (modifiers)

Macierz podstawiania