Wyrażenia regularne cz. 2

Działanie w praktyce

W poprzednim artykule skupiliśmy się na podstawach pracy z wyrażeniami regularnymi. Poznaliśmy kilka najprostszych elementów oraz pracowaliśmy z przykładami.

Jeśli ktoś z Was nie widział pierwszej części to może ją znaleźć tutaj.

W drugiej części artykułu o wyrażeniach regularnych chciałbym pokazać Wam jak użyć ich w praktyce.

Do tego celu posłużę się najpopularniejszym darmowym IDE jakim jest Visual Studio Code.

Każdy edytor tekstu posiada wbudowane narzędzie do wyszukiwania znaków za pomocą regexów. W VSC wyszukiwarkę tekstu możemy uruchomić za pomocą skrótu klawiszowego ctrl+f a narzędzie do podmiany tekstu ctrl+h.
Narzędzie to ma 2 tryby wpisywania. Możemy użyć zwykłego ciągu znaków (tak jak w każdej wyszukiwarce), lub posłużyć się wyrażeniami regularnymi.

Możemy także określić czy zwracamy uwagę na rozmiar liter oraz całe wyrazy.

Na początku załóżmy że mamy duży plik html z dużą ilością tagów img które posiadają swoje alty oraz src. Pojawiają się także inne tagi takie jak div.
Nasze pierwsze zadanie polegać będzie na znalezieniu obrazka z alt który nie posiada cyfry.

kliknij zdjęcie aby zobaczyć je w większym rozmiarze

Zwróćcie uwagę że w VSC aby używać regexów muszę zaznaczyć trzecią opcję w wyszukiwarce czyli znak .*

Za pomocą wyrażenia: alt\=\”[a-z]+\” wyszukuję tylko takie wyrażenie.
Najpierw szukam alt po którym występuje =, po nim “ a następnie tylko litery z zakresu [a-z] których musi być co najmniej 1 (+). Całość kończę znakiem “.

Teraz kolej na alty ale takie w których występuje co najmniej 1 cyfra.

Wyrażenie jest bardzo podobne do pierwszego ale po wyszukaniu liter używam [1-9]+ po to żeby upewnić się że pomiędzy “” występuje chociaż 1 cyfra w tym wypadku z zakresu 1 do 9.

W kolejnym przykładzie zakładam że alt musi mieć w sobie litery oraz co najmniej 1 cyfrę 2 lub 4.

W tym wypadku po wyszukaniu liter tworzę nową grupę za pomocą nawiasów okrągłych, podaje jako 1 możliwość cyfrę 2, używam znaku | który w wyrażeniach regularnych oznacza “lub” oraz wybieram cyfrę 4 jako drugą możliwość.

W tym przykładzie wyszukam wszystkie tagi html które nie są tagami img. Może się to przydać jeśli chcielibyśmy usunąć wszystko oprócz danego tagu lub skopiować cały html bez obrazków.

Najpierw otwieram tag html < następnie używam nawiasów kwadratowych w których jako pierwszy używam znak ^. Neguję on zawartość nawiasu. Oznacza to że szukam wszystkich innych liter oprócz i, m albo g. Następnie wyszukuję wszystkie pozostałe znaki z linii za pomocą wyrażenia .*.

Nawiasy okrągłe w regexach mają jeszcze jedną ważna funkcjonalność. Każdy otwarty nawias tworzy grupę, która jest zapamiętana i do której możemy odwołać się poprzez użycie wyrażenia $ oraz cyfry od 1 do 9. Polska nazwa tego wyrażenia to nawiasy wychwytujące.

W przykładzie korzystam z dwóch takich grup.
Najpierw zapamiętuje całe wyszukiwane wyrażenie, oraz w drugiej kolejności nazwę pliku z źródła src w tagu img.
Dzięki temu po wpisaniu w drugiej linijce narzędzia zamiany wyrażenia $1$2, najpierw z powrotem “zamieniam” znalezione ciągi znaków na te same ciągi znaków a następnie za pomocą $2 dopisuję nazwy plików bez rozszerzenia .jpg.

W tym przykładzie dodaje do tagów img atrybut title. Zakładam że ma on mieć taką samą wartość jak alt.
Wobec tego najpierw wyszukuję alt i jego wartość, następnie zapamiętuje wartość oraz w drugiej linijce, najpierw powtarzam alty tak żeby były takie same przy użyciu $1. Później dopisuję title do którego również za pomocą $1 przypisuję ciąg znaków z atrybutu alt.

Kiedy nie znałem regexów często podobne zadanie jak to u góry wykonywałem ręcznie. Nie ma jednak się co trudzić!
Dzięki poznanym już grupom najpierw wyszukuję ciąg znaków przed dwukropkiem oraz po. Do jednego przypisuję grupę $1, do drugiego $2. Po czym po prostu odwracam ich kolejność.

Jeśli jesteście ciekawi innych rozwiązań związanych z wyrażeniami regularnymi albo chcielibyście poszerzyć swoją wiedzę na ich temat polecam MDN

SALESmanago ogłasza zmiany na kluczowych stanowiskach: Nowy CEO i CRO

SALESmanago, wiodąca platforma CDP i Marketing Automation, z entuzjazmem informuje o istotnych zmianach w swoim zespole kierowniczym. Zmiany mają na celu optymalizację procesu dostarczania rozwiązań dla segmentu średnich przedsiębiorstw. Po 13 latach kierowania rozwojem firmy w roli Dyrektora Generalnego, współzałożyciel SALESmanago, Grzegorz Błażewicz, obejmuje nieoperacyjną rolę członka Rady Nadzorczej. Będzie tam odpowiadał […]

Jak prześcignąć konkurencję eCommerce za pomocą czegoś tak prostego jak szablony wiadomości e-mail? Chcemy czy nie, email marketing pozostaje potężnym narzędziem do angażowania klientów, zwiększania sprzedaży i ostatecznie – wyprzedzania konkurencji. Dzięki odpowiednim strategiom i dobrze opracowanym szablonom e-mailowym można skutecznie komunikować się z odbiorcami, budować trwałe relacje i zwiększać zyski. Poniżej […]

Pitbull West Coast stanęło przed wyzwaniem – jak wyróżnić się na zatłoczonym rynku i jeszcze bardziej zaangażować swoją społeczność? Odpowiedzią była współpraca z SALESmanago a zwrot z inwestycji (ROI) osiągnął 2947% Pitbull West Coast to marka odzieżowa, zainspirowana kulturą uliczną i sportami walki. Budując swoją przewagę konkurencyjną i strategie zaangażowania społeczności, firma napotkała […]

W coraz bardziej konkurencyjnym świecie eCommerce istnieją pewne nakazy i zakazy, jeśli chodzi o zachęcanie klientów do dokonywania zakupów w Twoim sklepie. Czynność ta nazywana jest konwersją i jest to najważniejszy wskaźnik, który musisz obserwować, planując budowanie swojej firmy i zwiększanie przychodów – w końcu sklep internetowy z milionami odwiedzających, który nie sprzedaje, […]

W świecie, w którym technologia i handel coraz bardziej się przenikają, firmy eCommerce znalazły się na rozdrożu, szukając sposobu na romans z generatywną sztuczną inteligencją. Niedawno opublikowany raport Gartnera, zatytułowany „4 Ways Generative AI Will Impact CISOs and Their Teams”, dostarcza informacji na temat przyszłości cyberbezpieczeństwa w erze AI. Zatem, entuzjaści eCommerce, jeśli […]

Top 10 porażających statystyk dotyczących hipersegmentacji, które musisz znać

Segmentacja jest znana marketerom już od dłuższego czasu. Jednak w większości przypadków, przypomina raczej nieoszlifowany diament. Wraz z ciągłymi zmianami w technologii wykorzystywanej do zbierania danych, nowymi pokoleniami konsumentów, którzy wymagają wysoce spersonalizowanych treści oraz z ostatnimi zmianami w zachowaniach zakupowych, które spowodował COVID-19, aktualizacja sposobów segmentacji danych stała się kluczowa. Segmentowane kampanie […]

5 super zaawansowanych i turbo-skutecznych segmentacji dla eCommerce

Hipersegmentacja w eCommerce to trend, który ma szansę zdominować rynek na dłuższy czas. Segmentacja 1:1 pozwala tworzyć na masową skalę oferty dopasowane indywidualnie do każdego odbiorcy. Ma to wpływ na przychody w sklepie i CLV jego klientów. Jak konkretnie można zastosować hiperpersonalizację w różnych typach eCommerce? Oto 5 super zaawansowanych i turbo-skutecznych segmentacji. […]

Zerkamy w przyszłość: analityka predyktywna w SALESmanago

W stale ewoluującym świecie eCommerce, firmy nieustannie poszukują innowacyjnych sposobów na zwiększenie swojej przewagi konkurencyjnej. Trudno przecenić tu rolę analityki predyktywnej. Jej wieloaspektowość ma kluczowe znaczenie dla rozwoju i sukcesu branży. Szklana kula dla marketingowców Analityka predyktywna to gałąź analityki danych, która wykorzystuje dane historyczne, algorytmy statystyczne oraz technologię uczenia maszynowego […]

[NAGRANIE WEBINARU] „Przygotuj swój eCommerce na 2024 rok: Doświadczenia z 2023 roku, najważniejsze trendy i innowacje technologiczne dla sklepów internetowych”

Już teraz możesz obejrzeć nagranie naszego ostatniego webinaru, poprowadzonego przez Director Solutions Consulting w SALESmanago, Aleksandra Skałkę. Kliknij i odkryj: – Taktyki wdrożone przez najlepiej prosperujące firmy eCommerce w 2023 r. – Najważniejsze trendy w eCommerce na lata 2023/2024: Sztuczna inteligencja, prywatność danych, dane stron zerowych i inne. – Nowe technologie […]

10 wskazówek e-mail marketingowych dla marketerów, którzy nienawidzą swoich prezesów

Nie wchodzimy w szczegóły, dlaczego nienawidzisz swojego CEO. Może po prostu nie znosisz swojej pracy? W obu przypadkach – służymy pomocą. Trzymaj się poniższych rad a zrujnujesz nawet najlepiej zaplanowaną kampanię e-mailową. I niech prezes patrzy. 1. Mów za dużo! Na co komu zwięzlość?! W świecie e-mail marketingu im dłużej, tym […]

O Nas

Społeczność

Więcej

Customer Data Platform

Campaigns Management

Omnichannel Execution

Strona Internetowa

Baza Wiedzy

Książki

Akademia