İlk kez kodlama ile uğraşmaya başlayan her kullanıcının karşısına günün birinde kesinlikle çıkacak terimlerden biri olan RegeX nedir? Bunu kullanmanın geliştirme sürecine olan katkısı da dahil olmak üzere hakkında merak edebileceğiniz her şeyi yazının ilerleyen kısımlarında detaylı bir şekilde ele alacağız.
RegeX Nedir?
RegeX, düzenli ifade anlamına gelir. Herhangi bir karakter dizisinde belirli dizeleri ya da kalıpları bulmak veya doğrulamak için kullanılır. Temel karakterler kullanılabileceği gibi, özel karakterlerin de kullanıldığı görülür. Temelden kasıt klasik harflerken özel karakterler ise sayıları, kısa çizgileri ve benzerlerini kapsar.
RegeX’i destekleyen programlama dillerinin başında Python gelir. Özel karakterleri ve temel karakterleri kullanarak belirli işlemler için doğrulama süreci hazırlamanıza olanak tanır.
Bir metin harflerden sayılara, boşluktan özel karakterlere kadar hemen hemen her şeyden oluşabilir. Dize bir tür kalıba bağlı kaldığı sürece regex ile aranan kolaylıkla yakalanabilir ve dizenin belirli bir bölümünü döndürebilir.
RegeX Ne İşe Yarar?
- Bir dizi olasılıktan tek bir karakteri ya da karakter dizisini yakalar.
- Telefon numarasının geçerli olup olmadığını kontrol eder.
- Karakter dizisinin alan adı formatına uygun olup olmadığını doğrular.
- Geçerli bir e-posta adresi girilmesini sağlar.
Örnek olarak telefon numarasını ele alalım. Elimizde bir dizi telefon numarası olsun. Bunları üçe ayıralım: 000-000-0000. Buna göre ilk kısım üç, ikinci kısım üç, üçüncü kısım ise dört olmak zorundadır. Bunları gruplandırmak için bir kalıp tanımlamamız gerekiyor: telefon_numara = “.?(\\d{3}).*(\\d{3}).*(\\d{4})”
Şimdi de yukarıda ne yaptığımızı tek tek açıklayalım:
- .?: Parantezi de hesaba katıyoruz.
- (\\d{3}): İlk grubumuz üç karakterden oluşuyor.
- .*: Bununla numarayı ayırmak için kullanılan parantez, kısa çizgi ve benzerlerini hesaba katıyoruz.
- (\\d{3}): İkinci grubumuz yine üç karakterden oluşuyor.
- .*: Daha önce de yaptığımız gibi yine ayırma olasılığını hesaba katıyoruz.
- (\\d{4}): Son grubumuzun dört karakterden oluşması gerekiyor.
Bu sadece bir tanımdı. Tek başına çalışamaz, değil mi? Daha sonra str_match fonksiyonunu kullanarak tanımınızı dilediğiniz koşullara bağlı olarak kullanmaya başlayabilirsiniz.
En çok ihtiyaç duyacağınız RegeX karakterleri arasında “\d (sayı), nokta (herhangi bir karakter), \D (sayı içermiyor), \w (harf), \W (harf içermiyor) yer alır. Bu karakterleri kullanarak normalde çok fazla vaktinizi alacak koşulları çok kısa süre içinde yaratabilirsiniz.