Makine Öğrenimi İşletmelerde Yaygınlaşacak

Şirketinizdeki her çalışan için makine öğrenme yeteneklerini nasıl geliştirebilirsiniz? İşte detaylar...

Futuristic digital background. Abstract connections technology and digital network. 3d illustration of the Big data and communications technology.

Makine öğrenimi işletmelerde daha da yaygınlaşacak. Yapay Zeka (AI) ve Veri Bilimi (DS) herkes tarafından sevilen alanları temsil ederken, bu durumun önümüzdeki 10 yıl içinde değişmeyeceğini söyleyebiliriz. Durum böyle olsa da, birçok insan veri biliminin ne olduğuna ve ML ve AI algoritmalarının neler yapabildiğine dair genel bir görüşe sahip.

Her uzmanlık alanı için bu durum genel, olağan yaklaşımı temsil ediyor. Bir düşünün: DevOps, Support veya NOC (Ağ Operasyon Merkezi) tam olarak ne yapıyor biliyor musunuz? Teknoloji uzmanlarının bu kavramları diğer insanlardan daha kapsamlı anlatacağına şüphe yok ancak bir işi gerçekten yapmadığınız sürece tamamen anlamak gerçekten kolay değil.

Farklı alanlarda bilginin tamamına hakim olmasanız da durumu iyi bir şekilde kontrol edebileceğiniz için birçok durumda yukarıdaki tablo sorun oluşturmazdı. Aslına bakarsanız, birçok durumda sahip olduğunuz ek bilgiyi kullanmanıza gerek bile kalmazdı. Bunu söylerken Veri Bilimi’nin diğer örneklerden oldukça farklı olduğunu belirtmek gerekiyor çünkü veri her yerde. Veriyi depolamak ve kullanmak her zamankinden daha kolay ve Veri Bilimi ve veri kaynaklı karar alım süreci her zaman mantıklı. Her şirketin her departmanı veri odaklı alınan kararlardan fayda sağlayabilir. DevOps ML kullanarak ürün hatlarını inceleyebilir ve bozuklukları tespit edebilir. Destek birimi kümeleme algoritmaları kullanarak müşteri taleplerini gruplayabilir ve iş yükünü hafifletebilir; NOC bozukluk tespit algoritmalarını kullanarak iyi çalışmayan ağları tespit edebilir. Herkesin Veri Bilimi’nden faydalanabileceğinden yola çıkarak, her istekli çalışana veri bilimi yetenekleri nasıl kazandırılır ve veri bilimi sevgisi nasıl yayılır biraz bahsedelim.

Veri Bilimi Atölye Amaçları

Geliştirilen atölye, temel Python yetenekleri olan herkesin Veri Bilimi’nin ne olduğunu hızlıca anlamasına ve “ne zaman, neden, nerede ve nasıl” sorularını yanıtlayabilmesini amaçlıyor.

Atölyede Aşağıdaki Amaçlar Belirlendi:

1- Ekibimiz dışında “Veri Bilimi Elçileri” atayarak, temel Veri Bilimi araçları ve anlayışı ile çalışma ve işbirliği ortamının oluşturulması,
2- Kısa ve etkin bir eğitim sağlayarak elçilerin iş esnasında eğitime devam etmesini sağlamak,
3- Veri odaklı karar verme süreçleri hakkında bilinçlilik oluşturmak ve faydaları hakkında bilgi yaymak.

Takip Eden Süreç ile Elde Edilmesi İstenen Amaçlar:

1- ML ve temel algoritmaları açıklamak,
2- Makine öğrenilebilir problemlerin tespit edilmesi,
3- Python ve Sklearn kullanarak ML egzersizleri yapmak.

İlk düşüncemiz çevrimiçi ortamda bir DS kursu bulunması gerektiğine yönelikti. Birçok kurs bulmuş olmamıza rağmen, belli sebeplerden dolayı beklentilerimizi karşılamadı:

1- Çok az kurs belirlediğimiz zaman diliminde istediğimiz materyalleri kapsıyordu,
2- Birçok kurs bir sınıf yaklaşımı değil ancak kendini geliştirmek isteyenlere yönelikti,
3- Matematik ve İstatistik atölye için ön koşul olarak belirmediği için herkes tarafından anlaşılabilecek ML modellerinin teorik ifadelerine ihtiyacımız vardı.

Bu sebeplerden dolayı kendi atölyemizi hazırlamaya karar verdik. Bir sonraki aşamada, atölyenin yeni başlayanlara Veri Bilimi öğretmek konusunda nasıl başarı elde ettiğine bakacağız.

ML ve Temel Algoritmaları Açıklama

Imperva’da görev alan en büyük DS ekibi olarak geliştirme, ürün ve destek gibi birçok departman ile proje süreçleri esnasında etkileşim kuruyoruz. Yaşanan sorunlardan bir tanesi, geliştirdiğimiz ML çözümünün nasıl projelere uygulandığı ve tam olarak ne yaptığıydı. İlk başta ML çözümünün projelere nasıl oturacağı konusunda zorluklar yaşanmış olsa da, gelecekteki projelerde aynı sorununun kendini tekrarlamadığını ve çözümün bir projeye ne kadar kolay uygulandığını gördük. İnsanların ML çözümü ile değil ama ML ile genel olarak sorun yaşadıklarını anladık. Ancak temel bilgileri aldıklarında, ML uygulamak kolaylaşıyordu.

Makine Öğrenilebilir Sorunları Tespit Etmeyi Göstermek

İş hayatında unvanımız veya iş tanımımız ne olursa olsun elle yapılan görevlerle çevrelenmiş durumdayız. Genel olarak bu işlemler otomasyona bağlanamıyor ve insan etkileşimi gerektiriyor. Ancak sadece bir insanın yapabileceği görünen bazı işlemler için DS bir ML modeli oluşturabiliyor ve işlem bu şekilde gayet iyi gerçekleştirilebiliyor.

Önceliklerden dolayı DS ekibi şirketin çekirdek ürünleri etrafında yer alan projelere odaklanıyor. Harici projelere baktığımız zaman hangi proje üzerinde ML uygulanabileceğine dair karar vermek için zaman kaybetmek yerine çekirdek ürünlere odaklanıyoruz.

Sunduğumuz çözüm, diğer departmanlardan “Veri Bilimi Elçileri” belirlemekti. Seçilen elçiler, ML ile çözümlenebilecek sorunları tespit edebilecek derecede bilgiye sahipler. Sorunun tespit edilmesinin ardından ya kendileri model oluşturuyorlar, ya bizim denetimimiz altında bir model geliştiriyorlar veya en basit yöntemle sorunu bize bildiriyorlar.

Python ve Sklearn Kullanarak ML Egzersizi Yapmak

Yüksek seviyeli bilgi aktarımı ile uğraşmak yerine doğrudan denemenin en iyi öğrenme yöntemi olduğunu bildiğimiz için insanların ML egzersizi yapmasına karar verdik. Bu sayede insanlar sadece ML ve ML bağlantılı hususları anlamakla kalmıyor, bu sorunları kendileri çözümlemek için düşünceler üretiyor. Ayrıca, DS alanı hakkında elde ettikleri tecrübe ile daha da öğrenme hevesi elde ediyorlar.

Nasıl Çalışıldı?

Atölye dört güne ayrıldı. Herkesin işi esnasında erişim sağlayabilmesi için her gün üç saat ayrıldı. Aynı zamanda her atölye gününde farklı bir konu olmasını sağladık:

1- Atölye öncesi: :Python, Jupyter Notebook ve temel matematik, ML ve görselleşmiş Python paketlerinin hazırlanması.
2- Birinci gün: ML ve Python paketlerinin gözden geçirilmesi (Numpy, Pandas, Seaborn).
3- İkinci gün: Rehberlik altında öğretim – Lineer & Lojistik Regresyon, Karar Ağaçları ve Rastgele Orman.
4- Üçüncü gün: Rehberlik olmadan eğitim – DBScan ve K-Means
5- Dördündü gün: EDL (keşfedici veri çözümlemesi), içerik keşfi, değerlendirme metrikleri ve final projesi.

En etkili iletim yöntemi için aşağıdaki üçlemeyi kullandık:

1- Sunumlar,
2- Kod örnekleri,
3- Egzersizler.

Sunumlar

Çevrimiçi sunum aracı kullanarak hazırladığımız sayfaların paylaşılmasını ve editlenmesini sağladık. Slaytları fikirleri, konseptleri ve algoritmaları herhangi bir kod kullanmadan açıklamak için kullandık.

Kod Örnekleri

Gerçek kod örnekleri göstermek için Jupyter Notebook kullanıyoruz. Her katılımcı notebook’ları Git kaynağından kopyalayarak kodu kendileri çalıştırabilir. Bu şekilde katılımcılar farklı komutları anlayabildikleri gibi eğitim sonrasında çalışmalarına devam edebildiler. Aynı zamanda kullanılan araçlar ve oluşturulan ortam katılımcıların DS alanında daha fazla kendilerini geliştirmeleri için bir teşvik sağladı.

İnternetin farklı veri grupları ile dolu olması, katılımcılara farklı konseptler, yöntemler ve algoritmalar göstermemizi sağladı.

Egzersizler

EEgzersizler için de Jupyter Notebook kullanıldı. Böylece katılımcılar için veri yüklenmesi ve egzersize odaklanmaları gibi temel komutlar ile eğitime başlandı. Kod örneklerinin egzersizdeki gibi aynı notebook’ta olması, her egzersizte bağlantılı komutların kopyala-yapıştır yapılmasını son derece kolaylaştırdı.

Sahne arkası – son notlar

İyi bir içeriğe sahip atölye oluşturmak faydalı olsa da, harika olması için iyi bir içerikten fazlasına ihtiyacınız var.

Temel olarak, her gün geri bildirimler alarak atölyenin bir önceki günü hakkında katılımcıların görüşlerini değerlendirdik. Geri bildirimler için aşağıdaki maddelerin 1 ile 5 arasında değerlendirilmesini istedik:

Lojistik: Takvim, yiyecek-içecekler ve aralar
İçerik kalitesi: Egzersizlerin ve slaytların ne kadar iyi olduğu.
İçerik bağlantısı: İçeriğin katılımcıların günlük işleri ile ne kadar bağlantılı olduğu.
Genel değerlendirme

Ankette sorduğumuz bazı sorular şu şekilde:

– Aşağıdaki hususlar sizin için ne kadar tatmin edici?
– İlerletilmiş DS kursuna devam etmek ister misiniz?
– Ortam ve kurulumlar ne kadar kolaydı?

Tüm bunların üzerine, atölyenin kusursuz ilerlemesi için bazı ek çabalar gösterdik:

– İletişim: Herkesi bir iletişim kanalına veya e-posta listsine ekledik.
– Yiyecek/içecek: Atölyenin oldukça uzun ve yoğun olmasından yola çıkarak, herkesin odağını koruyabilmesi adına büyük tepsiler dolusu sandviç, meyve, sebze ve şekerler sunduk.
– SWAG: Son olarak, her katılımcıya bir nevi sahiplenme hissi vermek için atölye için hazırlanan tişörtlerden verdik.

Exit mobile version