Python’da Veri Bilimi

Python acemisinden Python’da bir Kaggler’a yolculuk

Yani, bir veri bilimcisi olmak istiyorsunuz ya da zaten bir bilim insanısınız ve araç deponuzu genişletmek istiyorsunuz. Doğru yere geldiniz. Bu yazının amacı, veri bilimi için Python’a yeni başlayan kişilere bir öğrenme yolu sağlamaktır. Bu yol, veri bilimi için Python kullanmayı öğrenmeniz gereken adımlara kapsamlı bir genel bakış sağlar. Halihazırda biraz geçmişe sahipseniz veya tüm bileşenlere ihtiyacınız yoksa, kendi yollarınızı uyarlamaktan çekinmeyin ve bu yolda nasıl değişiklik yaptığınızı bize bildirin.

Ayrıca bu öğrenme yolunun mini sürümünü de inceleyebilirsiniz =>  Bilgi Grafiği: Python’da Veri Bilimi öğrenmek için Hızlı Kılavuz .

Başlangıç: Isınma

Yolculuğunuza başlamadan önce cevaplamanız gereken ilk soru şudur:

Python’u neden kullanmalı? veya Python nasıl faydalı olur?

Python’un ne kadar yararlı olabileceğine dair bir fikir edinmek için Ukrayna’daki PyCon 2014’te DataRobot’un Kurucusu Jeremy’nin yaptığı bu konuşmanın ilk 30 dakikasını izleyin.

Adım 1: Makinenizi kurun

Artık kararınızı verdiniz, makinenizi kurmanın zamanı geldi. Devam etmenin en kolay yolu, Anaconda’yı Continuum.io’dan indirmektir. Şimdiye kadar ihtiyaç duyacağınız şeylerin çoğuyla birlikte gelir. Bu yolu izlemenin en büyük dezavantajı, temeldeki kitaplıklar için bir güncelleme olsa bile Continuum’un paketlerini güncellemesini beklemeniz gerekmesidir. Yeni başlayan biriyseniz, bunun pek önemi yok.

Yüklemede herhangi bir zorlukla karşılaşırsanız, burada çeşitli işletim sistemleri için daha ayrıntılı talimatlar bulabilirsiniz.

Adım 2: Python dilinin temellerini öğrenin

Dilin, kitaplıkların ve veri yapısının temellerini anlayarak başlamalısınız. Veri Bilimi için Python öğrenme hakkındaki kurslar, yolculuğunuza başlamak için en iyi yerlerden biridir. Bu kurslar, veri bilimi için Python’a nasıl başlayacağınıza odaklanır ve sonunda dilin temel kavramları konusunda rahat olmanız gerekir.

Ödev: Analytics Vidhya’nın sunduğu harika ücretsiz Python kursuna katılın

Alternatif kaynaklar: Etkileşimli kodlama öğrenme tarzınız değilse, Python için Google Sınıfına da bakabilirsiniz. 2 günlük bir ders serisidir ve ayrıca daha sonra tartışılacak olan bazı bölümleri de kapsar.

Adım 3: Python’da Normal İfadeleri Öğrenin

Özellikle metin verileri üzerinde çalışıyorsanız, bunları veri temizliği için çok kullanmanız gerekecektir. Normal ifadeleri öğrenmenin en iyi yolu, Google sınıfını gözden geçirmek ve bu bilgi sayfasını el altında tutmaktır.

Ödev: Bebek isimleri egzersizi yapın

Hâlâ daha fazla pratiğe ihtiyacınız varsa, metin temizleme için bu öğreticiyi okuyun. Veri tartışmasında yer alan çeşitli adımlarda size meydan okuyacaktır.

Adım 4: Python’da Bilimsel Kitaplıkları Öğrenin – NumPy, SciPy, Matplotlib ve Pandalar

Burası eğlencenin başladığı yer! İşte çeşitli kütüphanelere kısa bir giriş. Bazı yaygın işlemleri uygulamaya başlayalım.

  • NumPy öğreticisini, özellikle NumPy dizilerini iyice uygulayın. Bu, gelecek şeyler için iyi bir temel oluşturacaktır.
  • Ardından, SciPy eğitimlerine bakın. Giriş ve temel bilgileri gözden geçirin ve kalanları ihtiyaçlarınıza göre yapın.
  • Bir sonraki Matplotlib öğreticilerini tahmin ettiyseniz, yanılıyorsunuz! Buradaki ihtiyacımız için çok kapsamlılar. Bunun yerine bu ipython not defterine Satır 68’e kadar bakın (yani animasyonlara kadar)
  • Son olarak, Pandalara bakalım. Pandalar, Python için DataFrame işlevselliği (R gibi) sağlar. Burası aynı zamanda pratik yapmak için iyi zaman geçirmeniz gereken yerdir. Pandalar, tüm orta ölçekli veri analizleri için en etkili araç olacaktır. Pandalara 10 dakikalık kısa bir girişle başlayın . Ardından pandalar hakkında daha ayrıntılı bir eğitime geçin .

Ayrıca Pandalar ile Keşifsel Veri Analizi ve Pandalar ile Veri Dağılımı’na da bakabilirsiniz.

Ek kaynaklar:

  • Pandalar ve NumPy hakkında bir kitaba ihtiyacınız varsa, “ Veri Analizi için Python , Wes McKinney”
  • Panda belgelerinin bir parçası olarak pek çok öğretici var. onlara buradan bakabilirsin

Ödev: Harvard’dan CS109 dersinden bu ödevi çözün .

Adım 5: Etkili Veri Görselleştirme

Bu ders formunu CS109 gözden geçirin. İlk 2 dakikayı görmezden gelebilirsiniz, ancak bundan sonrası harika! Bu ödevle bu dersi takip edin .

6. Adım: Scikit-learn ve Makine Öğrenimi öğrenin

Şimdi, tüm bu sürecin etine geliyoruz. Scikit-learn, makine öğrenimi için python’daki en kullanışlı kütüphanedir. İşte kütüphaneye kısa bir genel bakışHarvard’dan CS109 kursundan 10. dersten 18. derse gidin. Makine öğrenimine, regresyonlar gibi Denetimli öğrenme algoritmalarına, karar ağaçlarına, topluluk modellemeye ve kümeleme gibi denetimsiz öğrenme algoritmalarına genel bir bakış sunacaksınız. Bu derslerden verilen ödevlerle bireysel dersleri takip edin .

Bir veri bilimcisi rolü bulma arayışınızda kendinize büyük bir destek vermek için ‘ Veri Bilimine Giriş ‘ kursuna da göz atmalısınız .

Ek kaynaklar:

Adım 7: Alıştırma, Alıştırma ve Alıştırma

Tebrikler, başardınız!

Artık teknik becerilerde ihtiyacınız olan her şeye sahipsiniz. Bu bir pratik meselesidir ve pratik yapmak için DataHack platformunda diğer Veri Bilimcileri ile rekabet etmekten daha iyi bir yer olabilir . Gidin, şu anda DataHack ve Kaggle’da yürütülen canlı yarışmalardan birine katılın ve öğrendiklerinizi bir deneyin!

Adım 8: Derin Öğrenme

Artık makine öğrenme tekniklerinin çoğunu öğrendiğinize göre, Derin Öğrenmeye bir şans vermenin zamanı geldi. Derin Öğrenmenin ne olduğunu zaten biliyor olma ihtimaliniz yüksek, ancak yine de kısa bir girişe ihtiyacınız varsa, işte burada.

Ben derin öğrenmede yeniyim, bu yüzden lütfen bu önerileri bir tutam tuzla kabul edin. En kapsamlı kaynak deeplearning.net’tir. Burada her şeyi bulacaksınız – dersler, veri kümeleri, zorluklar, öğreticiler. Ayrıca, Sinir Ağlarının temellerini anlamak için Geoff Hinton’dan kursu deneyebilirsiniz.

Python’u Kullanmaya Başlayın: Sıfırdan Python ile Veri Bilimini Öğrenmek İçin Eksiksiz Bir Eğitim

Not Büyük Veri kitaplıklarını kullanmanız gerekiyorsa, Pydoop ve PyMongo’yu deneyin. Büyük Veri öğrenme yolu başlı başına bir konu olduğu için buraya dahil edilmediler.

Bir cevap yazın

E-posta hesabınız yayımlanmayacak.

This site uses Akismet to reduce spam. Learn how your comment data is processed.