Bu ders, Veri Analitiği programında yüksek lisans yapan öğrencilere işletmeler için veri analitiğine giriş dersidir. Kapsanan konular: Veri ve Veri Tipleri, Programlama yazılımı olarak R yazılımının gözden geçirilmesi, Açıklayıcı Veri Analizi (EDA), Regresyon Modelleri (Linear, Logistic, Probit), Boyut indirgeme yaklaşımları, Ağaçlar ve Ormanlar (Opsiyonel), Çapraz Doğrulama, Açıklayıcı Seçimi, Benzerlik ve Kümeleme yöntemleri.
Bu dersin sonunda öğrenciler şunları yapabileceklerdir:
Değişkenler arasındaki ilişkileri analiz etmek için doğrusal regresyon uygulamak.
Sınıflandırma problemleri için üretici modelleri uygulamak.
Model performansını değerlendirmek için çapraz doğrulama ve yeniden örnekleme yöntemlerini kullanmak.
Boyut indirgeme tekniklerini uygulamak.
Özellik Seçimini genel hatlarıyla anlamak.
Denetimsiz verilerde kümeleri keşfetmek ve yorumlamak.
Ders Programı içerisinde R yazılımı sık sık hatırlanacak ve ilgili komutlar gözden geçirilecektir
Ders Programı (Bu liste ile sınırlı değildir)
Hafta | Konu | Bölümler | Temel Faaliyetler/Ödevler |
---|---|---|---|
1 | Giriş, Temel Adımlar | 1, 2 | Genel Bakış, R Kurulumu, Temel Komutlar |
2 | İstatistiksel Öğrenmeye Giriş, Temel Adımlar | 1, 2 | Genel Bakış, R Kurulumu, Temel Komutlar |
3 | Basit ve Çoklu Doğrusal Regresyon: Özet | 3 | Lab: Doğrusal Regresyon (R) |
4 | Basit ve Çoklu Doğrusal Regresyon: Özet | 3 | Lab: Doğrusal Regresyon (R) |
5 | Doğrusal Regresyon Değerlendirmeleri | 3 | Lab: Doğrusal Regresyon Değerlendirmeleri (R) |
6 | Sınıflandırma Modelleri: Özet | 4 | Lab: Lojistik Regresyon, KNN (R) |
7 | Sınıflandırma Modelleri: Özet | 4 | Lab: Lojistik Regresyon, KNN (R) |
8 | Çapraz Doğrulama | 5 | Lab: Çapraz Doğrulama Yöntemleri (R) |
9 | Ara Sınav Öncesi | Tekrar | |
9 | Ara Sınav | ||
10 | Destek Vektör Makineleri | 9 | Lab: Sınıflandırma için SVM’ler |
11 | Destek Vektör Makineleri | 9 | Lab: Sınıflandırma için SVM’ler |
11 | Benzerlik Ölçütleri | 12 | Lab: Benzerlik Ölçütleri |
12 | Kümeleme Yöntemleri | 12 | K-Ortalamalar, Hiyerarşik Kümeleme (R) |
13 | Sunumlar | ||
14 | Genel Tekrar: Ne Öğrendik? |
Kaynak Kitap: Gareth James, Daniela Witten, Trevor Hastie ve Robert Tibshirani. An Introduction to Statistical Learning with Applications in R https://www.statlearning.com/ (İkinci Baskı).
Kaynak Kitap: Gábor Békés, Gábor Kézdi. Data
Analysis for Business, Economics, and Policy https://gabors-data-analysis.com/.
Yazılım: R https://cran.r-project.org/, RStudio https://posit.co/products/open-source/rstudio/ (indirme ve kurulum ders sırasında tartışılacaktır) ve ilgili R paketleri.
Devamlılık: Düzenli devam beklenmektedir ve ödüllendirilecektir.
Geç Teslimler: Önceden onay alınmadıkça geç teslim edilen ödevler ceza alacaktır.
Akademik Dürüstlük:
Akademik dürüstlük, üniversitenin akademik misyonunun temelidir. Akademik sahtekarlık eylemleri, intihal, kopya çekme, veri uydurma veya izinsiz iş birliği gibi, öğrenme sürecini kötü etkiler ve üniversitenin öğretim politikalarını ihlal eder.
Özel kurallar:
İntihal: Başkalarının çalışmasını, fikirlerini veya sözlerini uygun atıf yapmadan kullanmak kesinlikle hoş görülmeyecektir. Bu, herhangi bir kaynaktan kopyalayıp yapıştırmayı, atıf yapmadan yeniden yazmayı veya başka birinin çalışmasını kendi çalışması olarak sunmayı içerir.
Kopya Çekme: Sınavlar veya ödevler sırasında
izinsiz materyal, cihaz veya bilgi kullanımı, yanıtlara erişim veya
paylaşım yasaktır.
Veri Uydurma: Veri, alıntı veya araştırma sonuçlarını uydurmak veya tahrif etmek akademik dürüstlük ihlalidir.
İş Birliği: Grup ödevlerinde iş birliği yapılabilir, ancak bireysel çalışmalarda yanıtların paylaşılması veya ortak çalışma yapılması açıkça izin verilmedikçe kabul edilemez.
Sonuçlar: Akademik dürüstlük ihlalleri, üniversitenin akademik politikalarına uygun olarak ele alınacak olup, ödev başarısızlığı, ders başarısızlığı veya disiplin cezası gibi yaptırımlara yol açabilir.