Ders Adı Kodu Yarıyıl T+U Saat Kredi AKTS
Büyük Veri SWE 307 5 3 + 0 3 5
Ön Koşul Dersleri
Önerilen Seçmeli Dersler
Dersin Dili İngilizce
Dersin Seviyesi Lisans
Dersin Türü Zorunlu
Dersin Koordinatörü Prof.Dr. AHMET ÖZMEN
Dersi Verenler Prof.Dr. AHMET ÖZMEN,
Dersin Yardımcıları
Dersin Kategorisi Diğer
Dersin Amacı

Derste büyük veri kavramı, veri görselleştirme ve analiz yöntemlerinin tanıtılması hedeflenmiştir. Büyük veriyi işlerken yaygın olarak kullanılan programlama dilleri ve yazılım araçları detayları ile tanıtılmaktadır. Bu yazılım araçlarının kurulumu ve veri işleme hatlarının oluşturulması örnek uygulamalar ile gösterilir.  

Dersin İçeriği

Veri biliminde ve büyük data konusunda temel kavramlar. Büyük verinin analizi ve görselleştirme. Büyük verinin toplanması, saklanması ve işlenmesi için yazılım mimarileri, araçlar ve uygulamalar.

Kalkınma Amaçları
# Ders Öğrenme Çıktıları Öğretim Yöntemleri Ölçme Yöntemleri
1 Büyük veri analizi ve temel kavramların öğrenilmesi Anlatım, Soru-Cevap, Tartışma,
2 Büyük veri ve dağıtık paralel programlama, MapReduce hesaplama modeli Tartışma, Soru-Cevap, Anlatım,
3 Büyük veri modülleri ile web tabanlı bilgi sistemlerinin entegrasyonu Grupla Çalışma, Soru-Cevap, Anlatım,
4 Kafka-Spark-Cassandra ile veri hattı oluşturma Gözlem, Problem Çözme, Tartışma, Soru-Cevap, Anlatım,
5 Büyük veri problemleri için analiz, sistem tasarlama ve çözüm üretme Gözlem, Deney ve Laboratuvar, Problem Çözme, Tartışma,
Hafta Ders Konuları Ön Hazırlık
1 Büyük veriye giriş, temel bilgiler, data visualization
2 R ile veri analizi ve modelleme
3 Makine öğrenmesi: doğrusal regresyon, kümeleme ve sınıflandırma
4 Hadoop mimari özellikleri, HDFS dağıtık dosyalama sistemi, MapReduce programlama modeli
5 Apache-Yarn resource manager
6 Apache-Spark mimari özellikleri ve Spark ile dağıtık paralel hesaplama
7 Apache-Cassandra ile NoSQL uygulamaları, CAP ile ACID karşılaştırma
8 Spark-Cassandra ile web tabanlı uygulama geliştirme
9 Apache Kafka mimarisi, kurulumu ve uygulama geliştirme
10 Data pipeline uygulaması: Kafka-Spark-Cassandra
11 Apache-HBase mimari özellikleri ve NoSQL uygulamlar, Cassandra ile kıyaslama
12 Data warehousing ve ETL, Apache Hive
13 Apache NiFi, APache Sqoop data warehousing
14 Apache Flume ile sosyal medya uygulamalarından data çekme uygulamaları
Kaynaklar
Ders Notu

Mining of Massive Datasets, Jure Leskovec, Anand Rajaraman, Jeff Ullman, Cambridge University Press, 3rd Edition. Link: http://infolab.stanford.edu/~ullman/mmds/book0n.pdf

Ders Kaynakları

Sakti Mishra, Simplify Big Data Analytics with Amazon EMR, Packt Publising, March 2022.

Nasir Raheem, Big Data: A Tutorial-Based Approach, CRC Press, 2019, ISBN0429592450, 9780429592454
Soraya Sedkaoui, Data Analytics and Big Data, John Wiley & Sons, 2018, ISBN1119528062, 9781119528067
Kuan-Ching Li, Hai Jiang, Laurence T. Yang, Alfredo Cuzzocrea, Big Data: Algorithms, Analytics, and Applications (Chapman & Hall/CRC Big Data Series), PublisherCRC Press, 2015, ISBN1482240564, 9781482240566

Sıra Program Çıktıları Katkı Düzeyi
1 2 3 4 5
1 Mühendislik Bilgisi: Matematik, fen bilimleri, temel mühendislik, bilgisayarla hesaplama ve ilgili mühendislik disiplinine özgü konularda bilgi; bu bilgileri, karmaşık mühendislik problemlerinin çözümünde kullanabilme becerisi. X
2 Problem Analizi: Karmaşık mühendislik problemlerini, temel bilim, matematik ve mühendislik bilgilerini kullanarak ve ele alınan problemle ilgili BM Sürdürülebilir Kalkınma Amaçlarını gözeterek tanımlama, formüle etme ve analiz becerisi. X
3 Mühendislik Tasarımı: Karmaşık mühendislik problemlerine yaratıcı çözümler tasarlama becerisi; karmaşık sistemleri, süreçleri, cihazları veya ürünleri gerçekçi kısıtları ve koşulları gözeterek, mevcut ve gelecekteki gereksinimleri karşılayacak biçimde tasarlama becerisi. X
4 Teknik ve Araçların Kullanımı: Karmaşık mühendislik problemlerinin analizi ve çözümüne yönelik, tahmin ve modelleme de dahil olmak üzere, uygun teknikleri, kaynakları ve modern mühendislik ve bilişim araçlarını, sınırlamalarının da farkında olarak seçme ve kullanma becerisi. X
5 Araştırma ve İnceleme: Karmaşık mühendislik problemlerinin incelenmesi için literatür araştırması, deney tasarlama, deney yapma, veri toplama, sonuçları analiz etme ve yorumlama dahil, araştırma yöntemlerini kullanma becerisi. X
6 Mühendislik Uygulamalarının Küresel Etkisi: Mühendislik uygulamalarının BM Sürdürülebilir Kalkınma Amaçları* kapsamında, topluma, sağlık ve güvenliğe, ekonomiye, sürdürülebilirlik ve çevreye etkileri hakkında bilgi; mühendislik çözümlerinin hukuksal sonuçları konusunda farkındalık.
7 Mühendislik Etiği: Mühendislik meslek ilkelerine* uygun davranma, etik sorumluluk hakkında bilgi; hiçbir konuda ayrımcılık yapmadan, tarafsız davranma ve çeşitliliği kapsayıcı olma konularında farkındalık.
8 Bireysel ve Takım Çalışması: Bireysel olarak ve disiplin içi ve çok disiplinli takımlarda (yüz yüze, uzaktan veya karma) takım üyesi veya lideri olarak etkin biçimde çalışabilme becerisi.
9 Sözlü ve Yazılı İletişim: Hedef kitlenin çeşitli farklılıklarını (eğitim, dil, meslek gibi) dikkate alarak, teknik konularda sözlü, yazılı etkin iletişim kurma becerisi.
10 Proje Yönetimi: Proje yönetimi ve ekonomik yapılabilirlik analizi gibi iş hayatındaki uygulamalar hakkında bilgi; girişimcilik ve yenilikçilik hakkında farkındalık.
11 Yaşam Boyu Öğrenme: Bağımsız ve sürekli öğrenebilme, yeni ve gelişmekte olan teknolojilere uyum sağlayabilme ve teknolojik değişimlerle ilgili sorgulayıcı düşünebilmeyi kapsayan yaşam boyu öğrenme becerisi. X
# Ders Öğrenme Çıktılarının Program Çıktılarına Katkısı PÇ 1 PÇ 2 PÇ 3 PÇ 4 PÇ 5 PÇ 6 PÇ 7 PÇ 8 PÇ 9 PÇ 10 PÇ 11
1 Büyük veri analizi ve temel kavramların öğrenilmesi 5
2 Büyük veri ve dağıtık paralel programlama, MapReduce hesaplama modeli 5
3 Büyük veri modülleri ile web tabanlı bilgi sistemlerinin entegrasyonu 5
4 Kafka-Spark-Cassandra ile veri hattı oluşturma 5
5 Büyük veri problemleri için analiz, sistem tasarlama ve çözüm üretme 5
Değerlendirme Sistemi
Yarıyıl Çalışmaları Katkı Oranı
1. Ara Sınav 40
1. Kısa Sınav 10
2. Kısa Sınav 10
1. Performans Görevi (Uygulama) 40
Toplam 100
1. Yıl İçinin Başarıya 50
1. Final 50
Toplam 100
AKTS - İş Yükü Etkinlik Sayı Süre (Saat) Toplam İş Yükü (Saat)
Ders Süresi (Sınav haftası dahildir: 16x toplam ders saati) 14 3 42
Sınıf Dışı Ders Çalışma Süresi(Ön çalışma, pekiştirme) 14 1 14
Ara Sınav 1 15 15
Kısa Sınav 2 4 8
Performans Görevi (Uygulama) 1 25 25
Final 1 20 20
Toplam İş Yükü 124
Toplam İş Yükü / 25 (Saat) 4,96
dersAKTSKredisi 5