Video Özeti: Verileri Görselleştirme ve Özetleme
Bu video, veri setlerini düzenlemek, özetlemek ve analiz etmek için kullanılan temel istatistiksel kavramları detaylandırmaktadır.
Ana Konular:
Tüm video notları aşağıdadır:
Bu bölümde, elimizdeki sayısal verileri daha anlaşılır hale getirmek için kullanılan temel istatistiksel yöntemler ve görselleştirme teknikleri ele alınmaktadır. Özellikle kök-yaprak gösterimi, aritmetik ortalama, açıklık, ortanca ve tepe değer kavramları detaylı bir şekilde açıklanmıştır.
Kök-yaprak gösterimi, verilerin düzenli bir şekilde sıralanarak gösterilmesini sağlayan bir görselleştirme yöntemidir. Özellikle çok sayıda verinin olduğu durumlarda veri setini daha okunabilir hale getirir.
Nasıl Yapılır?
1. Kök Belirleme: Sayının birler basamağı dışındaki basamakları (genellikle onlar, yüzler basamağı) kökleri oluşturur.
2. Yaprak Belirleme: Sayının birler basamağı ise yaprakları oluşturur.
3. Çizgi Çekme: Kökler ile yaprakları ayıran dikey bir çizgi çekilir.
4. Sıralama: Tüm veriler küçükten büyüğe doğru sıralanır. Yapraklar da kendi içinde sıralı olmalıdır.
Örnek Veri Seti: 9, 11, 17, 20, 23, 23, 26
Kök-Yaprak Gösterimi:
0 | 9
1 | 1 7
2 | 0 3 3 6
Tek basamaklı sayıların kökünü atlamak. Örneğin, 9 sayısının kökü 0'dır (09 gibi düşünülür).
Doğrusu: 0 | 9 (9 için)
Yanlışı: Sadece 9 yazıp kök kısmını boş bırakmak veya yanlış bir köke eklemek.
Kök-yaprak gösteriminde yer alan yaprakları sayarak toplam veri sayısını kolayca bulabilirsiniz.
Aritmetik ortalama, bir veri grubundaki tüm verilerin toplamının, veri sayısına bölünmesiyle bulunur. Genellikle "ortalama" olarak adlandırılır.
Formül:
Aritmetik Ortalama = (Tüm Verilerin Toplamı) / (Veri Sayısı)
Örnek Veri Seti: 3, 4, 8, 9
Bir veri grubuna ortalamadan daha küçük bir değer eklenirse ortalama düşer. Ortalamadan daha büyük bir değer eklenirse ortalama artar. Ortalamaya eşit bir değer eklenirse ortalama değişmez.
Veri grubuna yeni bir sayı eklendiğinde veya çıkarıldığında sadece toplamı değiştirmek, veri sayısını değiştirmeyi unutmak.
Doğrusu: Yeni kişi eklenince toplam yeni kişilerin sayısı kadar artar.
Yanlışı: Sadece yaş toplamını değiştirmek.
Açıklık, bir veri grubundaki en büyük değer ile en küçük değer arasındaki farktır. Veri setinin ne kadar geniş bir aralığa yayıldığını gösterir.
Formül:
Açıklık = En Büyük Değer - En Küçük Değer
Örnek Veri Seti: 5, 12, 19, 23
Açıklığın değişmemesi için yeni eklenen veya çıkarılan verinin, en küçük ve en büyük değerleri değiştirmemesi gerekir. Yani, yeni eklenen veri mevcut en küçük ve en büyüğün arasında olmalıdır.
Ortanca (medyan), bir veri grubu küçükten büyüğe doğru sıralandığında, tam ortada yer alan değerdir.
Nasıl Bulunur?
1. Sıralama: Veri grubu küçükten büyüğe doğru sıralanır.
2. Tek Sayıda Veri: Veri sayısı tek ise, tam ortadaki değer ortancadır. (n+1)/2. sıradaki değer.
3. Çift Sayıda Veri: Veri sayısı çift ise, ortadaki iki değerin aritmetik ortalaması (toplamının yarısı) ortancadır. n/2. ve (n/2)+1. sıradaki değerlerin ortalaması.
Örnek 1 (Tek): 11, 12, 13, 15, 19, 23, 25
Örnek 2 (Çift): 11, 12, 13, 15, 19, 23
Verileri sıralamadan ortanca değeri bulmaya çalışmak. Bu, yanlış sonuca yol açar.
Doğrusu: Verileri her zaman küçükten büyüğe sıralamak.
Yanlışı: Sırasız bir veri grubunda ortadaki sayıyı medyan olarak kabul etmek.
Tepe değer (mod), bir veri grubunda en çok tekrar eden değerdir.
Nasıl Bulunur?
1. Veri grubundaki her bir değerin kaç kez tekrar ettiğine bakılır.
2. En fazla tekrar eden değer veya değerler tepe değeridir.
Örnek 1 (Tek Tepe Değer): 10, 12, 15, 19, 19, 19, 23
Örnek 2 (İki Tepe Değer): 2, 8, 8, 9, 10, 11, 11, 15
Örnek 3 (Tepe Değer Yok): 65, 69, 71, 75, 80
Bir veri grubunda birden fazla tepe değer olabilir (iki tane genellikle kabul edilir). Ancak, her değerin eşit sayıda tekrar etmesi durumunda tepe değer yoktur.