İstatistik Nedir?


 İstatistik Nedir?

İstatistik, ilgilendiğimiz konu ile alakalı verilerin toplanması, temizlenmesi, grafiklerle özetlenmesi, yorumlanması ve güven aralığı oluşturmak ve kitleye genelleyerek yorumlamaktır.

metin, beyaz tahta içeren bir resim

Açıklama otomatik olarak oluşturuldu

İstatistiği öğrenmek sadece bir firma ya da bir dükkan geleceği için değil ayı zamanda insan geleceği için de önemlidir. İstatistik, aslında herkesin bakış açısını değiştirecek, yön verecek ve hayatında yer buldurabileceği bir bilim dalıdır.

Biz burada istatistikteki birçok alana ve analize yer vereceğiz. Analizlerin nasıl yapılacağına, nasıl doğru yorum yapılacağına ve veri setini nasıl görselleştireceğimiz hakkında çalışmalara yer vereceğiz.

İstatistikçi aslında bir veri bilimcidir de. Veri bilimi nasıl programlama bilgisi gerektiriyorsa o kadar da istatistik bilgisi gerektirir. İstatistik bilmeden analizlerin çıktılarının ne anlama geldiğini nasıl yorumlanması gerektiğini veya kullanılan bu programların arka planda nasıl işlediğini ancak istatistik size söyleyebilir. Bu yüzden istatistik olmasan bir veri bilimci düşünülemez.

Veri analizleri yaparken kullanacağımız programlardan bir tanesi R programı ve RStudio ile çalışacağız. Python konusunda henüz ileri seviye olmadığım için daha ileride onunla da çalışmalar yapacağım.

Örneklem ve Kitle Nedir?

Kitle, elimizdeki veri setinin tümüdür. Örneğin: Türkiye’deki kadınların boyları bizim kitlemizdir.

Örneklem, kitleden rassal bir şekilde elde edilmiş küçük uzaydır. Örneğin: Türkiyedeki kadınların boyları içinden rassal şekilde seçilmiş olan küçük örneğidir.

Kitle, bir araştırmada elde edilen verilerin analizinden elde edilecek sonuçların genellemesinin ve yorumlamasının yapılacağı gruptur. Araştırmada amacımız kitle hakkında bilgi elde etmektir.

Örneklem ise kitlenin özelliklerini belirlemek, tahmin etmek için onu temsil edecek gruptur. Genelleme yapmak için örneklem üzerinden analiz yapılarak kitle adına yorumlanır. Örneklemden elde edilerek hesaplanan değerlere ise istatistik denir.

Neden Kitleyi kullanmıyoruz? Çok kolay bir cevabı var. Yukarıda verilen örnekten yola çıkarak açıklanabilir. Türkiye’deki tüm kadınlara erişilemez. Bunun için örnekleme yöntemlerini kullanarak örneklem elde edilir. Bunun sonucunda makul ve üzerinden hesaplama yapması kolay bir veri elde etmiş olacağız. Ardından bunu kitle için belirli hata paylarıyla genelleyip kitle hakkında yorumlama yapılacaktır.

İstatistikte Önemli Değerler


Bunlardan bi tanesi, ölçek türleridir. Ölçek türleri verilerin değerlendirilmesi analiz edilmesi için önemlidir. Bu ne demektir? Bu, en basitinden verinin kategorik ya da sürekli olmasına göre yapılacak analizlerin değişecek olmasıdır.

  1. Sınıflayıcı ölçek: Kategoriler. Kendi içlerinde homojen ve kendi aralarında heterojen olmalıdır. Örneğin: Kadın- Erkek

2. Sıralayıcı ölçek: Adından da anlaşıldığı gibi aralarında sıralanma ilişkisi bulunmalı. Bir sonrakinin öncekine göre üstünlüğü olmalıdır. Aynı zamanda sınıflandırılabilirler. Örneğin: Anket analizlerinde bulunan likert ölçekleri. 1-Hiç memnun değil 2-Memnun değil 3-Kısmen memnun 4-Memnun 5-Çok memnun.

3. Aralıklı ölçek: Keyfi bir başlangıç noktası vardır. Veriler sayılarla ifade edilir. Ancak aralarında oransal bir ilişki kurulmaz. Örneğin: Zeka testi (0(sıfır) olması herhangi bir zekası olmadığı anlamına gelmez.), Havanın derecesi (0(sıfır) olması havanın yokluğunu ifade etmez.)

4. Oransal ölçek: 0(sıfır) yokluğu ifade eder. Örneğin: Maaş, boy, kilo, …

olarak 4 e ayrılır. Hatta en dar ölçekten en geniş ölçeğe göre sıralanır.

B.

Bir diğeri merkezi eğilim ölçüleridir. Bunlar konum ölçüsü olarak da adlandırılır. Ortalama, medyan ve tepe değerdir.

  1. Ortalama: Hesaplanabilmesi için veriler en az aralıklı ölçekte olmalıdır. Aritmetik ortalamada veriler toplanarak işleme alınan veri sayısına bölünür. Matematikte farklı bir çok ortalama mevcuttur aynı şekilde istatistik için de öyle.

  2. Medyan: Veri setindeki tüm değerlerin orta noktasıdır. Veri seti küçükten büyüğe sıralanır. (n+1)*0.5 ile konumu hesaplanır. 0.5 burada veri setinin tam yarısını temsil eder. Veri setindeki gözlem sayısı tek ise tam ortadaki değerdir fakat çift sayı ise buçuklu bir konum degeri bulunacaktır bu deger için ondan hemen önceki ve hemen sonraki degerlerin ortalaması alınır.

  3. Tepe değer: Veri setindeki en çok tekrar eden degerdir. (Lisans hayatımda en çok sürekli verilerde nasıl bulunduğuyla ilgili problem yaşardım. Fonksiyonun türevini alıyoruz. Türev bize maksimum degeri verecektir. Teşekkürler Türev. Teşekkürler Matematik.)

Ayrıca dağılım hakkında bize spoiler vermekteler.

  • ortalama = medyan = tepe değer ise dağılım simetriktir.

  • Tepe değer < Medyan < Ortalama ise sağa çarpık dağılımdır.

  • Ortalama < Medyan < Tepe değer ise sağa çarpık dağılımdır.

C.

Bir diğeri değişim ölçüleridir. Açıklık(range), çeyrekler açıklığı (interquartile range IQR), varyans, standart sapma ve değişim katsayısı (coefficient of variation)’dır.

  1. Range = En büyük değer-En küçük değer olarak bulunur. Dağılımın şekli onun için önemli değildir.

  2. IQR = 3. çeyreklik- 1. çeyreklik olarak bulunur. (3. çeyreklik = (n+1)*0.75 ve 1. çeyreklik = (n+1)*0.25). Sapan değerlerden daha az etkilenir.

  3. Varyans- standart sapma beraber işlenecektir. Bunlar birbirlerinden elde edilen değerlerdir.

Varyans, veri setindeki tüm değerleri işleme alan değişim ölçüsüdür. Standart sapma onun karekökü olarak bulunur. Kitle ve örneklem için ayrı hesaplama formülleri mevcuttur. Standart sapma ortalama etrafındaki değişimi gösterir. Standart sapma formülü gereği ortalama ile aynı birimde olduğu için yorumlaması daha kolaydır. Ortalamadan uzak değerler olduğu durumlar kolay anlaşılır.

4. Değişim katsayısı (coefficient of variation): Farklı birimlerde ölçülmüş veri setlerinin değişkenliğini karşılaştırmak için kullanılabilir. Aşağıdaki formül ile bulunur. Veri setleri arasındaki birim ve büyüklük farklılığını ortadan kaldırır. 2 farklı kitle değişkenliğini karşılaştırırken kullanılır. Örneğin: İnsanların mı boyu çok değişkendir yoksa köpeklerin mi? sorusuna cevap verir.


metin, saat içeren bir resim

Açıklama otomatik olarak oluşturuldu


                                                                                                            İlkay Koyuncuoğlu

           Yorumlayan Z'ler Gençlik Platformu Yazarı



Bizi İntagram,Twitter ve Linkedin üzerinden takip edebilirsiniz...

Yorumlar

Bu blogdaki popüler yayınlar

Kültürel Entegrasyon

KATILIMCI ÇAĞRISI : Z Kuşağı Eğilimleri Saha Araştırma Anketi

2000'lerin Büyüsü