Varyasyon serisi. Çokgen ve histogram.

Dağıtım aralığı- incelenen popülasyonun birimlerinin belirli bir değişken özelliğe göre gruplara sıralı bir dağılımını temsil eder.

Bir dağılım serisinin oluşumunun altında yatan özelliğe bağlı olarak, niteliksel ve değişken dağıtım sıraları:

§ Artan veya azalan değerler sırasına göre oluşturulmuş dağıtım serileri nicel özellik aranan değişken.

Dağılımın varyasyon serisi iki sütundan oluşur:

İlk sütun, olarak adlandırılan değişken özelliğinin nicel değerlerini içerir. seçenekler ve işaretlenir. Ayrık varyant - bir tamsayı olarak ifade edilir. Aralık seçeneği, ve ile aralığındadır. Varyantların tipine bağlı olarak, ayrık veya aralıklı varyasyon serileri oluşturmak mümkündür.
İkinci sütun şunları içerir: belirli seçenek sayısı, frekanslar veya frekanslar cinsinden ifade edilir:

Frekanslar- bunlar, özelliğin verilen değerinin toplamda kaç kez gerçekleştiğini gösteren mutlak sayılardır ve bu, . Tüm frekansların toplamı, tüm popülasyonun birim sayısına eşit olmalıdır.

Frekanslar() toplamın yüzdesi olarak ifade edilen frekanslardır. Yüzde olarak ifade edilen tüm frekansların toplamı, birin kesirlerinde %100'e eşit olmalıdır.

Grafik görüntü dağıtım sıraları

Dağıtım serileri grafik görüntüler kullanılarak görselleştirilir.

Dağıtım serisi şu şekilde görüntülenir:

§ Çokgen

§ Histogramlar

§ Birikimler

Çokgen

Yatay eksende (apsis ekseni) bir çokgen oluştururken, değişen özniteliğin değerleri çizilir ve dikey eksen(y ekseni) - frekanslar veya frekanslar.

1. Şek. 6.1, 1994 yılında Rusya nüfusunun mikro nüfus sayımına göre inşa edilmiştir.


grafik çubuğu



Apsis boyunca bir histogram oluşturmak için, aralıkların sınırlarının değerlerini belirtin ve bunların temelinde, yüksekliği frekanslarla (veya frekanslarla) orantılı olan dikdörtgenler oluşturun.

Şek. 6.2. 1997 yılında Rusya nüfusunun dağılımının bir histogramını gösterir. yaş grupları.

Şekil 1. Rusya nüfusunun yaş gruplarına göre dağılımı

ampirik fonksiyon dağılımlar, özellikler.

Bilinmesine izin ver istatistiksel dağılım X nicel özelliğinin frekansları. Özelliğin değerinin x'ten küçük olduğu gözlem sayısıyla ve n ile gösterelim. toplam sayısı gözlemler. Açıktır ki, X olayının nispi frekansı

Bir ampirik dağılım işlevi (örnek dağılım işlevi), her x değeri için X olayının göreli sıklığını belirleyen bir işlevdir.

Numunenin ampirik dağılım fonksiyonundan farklı olarak, popülasyon dağılım fonksiyonuna teorik dağılım fonksiyonu denir. Bu fonksiyonlar arasındaki fark, teorik fonksiyonun X olayının olasılığını belirlemesidir.

n büyüdükçe, X olayının göreli sıklığı

Temel özellikler

Temel sonucun sabitlenmesine izin verin. O zaman, aşağıdaki olasılık fonksiyonu tarafından verilen ayrık dağılımın dağılım fonksiyonu:

burada bir - eşit örnek elemanların sayısı. Özellikle, örneğin tüm unsurları farklıysa, o zaman .

Bu dağılımın matematiksel beklentisi:

.

Yani örnek ortalama, örnek dağılımının teorik ortalamasıdır.

Benzer şekilde, örnek varyansı, örnek dağılımının teorik varyansıdır.

Rastgele değişkenin binom dağılımı vardır:

Örnek dağılım işlevi, dağılım işlevinin tarafsız bir tahminidir:

.

Örnek dağılım fonksiyonunun varyansı şu şekildedir:

.

Büyük sayıların güçlü yasasına göre, örnek dağılım işlevi neredeyse kesin olarak teorik dağılım işlevine yakınsar:

neredeyse kesinlikle.

Örnek dağılım fonksiyonu, teorik dağılım fonksiyonunun asimptotik olarak normal bir tahminidir. eğer , o zaman

adresindeki dağıtıma göre.

ders 13

X nicel özelliğinin frekanslarının istatistiksel dağılımı bilinsin, özelliğin değerinin x'ten küçük olduğu gözlem sayısı ve toplam gözlem sayısı n ile gösterelim. Açıktır ki, X olayının nispi frekansı< x равна и является функцией x. Так как эта функция находится эмпирическим (опытным) путем, то ее называют эмпирической.

ampirik dağıtım fonksiyonu(örnekleme dağılım fonksiyonu), her x değeri için X olayının göreli frekansını belirleyen bir fonksiyondur.< x. Таким образом, по определению ,где - число вариант, меньших x, n – объем выборки.

Numunenin ampirik dağılım fonksiyonunun aksine, popülasyon dağılım fonksiyonuna denir. teorik dağılım fonksiyonu. Bu fonksiyonlar arasındaki fark, teorik fonksiyonun tanımlamasıdır. olasılık olaylar X< x, тогда как эмпирическая – göreceli sıklık aynı olay.

n büyüdükçe, X olayının göreli sıklığı< x, т.е. стремится по вероятности к вероятности этого события. Иными словами

Ampirik dağılım fonksiyonunun özellikleri:

1) Ampirik fonksiyonun değerleri aralığa aittir

2) - azalmayan fonksiyon

3) If - en küçük seçenek, o zaman = 0'da , if - en büyük seçenek, o zaman =1'de .

Numunenin ampirik dağılım fonksiyonu, popülasyonun teorik dağılım fonksiyonunu tahmin etmeye hizmet eder.

Örnek. Örnek dağılımına göre ampirik bir fonksiyon oluşturalım:

Seçenekler
Frekanslar

Örnek boyutunu bulalım: 12+18+30=60. En küçük seçenek 2'dir, yani x £ 2 için =0. x'in değeri<6, т.е. , наблюдалось 12 раз, следовательно, =12/60=0,2 при 2< x £6. Аналогично, значения X < 10, т.е. и наблюдались 12+18=30 раз, поэтому =30/60 =0,5 при 6< x £10. Так как x=10 – наибольшая варианта, то =1 при x>10. Böylece, istenen ampirik işlev şu şekildedir:

İstatistiksel tahminlerin en önemli özellikleri

Genel popülasyonun bazı nicel özelliklerini incelemek gereksin. Teorik değerlendirmelerden yola çıkarak şunu belirlemenin mümkün olduğunu varsayalım. hangisi dağılımın bir özelliği vardır ve belirlendiği parametreleri değerlendirmek gerekir. Örneğin, incelenen özellik genel popülasyonda normal olarak dağılıyorsa, matematiksel beklentiyi ve standart sapmayı tahmin etmek gerekir; özniteliğin bir Poisson dağılımı varsa, o zaman l parametresini tahmin etmek gerekir.

Genellikle, n bağımsız gözlemden alınan özellik değerleri gibi yalnızca örnek veriler mevcuttur. Bağımsız rastgele değişkenler olarak ele alındığında şunu söyleyebiliriz. teorik bir dağılımın bilinmeyen bir parametresinin istatistiksel bir tahminini bulmak, tahmin edilen parametrenin yaklaşık bir değerini veren, gözlemlenen rastgele değişkenlerin bir fonksiyonunu bulmak anlamına gelir. Örneğin, bir normal dağılımın matematiksel beklentisini tahmin etmek için, bir fonksiyonun rolü aritmetik ortalama tarafından oynanır.



İstatistiksel tahminlerin, tahmin edilen parametrelerin doğru yaklaşımlarını vermesi için, aralarında en önemlilerinin gereksinimler olduğu belirli gereksinimleri karşılamaları gerekir. tarafsızlık ve ödeme gücü tahminler.

Teorik dağılımın bilinmeyen parametresinin istatistiksel bir tahmini olsun. Tahminin n büyüklüğünde bir örneğe dayalı olarak bulunmasına izin verin. Deneyi tekrarlayalım, yani. genel popülasyondan aynı büyüklükte başka bir örnek alırız ve verilerine dayanarak farklı bir tahmin elde ederiz. Deneyi birçok kez tekrarlayarak farklı sayılar elde ederiz. Skor, rastgele bir değişken ve sayılar da olası değerleri olarak düşünülebilir.

Tahmin bir yaklaşıklık verirse bolca, yani her sayı gerçek değerden büyükse, sonuç olarak rastgele değişkenin matematiksel beklentisi (ortalama değer) şundan büyüktür:. Aynı şekilde değerlendirirse dezavantajlı, sonra .

Bu nedenle, matematiksel beklentisi tahmin edilen parametreye eşit olmayan istatistiksel bir tahminin kullanılması sistematik (tek işaretli) hatalara yol açacaktır. Aksine, bu sistematik hatalara karşı garanti eder.

tarafsız matematiksel beklentisi herhangi bir örneklem büyüklüğü için tahmin edilen parametreye eşit olan istatistiksel tahmin olarak adlandırılır.

yerinden edilmiş bu koşulu sağlamayan tahmine denir.

Tahminin tarafsızlığı, olası değerler olabileceğinden, tahmin edilen parametre için henüz iyi bir yaklaşımı garanti etmez. çok dağınık ortalama değeri etrafında, yani. varyans önemli olabilir. Bu durumda, örneğin bir örneğin verilerinden bulunan tahmin, ortalama değerden ve dolayısıyla tahmin edilen parametrenin kendisinden önemli ölçüde uzak olabilir.

verimli belirli bir örneklem büyüklüğü n için, istatistiksel bir tahmin olarak adlandırılır. mümkün olan en küçük varyans .

Büyük hacimli numuneler göz önüne alındığında, istatistiksel tahminler gereklidir ödeme gücü .

Zengin n®¥ olarak olasılıkta tahmin edilen parametreye yönelen istatistiksel bir tahmin olarak adlandırılır. Örneğin, yansız bir tahmincinin varyansı n®¥ olarak sıfır olma eğilimindeyse, o zaman böyle bir tahmin edicinin de tutarlı olduğu ortaya çıkar.

Ampirik formülün ne olduğunu öğrenin. Kimyada, bir ESP, bir bileşiği tanımlamanın en basit yoludur - esas olarak, yüzdeleri verilen bileşiği oluşturan elementlerin bir listesidir. Bu basit formülün açıklama yapmadığına dikkat edilmelidir. emir Bir bileşikteki atomlar, sadece hangi elementlerden oluştuğunu gösterir. Örneğin:

  • %40.92 karbondan oluşan bir bileşik; %4.58 hidrojen ve %54.5 oksijen, ampirik formül C3H403'e sahip olacaktır (ikinci bölümde bu bileşiğin ESP'sinin nasıl bulunacağına dair bir örnek tartışılacaktır).
  • "Yüzde kompozisyon" terimini öğrenin."Yüzde bileşim", söz konusu bileşikteki her bir atomun yüzdesini ifade eder. Bir bileşiğin ampirik formülünü bulmak için bileşiğin yüzde bileşimini bilmek gerekir. Ev ödevi olarak deneysel bir formül bulursanız, yüzdelerin verilmesi daha olasıdır.

    • Laboratuarda bir kimyasal bileşiğin yüzde bileşimini bulmak için bazı fiziksel deneylere ve ardından nicel analizlere tabi tutulur. Laboratuvarda değilseniz bu deneyleri yapmanıza gerek yoktur.
  • Gram atomları ile uğraşmak zorunda kalacağınızı unutmayın. Bir gram atom, kütlesi atomik kütlesine eşit olan bir maddenin belirli bir miktarıdır. Bir gram atomu bulmak için aşağıdaki denklemi kullanmanız gerekir: Bir bileşikteki bir elementin yüzdesi, elementin atom kütlesine bölünür.

    • Örneğin, %40.92 karbon içeren bir bileşiğimiz olduğunu varsayalım. Karbonun atom kütlesi 12'dir, dolayısıyla denklemimiz 40.92 / 12 = 3.41 olacaktır.
  • Atom oranını nasıl bulacağınızı bilin. Bir bileşikle çalışırken birden fazla gram atom elde edersiniz. Bileşiğinizin tüm gram atomlarını bulduktan sonra onlara bakın. Atom oranını bulmak için hesapladığınız en küçük gram-atom değerini seçmeniz gerekecektir. O zaman tüm gram atomları en küçük gram atomuna bölmek gerekecektir. Örneğin:

    • Üç gram atom içeren bir bileşikle çalıştığınızı varsayalım: 1.5; 2 ve 2.5. Bu sayıların en küçüğü 1.5'tir. Bu nedenle, atomların oranını bulmak için tüm sayıları 1,5'e bölmeli ve aralarına bir oran işareti koymalısınız. : .
    • 1.5 / 1.5 = 1. 2 / 1.5 = 1.33. 2.5 / 1.5 = 1.66. Bu nedenle, atomların oranı 1: 1,33: 1,66 .
  • Atomik oran değerlerini tam sayılara nasıl dönüştüreceğinizi öğrenin. Deneysel bir formül yazarken tam sayıları kullanmanız gerekir. Bu, 1.33 gibi sayıları kullanamayacağınız anlamına gelir. Atomların oranını bulduktan sonra, kesirli sayıları (1.33 gibi) tam sayılara (3 gibi) dönüştürmeniz gerekir. Bunu yapmak için, tamsayıları elde ettiğiniz atom oranının her bir sayısını çarparak bir tamsayı bulmanız gerekir. Örneğin:

    • 2'yi deneyin. Atomik oran sayılarını (1, 1.33 ve 1.66) 2 ile çarpın. 2, 2.66 ve 3.32 elde edersiniz. Tamsayı değiller, bu nedenle 2 uygun değil.
    • 3'ü deneyin. 1, 1,33 ve 1,66'yı 3 ile çarparsanız, sırasıyla 3, 4 ve 5 elde edersiniz. Bu nedenle, tam sayıların atomik oranı şu şekildedir: 3: 4: 5 .
  • Ampirik dağılım fonksiyonunun belirlenmesi

    $X$ bir rastgele değişken olsun. $F(x)$ - verilen rastgele değişkenin dağılım fonksiyonu. Aynı bağımsız koşullar altında belirli bir rastgele değişken üzerinde $n$ deneyleri yapacağız. Bu durumda, örnek olarak adlandırılan bir $x_1,\ x_2\ $, ... ,$\ x_n$ değerleri dizisi elde ederiz.

    tanım 1

    $x_i$ ($i=1,2\ $, ... ,$ \ n$)'nin her bir değerine değişken denir.

    Teorik dağılım fonksiyonunun tahminlerinden biri ampirik dağılım fonksiyonudur.

    tanım 3

    Ampirik dağılım işlevi $F_n(x)$, her bir $x$ değeri için $X \ olayının göreceli sıklığını belirleyen işlevdir.

    $n_x$, $x$'dan küçük seçeneklerin sayısı olduğunda, $n$ örnek boyutudur.

    Ampirik fonksiyon ile teorik fonksiyon arasındaki fark, teorik fonksiyonun $X olayının olasılığını belirlemesidir.

    Ampirik dağılım fonksiyonunun özellikleri

    Şimdi dağıtım fonksiyonunun birkaç temel özelliğini ele alalım.

      $F_n\left(x\right)$ işlevinin aralığı $$ segmentidir.

      $F_n\left(x\right)$ azalmayan bir fonksiyondur.

      $F_n\left(x\right)$ bir sol sürekli fonksiyondur.

      $F_n\left(x\right)$ parçalı sabit bir fonksiyondur ve yalnızca $X$ rastgele değişkeninin değer noktalarında artar

      $X_1$ en küçük ve $X_n$ en büyük değişken olsun. Ardından $(x\le X)_1$ için $F_n\left(x\right)=0$ ve $x\ge X_n$ için $F_n\left(x\right)=1$.

    Teorik ve ampirik fonksiyonları birbirine bağlayan bir teoremi tanıtalım.

    Teorem 1

    $F_n\left(x\right)$ ampirik dağılım fonksiyonu ve $F\left(x\right)$ genel örneğin teorik dağılım fonksiyonu olsun. O zaman eşitlik geçerlidir:

    \[(\mathop(lim)_(n\to \infty ) (|F)_n\left(x\sağ)-F\left(x\sağ)|=0\ )\]

    Ampirik dağılım fonksiyonunu bulmak için problem örnekleri

    örnek 1

    Örnek dağılımının bir tablo kullanılarak kaydedilen aşağıdaki verilere sahip olmasına izin verin:

    Resim 1.

    Örnek boyutunu bulun, ampirik bir dağılım fonksiyonu oluşturun ve çizin.

    Örnek boyutu: $n=5+10+15+20=50$.

    5 özelliğine göre, buna $x\le 1$ $F_n\left(x\right)=0$ ve $x>4$ $F_n\left(x\right)=1$ için sahibiz.

    $x değeri

    $x değeri

    $x değeri

    Böylece şunu elde ederiz:

    Şekil 2.

    Figür 3

    Örnek 2

    Rusya'nın orta kesimindeki şehirlerden, toplu taşıma ücretleriyle ilgili aşağıdaki verilerin elde edildiği 20 şehir rastgele seçildi: 14, 15, 12, 12, 13, 15, 15, 13, 15, 12, 15 , 14, 15, 13 , 13, 12, 12, 15, 14, 14.

    Bu örneğin ampirik bir dağılım fonksiyonunu oluşturun ve grafiğini oluşturun.

    Örnek değerleri artan sırada yazıyoruz ve her bir değerin frekansını hesaplıyoruz. Aşağıdaki tabloyu alıyoruz:

    Şekil 4

    Örnek boyutu: $n=20$.

    5 özelliğine göre, $x\le 12$ $F_n\left(x\right)=0$ ve $x>15$ $F_n\left(x\right)=1$ için buna sahibiz.

    $x değeri

    $x değeri

    $x değeri

    Böylece şunu elde ederiz:

    Şekil 5

    Ampirik dağılımı çizelim:

    Şekil 6

    Orijinallik: $92.12\%$.

    Bilindiği gibi rastgele bir değişkenin dağılım yasası çeşitli şekillerde belirtilebilir. Ayrık bir rastgele değişken, bir dağıtım serisi veya bir integral işlevi kullanılarak belirtilebilir ve bir integral veya bir diferansiyel fonksiyon kullanılarak sürekli bir rastgele değişken belirtilebilir. Bu iki fonksiyonun seçici analoglarını ele alalım.

    Bazı rastgele hacim değişkenlerinin örnek bir değer kümesi olsun ve bu kümedeki her bir varyanta kendi frekansı atanır. Daha fazla izin ver bir gerçek sayıdır ve rastgele değişkenin örnek değerlerinin sayısıdır
    , daha küçük .Sonra numara örnekte gözlenen değerlerin sıklığıdır X, daha küçük , şunlar. olayın meydana gelme sıklığı
    . Değiştiğinde x genel durumda, değer de değişecektir . Bu, göreceli frekansın argümanın bir fonksiyonudur . Ve bu fonksiyon deneyler sonucunda elde edilen numune verilerine göre bulunduğu için numune veya numune olarak adlandırılır. ampirik.

    Tanım 10.15. ampirik dağıtım fonksiyonu(örnekleme dağıtım fonksiyonu) fonksiyon olarak adlandırılır.
    , her değer için tanımlama x olayın göreceli sıklığı
    .

    (10.19)

    Numunenin ampirik dağılım fonksiyonundan farklı olarak, dağıtım fonksiyonu F(x) genel popülasyona denir teorik dağılım fonksiyonu. Aralarındaki fark, teorik fonksiyonun F(x) bir olayın olasılığını belirler
    , ve ampirik olanı aynı olayın göreli sıklığıdır. Bernoulli teoreminden şu şekildedir:

    ,
    (10.20)

    şunlar. genel olarak olasılık
    ve bağıl olay sıklığı
    , yani
    birbirinden biraz farklı. Bu zaten, genel popülasyonun teorik (bütünsel) dağılım fonksiyonunun yaklaşık bir temsili için örneğin ampirik dağılım fonksiyonunu kullanmanın uygunluğunu ima etmektedir.

    İşlev
    ve
    aynı özelliklere sahiptir. Bu, işlevin tanımından gelir.

    Özellikleri
    :


    Örnek 10.4. Verilen örnek dağılımı için ampirik bir fonksiyon oluşturun:

    Seçenekler

    Frekanslar

    Çözüm:Örnek boyutunu bulun n= 12+18+30=60. En az seçenek
    , Sonuç olarak,
    de
    . Anlam
    , yani
    12 kez gözlemlendi, bu nedenle:

    =
    de
    .

    Anlam x< 10, yani
    ve
    12+18=30 kez gözlendi, bu nedenle,
    =
    de
    . saat

    .

    İstenen ampirik dağılım işlevi:

    =

    Takvim
    Şek. 10.2

    R
    dır-dir. 10.2

    sınav soruları

    1. Matematiksel istatistiklerin çözdüğü temel problemler nelerdir? 2. Genel ve örnek popülasyon? 3. Örnek boyutunu tanımlayın. 4. Hangi örneklere temsili denir? 5. Temsil hataları. 6. Ana örnekleme yöntemleri. 7. Frekans kavramları, bağıl frekans. 8. İstatistiksel dizi kavramı. 9. Sturges formülünü yazın. 10. Örnek aralığı, medyan ve mod kavramlarını formüle edin. 11. Çokgen frekansları, histogram. 12. Örnek popülasyonun nokta tahmini kavramı. 13. Önyargılı ve yansız nokta tahmini. 14. Örnek ortalama kavramını formüle edin. 15. Örnek varyansı kavramını formüle edin. 16. Örnek standart sapma kavramını formüle edin. 17. Örnek varyasyon katsayısı kavramını formüle edin. 18. Örnek bir geometrik ortalama kavramını formüle edin.