Örnek için ampirik dağılım fonksiyonu. ampirik dağıtım fonksiyonu
Varyasyon serisi. Çokgen ve histogram.
Dağıtım aralığı- incelenen popülasyonun birimlerinin belirli bir değişken özelliğe göre gruplara sıralı bir dağılımını temsil eder.
Bir dağılım serisinin oluşumunun altında yatan özelliğe bağlı olarak, niteliksel ve değişken dağıtım sıraları:
§ Artan veya azalan değerler sırasına göre oluşturulmuş dağıtım serileri nicel özellik aranan değişken.
Dağılımın varyasyon serisi iki sütundan oluşur:
İlk sütun, olarak adlandırılan değişken özelliğinin nicel değerlerini içerir. seçenekler ve işaretlenir. Ayrık varyant - bir tamsayı olarak ifade edilir. Aralık seçeneği, ve ile aralığındadır. Varyantların tipine bağlı olarak, ayrık veya aralıklı varyasyon serileri oluşturmak mümkündür.
İkinci sütun şunları içerir: belirli seçenek sayısı, frekanslar veya frekanslar cinsinden ifade edilir:
Frekanslar- bunlar, özelliğin verilen değerinin toplamda kaç kez gerçekleştiğini gösteren mutlak sayılardır ve bu, . Tüm frekansların toplamı, tüm popülasyonun birim sayısına eşit olmalıdır.
Frekanslar() toplamın yüzdesi olarak ifade edilen frekanslardır. Yüzde olarak ifade edilen tüm frekansların toplamı, birin kesirlerinde %100'e eşit olmalıdır.
Grafik görüntü dağıtım sıraları
Dağıtım serileri grafik görüntüler kullanılarak görselleştirilir.
Dağıtım serisi şu şekilde görüntülenir:
§ Çokgen
§ Histogramlar
§ Birikimler
Çokgen
Yatay eksende (apsis ekseni) bir çokgen oluştururken, değişen özniteliğin değerleri çizilir ve dikey eksen(y ekseni) - frekanslar veya frekanslar.
1. Şek. 6.1, 1994 yılında Rusya nüfusunun mikro nüfus sayımına göre inşa edilmiştir.
grafik çubuğu
Apsis boyunca bir histogram oluşturmak için, aralıkların sınırlarının değerlerini belirtin ve bunların temelinde, yüksekliği frekanslarla (veya frekanslarla) orantılı olan dikdörtgenler oluşturun.
Şek. 6.2. 1997 yılında Rusya nüfusunun dağılımının bir histogramını gösterir. yaş grupları.
Şekil 1. Rusya nüfusunun yaş gruplarına göre dağılımı
ampirik fonksiyon dağılımlar, özellikler.
Bilinmesine izin ver istatistiksel dağılım X nicel özelliğinin frekansları. Özelliğin değerinin x'ten küçük olduğu gözlem sayısıyla ve n ile gösterelim. toplam sayısı gözlemler. Açıktır ki, X olayının nispi frekansı Bir ampirik dağılım işlevi (örnek dağılım işlevi), her x değeri için X olayının göreli sıklığını belirleyen bir işlevdir. Numunenin ampirik dağılım fonksiyonundan farklı olarak, popülasyon dağılım fonksiyonuna teorik dağılım fonksiyonu denir. Bu fonksiyonlar arasındaki fark, teorik fonksiyonun X olayının olasılığını belirlemesidir. n büyüdükçe, X olayının göreli sıklığı Temel özellikler Temel sonucun sabitlenmesine izin verin. O zaman, aşağıdaki olasılık fonksiyonu tarafından verilen ayrık dağılımın dağılım fonksiyonu: burada bir - eşit örnek elemanların sayısı. Özellikle, örneğin tüm unsurları farklıysa, o zaman . Bu dağılımın matematiksel beklentisi: . Yani örnek ortalama, örnek dağılımının teorik ortalamasıdır. Benzer şekilde, örnek varyansı, örnek dağılımının teorik varyansıdır. Rastgele değişkenin binom dağılımı vardır: Örnek dağılım işlevi, dağılım işlevinin tarafsız bir tahminidir: . Örnek dağılım fonksiyonunun varyansı şu şekildedir: . Büyük sayıların güçlü yasasına göre, örnek dağılım işlevi neredeyse kesin olarak teorik dağılım işlevine yakınsar: neredeyse kesinlikle. Örnek dağılım fonksiyonu, teorik dağılım fonksiyonunun asimptotik olarak normal bir tahminidir. eğer , o zaman adresindeki dağıtıma göre. ders 13 X nicel özelliğinin frekanslarının istatistiksel dağılımı bilinsin, özelliğin değerinin x'ten küçük olduğu gözlem sayısı ve toplam gözlem sayısı n ile gösterelim. Açıktır ki, X olayının nispi frekansı< x равна и является функцией x. Так как эта функция находится эмпирическим (опытным) путем, то ее называют эмпирической. ampirik dağıtım fonksiyonu(örnekleme dağılım fonksiyonu), her x değeri için X olayının göreli frekansını belirleyen bir fonksiyondur.< x. Таким образом, по определению ,где - число вариант, меньших x, n – объем выборки. Numunenin ampirik dağılım fonksiyonunun aksine, popülasyon dağılım fonksiyonuna denir. teorik dağılım fonksiyonu. Bu fonksiyonlar arasındaki fark, teorik fonksiyonun tanımlamasıdır. olasılık olaylar X< x, тогда как эмпирическая – göreceli sıklık aynı olay. n büyüdükçe, X olayının göreli sıklığı< x, т.е. стремится по вероятности к вероятности этого события. Иными словами Ampirik dağılım fonksiyonunun özellikleri: 1) Ampirik fonksiyonun değerleri aralığa aittir 2) - azalmayan fonksiyon 3) If - en küçük seçenek, o zaman = 0'da , if - en büyük seçenek, o zaman =1'de . Numunenin ampirik dağılım fonksiyonu, popülasyonun teorik dağılım fonksiyonunu tahmin etmeye hizmet eder. Örnek. Örnek dağılımına göre ampirik bir fonksiyon oluşturalım: Örnek boyutunu bulalım: 12+18+30=60. En küçük seçenek 2'dir, yani x £ 2 için =0. x'in değeri<6, т.е. , наблюдалось 12 раз, следовательно, =12/60=0,2 при 2< x £6. Аналогично, значения X < 10, т.е. и наблюдались 12+18=30 раз, поэтому =30/60 =0,5 при 6< x £10. Так как x=10 – наибольшая варианта, то =1 при x>10. Böylece, istenen ampirik işlev şu şekildedir: İstatistiksel tahminlerin en önemli özellikleri Genel popülasyonun bazı nicel özelliklerini incelemek gereksin. Teorik değerlendirmelerden yola çıkarak şunu belirlemenin mümkün olduğunu varsayalım. hangisi dağılımın bir özelliği vardır ve belirlendiği parametreleri değerlendirmek gerekir. Örneğin, incelenen özellik genel popülasyonda normal olarak dağılıyorsa, matematiksel beklentiyi ve standart sapmayı tahmin etmek gerekir; özniteliğin bir Poisson dağılımı varsa, o zaman l parametresini tahmin etmek gerekir. Genellikle, n bağımsız gözlemden alınan özellik değerleri gibi yalnızca örnek veriler mevcuttur. Bağımsız rastgele değişkenler olarak ele alındığında şunu söyleyebiliriz. teorik bir dağılımın bilinmeyen bir parametresinin istatistiksel bir tahminini bulmak, tahmin edilen parametrenin yaklaşık bir değerini veren, gözlemlenen rastgele değişkenlerin bir fonksiyonunu bulmak anlamına gelir.
Örneğin, bir normal dağılımın matematiksel beklentisini tahmin etmek için, bir fonksiyonun rolü aritmetik ortalama tarafından oynanır. İstatistiksel tahminlerin, tahmin edilen parametrelerin doğru yaklaşımlarını vermesi için, aralarında en önemlilerinin gereksinimler olduğu belirli gereksinimleri karşılamaları gerekir. tarafsızlık
ve ödeme gücü
tahminler. Teorik dağılımın bilinmeyen parametresinin istatistiksel bir tahmini olsun. Tahminin n büyüklüğünde bir örneğe dayalı olarak bulunmasına izin verin. Deneyi tekrarlayalım, yani. genel popülasyondan aynı büyüklükte başka bir örnek alırız ve verilerine dayanarak farklı bir tahmin elde ederiz. Deneyi birçok kez tekrarlayarak farklı sayılar elde ederiz. Skor, rastgele bir değişken ve sayılar da olası değerleri olarak düşünülebilir. Tahmin bir yaklaşıklık verirse bolca, yani her sayı gerçek değerden büyükse, sonuç olarak rastgele değişkenin matematiksel beklentisi (ortalama değer) şundan büyüktür:. Aynı şekilde değerlendirirse dezavantajlı, sonra . Bu nedenle, matematiksel beklentisi tahmin edilen parametreye eşit olmayan istatistiksel bir tahminin kullanılması sistematik (tek işaretli) hatalara yol açacaktır. Aksine, bu sistematik hatalara karşı garanti eder. tarafsız
matematiksel beklentisi herhangi bir örneklem büyüklüğü için tahmin edilen parametreye eşit olan istatistiksel tahmin olarak adlandırılır. yerinden edilmiş bu koşulu sağlamayan tahmine denir. Tahminin tarafsızlığı, olası değerler olabileceğinden, tahmin edilen parametre için henüz iyi bir yaklaşımı garanti etmez. çok dağınık
ortalama değeri etrafında, yani. varyans önemli olabilir. Bu durumda, örneğin bir örneğin verilerinden bulunan tahmin, ortalama değerden ve dolayısıyla tahmin edilen parametrenin kendisinden önemli ölçüde uzak olabilir. verimli
belirli bir örneklem büyüklüğü n için, istatistiksel bir tahmin olarak adlandırılır. mümkün olan en küçük varyans
. Büyük hacimli numuneler göz önüne alındığında, istatistiksel tahminler gereklidir ödeme gücü
. Zengin
n®¥ olarak olasılıkta tahmin edilen parametreye yönelen istatistiksel bir tahmin olarak adlandırılır. Örneğin, yansız bir tahmincinin varyansı n®¥ olarak sıfır olma eğilimindeyse, o zaman böyle bir tahmin edicinin de tutarlı olduğu ortaya çıkar. Ampirik formülün ne olduğunu öğrenin. Kimyada, bir ESP, bir bileşiği tanımlamanın en basit yoludur - esas olarak, yüzdeleri verilen bileşiği oluşturan elementlerin bir listesidir. Bu basit formülün açıklama yapmadığına dikkat edilmelidir. emir Bir bileşikteki atomlar, sadece hangi elementlerden oluştuğunu gösterir. Örneğin: "Yüzde kompozisyon" terimini öğrenin."Yüzde bileşim", söz konusu bileşikteki her bir atomun yüzdesini ifade eder. Bir bileşiğin ampirik formülünü bulmak için bileşiğin yüzde bileşimini bilmek gerekir. Ev ödevi olarak deneysel bir formül bulursanız, yüzdelerin verilmesi daha olasıdır. Gram atomları ile uğraşmak zorunda kalacağınızı unutmayın. Bir gram atom, kütlesi atomik kütlesine eşit olan bir maddenin belirli bir miktarıdır. Bir gram atomu bulmak için aşağıdaki denklemi kullanmanız gerekir: Bir bileşikteki bir elementin yüzdesi, elementin atom kütlesine bölünür.
Atom oranını nasıl bulacağınızı bilin. Bir bileşikle çalışırken birden fazla gram atom elde edersiniz. Bileşiğinizin tüm gram atomlarını bulduktan sonra onlara bakın. Atom oranını bulmak için hesapladığınız en küçük gram-atom değerini seçmeniz gerekecektir. O zaman tüm gram atomları en küçük gram atomuna bölmek gerekecektir. Örneğin: Atomik oran değerlerini tam sayılara nasıl dönüştüreceğinizi öğrenin. Deneysel bir formül yazarken tam sayıları kullanmanız gerekir. Bu, 1.33 gibi sayıları kullanamayacağınız anlamına gelir. Atomların oranını bulduktan sonra, kesirli sayıları (1.33 gibi) tam sayılara (3 gibi) dönüştürmeniz gerekir. Bunu yapmak için, tamsayıları elde ettiğiniz atom oranının her bir sayısını çarparak bir tamsayı bulmanız gerekir. Örneğin: Ampirik dağılım fonksiyonunun belirlenmesi $X$ bir rastgele değişken olsun. $F(x)$ - verilen rastgele değişkenin dağılım fonksiyonu. Aynı bağımsız koşullar altında belirli bir rastgele değişken üzerinde $n$ deneyleri yapacağız. Bu durumda, örnek olarak adlandırılan bir $x_1,\ x_2\ $, ... ,$\ x_n$ değerleri dizisi elde ederiz. tanım 1 $x_i$ ($i=1,2\ $, ... ,$ \ n$)'nin her bir değerine değişken denir. Teorik dağılım fonksiyonunun tahminlerinden biri ampirik dağılım fonksiyonudur. tanım 3 Ampirik dağılım işlevi $F_n(x)$, her bir $x$ değeri için $X \ olayının göreceli sıklığını belirleyen işlevdir. $n_x$, $x$'dan küçük seçeneklerin sayısı olduğunda, $n$ örnek boyutudur. Ampirik fonksiyon ile teorik fonksiyon arasındaki fark, teorik fonksiyonun $X olayının olasılığını belirlemesidir. Şimdi dağıtım fonksiyonunun birkaç temel özelliğini ele alalım. $F_n\left(x\right)$ işlevinin aralığı $$ segmentidir. $F_n\left(x\right)$ azalmayan bir fonksiyondur. $F_n\left(x\right)$ bir sol sürekli fonksiyondur. $F_n\left(x\right)$ parçalı sabit bir fonksiyondur ve yalnızca $X$ rastgele değişkeninin değer noktalarında artar $X_1$ en küçük ve $X_n$ en büyük değişken olsun. Ardından $(x\le X)_1$ için $F_n\left(x\right)=0$ ve $x\ge X_n$ için $F_n\left(x\right)=1$. Teorik ve ampirik fonksiyonları birbirine bağlayan bir teoremi tanıtalım. Teorem 1 $F_n\left(x\right)$ ampirik dağılım fonksiyonu ve $F\left(x\right)$ genel örneğin teorik dağılım fonksiyonu olsun. O zaman eşitlik geçerlidir: \[(\mathop(lim)_(n\to \infty ) (|F)_n\left(x\sağ)-F\left(x\sağ)|=0\ )\] örnek 1 Örnek dağılımının bir tablo kullanılarak kaydedilen aşağıdaki verilere sahip olmasına izin verin: Resim 1. Örnek boyutunu bulun, ampirik bir dağılım fonksiyonu oluşturun ve çizin. Örnek boyutu: $n=5+10+15+20=50$. 5 özelliğine göre, buna $x\le 1$ $F_n\left(x\right)=0$ ve $x>4$ $F_n\left(x\right)=1$ için sahibiz. $x değeri $x değeri $x değeri Böylece şunu elde ederiz: Şekil 2. Figür 3 Örnek 2 Rusya'nın orta kesimindeki şehirlerden, toplu taşıma ücretleriyle ilgili aşağıdaki verilerin elde edildiği 20 şehir rastgele seçildi: 14, 15, 12, 12, 13, 15, 15, 13, 15, 12, 15 , 14, 15, 13 , 13, 12, 12, 15, 14, 14. Bu örneğin ampirik bir dağılım fonksiyonunu oluşturun ve grafiğini oluşturun. Örnek değerleri artan sırada yazıyoruz ve her bir değerin frekansını hesaplıyoruz. Aşağıdaki tabloyu alıyoruz: Şekil 4 Örnek boyutu: $n=20$. 5 özelliğine göre, $x\le 12$ $F_n\left(x\right)=0$ ve $x>15$ $F_n\left(x\right)=1$ için buna sahibiz. $x değeri $x değeri $x değeri Böylece şunu elde ederiz: Şekil 5 Ampirik dağılımı çizelim: Şekil 6 Orijinallik: $92.12\%$. Bilindiği gibi rastgele bir değişkenin dağılım yasası çeşitli şekillerde belirtilebilir. Ayrık bir rastgele değişken, bir dağıtım serisi veya bir integral işlevi kullanılarak belirtilebilir ve bir integral veya bir diferansiyel fonksiyon kullanılarak sürekli bir rastgele değişken belirtilebilir. Bu iki fonksiyonun seçici analoglarını ele alalım. Bazı rastgele hacim değişkenlerinin örnek bir değer kümesi olsun ve bu kümedeki her bir varyanta kendi frekansı atanır. Daha fazla izin ver bir gerçek sayıdır ve rastgele değişkenin örnek değerlerinin sayısıdır Tanım 10.15. ampirik dağıtım fonksiyonu(örnekleme dağıtım fonksiyonu) fonksiyon olarak adlandırılır. (10.19) Numunenin ampirik dağılım fonksiyonundan farklı olarak, dağıtım fonksiyonu F(x) genel popülasyona denir teorik dağılım fonksiyonu. Aralarındaki fark, teorik fonksiyonun F(x)
bir olayın olasılığını belirler ,
şunlar. genel olarak olasılık İşlev Özellikleri Örnek 10.4. Verilen örnek dağılımı için ampirik bir fonksiyon oluşturun: Seçenekler Frekanslar Çözüm:Örnek boyutunu bulun n=
12+18+30=60. En az seçenek = Anlam x<
10, yani İstenen ampirik dağılım işlevi: = Takvim R 1. Matematiksel istatistiklerin çözdüğü temel problemler nelerdir? 2. Genel ve örnek popülasyon? 3. Örnek boyutunu tanımlayın. 4. Hangi örneklere temsili denir? 5. Temsil hataları. 6. Ana örnekleme yöntemleri. 7. Frekans kavramları, bağıl frekans. 8. İstatistiksel dizi kavramı. 9. Sturges formülünü yazın. 10. Örnek aralığı, medyan ve mod kavramlarını formüle edin. 11. Çokgen frekansları, histogram. 12. Örnek popülasyonun nokta tahmini kavramı. 13. Önyargılı ve yansız nokta tahmini. 14. Örnek ortalama kavramını formüle edin. 15. Örnek varyansı kavramını formüle edin. 16. Örnek standart sapma kavramını formüle edin. 17. Örnek varyasyon katsayısı kavramını formüle edin. 18. Örnek bir geometrik ortalama kavramını formüle edin.Seçenekler
Frekanslar
Ampirik dağılım fonksiyonunun özellikleri
Ampirik dağılım fonksiyonunu bulmak için problem örnekleri
, daha küçük .Sonra numara örnekte gözlenen değerlerin sıklığıdır X, daha küçük ,
şunlar. olayın meydana gelme sıklığı
. Değiştiğinde x genel durumda, değer de değişecektir . Bu, göreceli frekansın argümanın bir fonksiyonudur . Ve bu fonksiyon deneyler sonucunda elde edilen numune verilerine göre bulunduğu için numune veya numune olarak adlandırılır. ampirik.
, her değer için tanımlama x olayın göreceli sıklığı
.
, ve ampirik olanı aynı olayın göreli sıklığıdır. Bernoulli teoreminden şu şekildedir:
(10.20)
ve bağıl olay sıklığı
, yani
birbirinden biraz farklı. Bu zaten, genel popülasyonun teorik (bütünsel) dağılım fonksiyonunun yaklaşık bir temsili için örneğin ampirik dağılım fonksiyonunu kullanmanın uygunluğunu ima etmektedir.
ve
aynı özelliklere sahiptir. Bu, işlevin tanımından gelir.
:
, Sonuç olarak,
de
. Anlam
, yani
12 kez gözlemlendi, bu nedenle:
de
.
ve
12+18=30 kez gözlendi, bu nedenle,
=
de
. saat
.
Şek. 10.2
dır-dir. 10.2sınav soruları