Matematik istatistikleri ile ilgilenen modern bir matematik dalıdır. istatistiksel açıklama deney ve gözlemlerin sonuçları ve ayrıca bina Matematiksel modeller kavramları içeren olasılıklar. Matematiksel istatistiklerin teorik temeli, olasılık teorisi.

Matematiksel istatistiklerin yapısında, geleneksel olarak iki ana bölüm ayırt edilir: tanımlayıcı istatistikler ve istatistiksel çıkarım (Şekil 1.1).

Pirinç. 1.1. Matematiksel istatistiklerin ana bölümleri

Tanımlayıcı istatistikler için kullanılır:

o bir değişkenin göstergelerinin genelleştirilmesi (rastgele bir örneğin istatistikleri);

o iki veya daha fazla değişken arasındaki ilişkilerin belirlenmesi (korelasyon-regresyon analizi).

Tanımlayıcı istatistikler, yeni bilgiler elde etmeyi, hızlı bir şekilde anlamayı ve kapsamlı bir şekilde değerlendirmeyi mümkün kılar, yani adını haklı çıkaran çalışma nesnelerini tanımlamanın bilimsel işlevini yerine getirir. Tanımlayıcı istatistik yöntemleri, bir dizi bireysel deneysel veriyi, algı için görsel olan bir form ve sayı sistemine dönüştürmek için tasarlanmıştır: frekans dağılımları; trend göstergeleri, değişkenlik, iletişim. Bu yöntemler, istatistiksel çıkarımların uygulanması için temel teşkil eden rastgele bir örneğin istatistiklerini hesaplar.

İstatiksel sonuç fırsat verin:

o örnek istatistiklerin doğruluğunu, güvenilirliğini ve etkinliğini değerlendirmek, istatistiksel araştırma sürecinde meydana gelen hataları bulmak (istatistiksel değerlendirme)

o örnek istatistikler temelinde elde edilen genel popülasyonun parametrelerini özetlemek (kontrol istatistiksel hipotezler).

ana hedef bilimsel araştırma- bu, genellikle genel nüfus olarak adlandırılan geniş bir fenomen, kişi veya olay sınıfı hakkında yeni bilgilerin edinilmesidir.

Nüfus çalışma nesnelerinin toplamıdır, örneklem- bilimsel olarak doğrulanmış belirli bir şekilde oluşturulan kısmı 2.

"Genel nüfus" terimi şu durumlarda kullanılır: Konuşuyoruz incelenmekte olan büyük ama sonlu bir nesne kümesi hakkında. Örneğin, 2009 yılında Ukrayna'daki başvuranların toplamı veya çocukların toplamı hakkında okul öncesi yaş Rivne şehri. Genel popülasyonlar önemli hacimlere ulaşabilir, sonlu ve sonsuz olabilir. Pratikte, kural olarak, sonlu kümelerle ilgilenilir. Ve eğer genel popülasyonun büyüklüğünün numunenin büyüklüğüne oranı 100'den fazlaysa, o zaman Glass ve Stanley'e göre, sonlu ve sonsuz popülasyonlar için tahmin yöntemleri esasen aynı sonuçları verir. Genel küme, bazı özniteliklerin tam değer kümesi olarak da adlandırılabilir. Örneklemin genel popülasyona ait olması, örneklemin özelliklerine göre genel popülasyonun özelliklerinin değerlendirilmesinde temel dayanaktır.

Ana fikir matematiksel istatistikler, çoğu bilimsel problemde genel popülasyonun tüm nesnelerinin eksiksiz bir şekilde incelenmesinin, çok fazla zaman ve önemli maddi maliyetler gerektirdiğinden, pratik olarak imkansız veya ekonomik olarak pratik olmadığı inancına dayanmaktadır. Bu nedenle, matematiksel istatistiklerde kullanılır. seçici yaklaşım, prensibi, Şekil 1'deki şemada gösterilmiştir. 1.2.

Örneğin, oluşum teknolojisine göre örnekler rastgele (basit ve sistematik), tabakalı, kümelenmiş (bkz. Bölüm 4).

Pirinç. 1.2. Matematiksel istatistik yöntemlerinin uygulama şeması seçici yaklaşım matematiksel kullanımı istatistiksel yöntemler aşağıdaki sırayla gerçekleştirilebilir (bkz. Şekil 1.2):

o ile Genel popülasyon,özellikleri araştırmaya konu olan, belirli yöntemler bir örnek oluşturur- araştırma yöntemlerinin uygulandığı tipik ancak sınırlı sayıda nesne;

o Örnek nesneler üzerinde gözlemsel yöntemler, deneysel eylemler ve ölçümler sonucunda ampirik veriler elde edilir;

o ampirik verilerin betimleyici istatistik yöntemleri kullanılarak işlenmesi, istatistikçi olarak adlandırılan örnek göstergeler verir - bu arada, disiplinin adı gibi;

o istatistiksel çıkarım yöntemlerini uygulamak istatistikçi,özellikleri karakterize eden parametreleri almak genel nüfus.

Örnek 1.1. Bilgi düzeyinin kararlılığını değerlendirmek için (değişken x) 3 öğrenciden oluşan rastgele bir örneğin test edilmesi n. Testler, her biri puanlama sistemine göre değerlendirilen m görev içeriyordu: "tamamlandı" "- 1", tamamlanmadı "- 0. Öğrencilerin ortalama mevcut başarıları kaldı X

3 randomize örnek(İngilizce'den. Rastgele - rastgele), rastgele testler stratejisine göre oluşturulan temsili bir örnektir.

önceki yıllarda / h düzeyinde? Çözüm dizisi:

o şu türden anlamlı bir hipotez bulun: "mevcut test sonuçları geçmişten farklı değilse, o zaman öğrencilerin bilgi düzeyinin değişmediğini düşünebiliriz ve çalışma süreci- kararlı";

o boş hipotez gibi yeterli bir istatistiksel hipotez formüle edin H 0 ki "mevcut not ortalaması X, önceki yılların ortalamasından istatistiksel olarak farklı değildir / h", yani. H0: X = ⁄ r, karşılık gelen alternatif hipoteze karşı X Ф ^ ;

o inşa araştırılan değişken X'in ampirik dağılımları;

o tanımla(gerekirse) örneğin bir değişken arasındaki korelasyonlar X ve diğer göstergeler, inşa regresyon çizgileri;

o uygunluğu kontrol et ampirik dağılım normal yasa;

o nokta göstergelerinin değerini ve parametrelerin güven aralığını, örneğin ortalamayı değerlendirmek;

o istatistiksel test için kriterler tanımlayın hipotezler;

o seçilen kriterlere dayalı istatistiksel hipotezleri test etmek;

o belirli bir konuda istatistiksel sıfır hipotezi hakkında bir karar formüle etmek önem düzeyi;

o anlamlı hipoteze ilişkin sonuçların yorumlanmasının istatistiksel sıfır hipotezini kabul etme veya reddetme kararından hareket;

o anlamlı sonuçlar formüle edin.

Dolayısıyla, yukarıdaki prosedürleri özetlersek, istatistiksel yöntemlerin uygulanması üç ana bloktan oluşur:

Bir gerçeklik nesnesinden soyut bir matematiksel ve istatistiksel şemaya geçiş, yani bir fenomen, süreç, özelliğin olasılıklı bir modelinin inşası;

Ölçümlerin, gözlemlerin, deneylerin sonuçlarına ve istatistiksel sonuçların formülasyonuna dayanan bir olasılık modeli çerçevesinde uygun matematiksel araçlarla hesaplama eylemlerinin gerçekleştirilmesi;

Gerçek durumla ilgili istatistiksel sonuçların yorumlanması ve uygun bir karar verilmesi.

Verilerin işlenmesi ve yorumlanması için istatistiksel yöntemler, olasılık teorisine dayanmaktadır. Olasılık teorisi, matematiksel istatistik yöntemlerinin temelidir. Olasılık teorisinin temel kavramlarını ve yasalarını kullanmadan, matematiksel istatistiklerin sonuçlarını ve dolayısıyla bilimsel ve pratik amaçlar için makul kullanımlarını genelleştirmek imkansızdır.

Bu nedenle, tanımlayıcı istatistiklerin görevi, bir dizi örnek veriyi bir göstergeler - istatistikler - sıklık dağılımları, merkezi eğilim ve değişkenlik ölçüleri, birleştirme katsayıları ve benzerleri sistemine dönüştürmektir. Bununla birlikte, istatistikler aslında belirli bir örneğin özellikleridir. Elbette, örnek dağılımlarını, örnek ortalamalarını, varyansları vb. hesaplamak mümkündür, ancak bu tür "veri analizi" sınırlı bilimsel ve eğitimsel değere sahiptir. Bu tür göstergelere dayalı olarak varılan sonuçların diğer popülasyonlara "mekanik" aktarımı doğru değildir.

Örnek göstergeleri veya diğerlerini veya daha yaygın popülasyonlara transfer edebilmek için matematiksel olarak gerekçelendirilmiş olması gerekir. hükümlerörnek özelliklerin bu ortak sözde genel popülasyonların özellikleriyle uygunluğu ve yeteneği hakkında. Bu tür hükümler, örneğin hukukta aksiyomatik yaklaşım gibi olasılıksal gerçeklik modelleriyle ilişkili teorik yaklaşımlara ve şemalara dayanmaktadır. büyük sayılar vb. Sınırlı ampirik bilgilerin analizinin sonuçlarıyla oluşturulan özelliklerin diğer veya yaygın kümelere aktarılması ancak onların yardımıyla mümkündür. Böylece, olasılıklı modellerin inşası, işleyiş yasaları, kullanımı, "olasılık teorisi" adı verilen matematiksel bir alanın konusudur, istatistiksel yöntemlerin özü haline gelir.

Bu nedenle, matematiksel istatistiklerde, iki paralel gösterge satırı kullanılır: uygulama ile ilgili olan ilk satır (bunlar örnek göstergelerdir) ve ikincisi, teoriye dayalıdır (bunlar olasılıklı bir modelin göstergeleridir). Örneğin, numune üzerinde belirlenen ampirik frekanslar teorik olasılık kavramlarına karşılık gelir; örnek ortalama (alıştırma) karşılık gelir beklenen değer(teori), vb. Ayrıca, çalışmalarda, kural olarak seçici özellikler birincildir. Gözlemler, ölçümler, deneyler temelinde hesaplanırlar, daha sonra yetenek ve etkinliğin istatistiksel olarak değerlendirilmesinden, araştırmanın amaçlarına uygun olarak istatistiksel hipotezlerin test edilmesinden geçerler ve sonunda belirli bir olasılıkla şu şekilde kabul edilirler: incelenen popülasyonların özelliklerinin göstergeleri.

Soru. Bir görev.

1. Matematiksel istatistiklerin ana bölümlerini tanımlayın.

2. Matematiksel istatistiklerin ana fikri nedir?

3. Genel ve örnek popülasyonların oranını açıklayın.

4. Matematiksel istatistik yöntemlerini uygulama şemasını açıklayın.

5. Matematiksel istatistiklerin ana görevlerinin listesini belirtin.

6. İstatistiksel yöntemlerin uygulanmasının ana blokları nelerdir? Onları tanımlayın.

7. Matematiksel istatistik ve olasılık teorisi arasındaki bağlantıyı genişletin.

giriiş

2. Matematiksel istatistiklerin temel kavramları

2.1 Örneklemenin temel kavramları

2.2 Örnekleme

2.3 Ampirik dağılım fonksiyonu, histogram

Çözüm

bibliyografya

giriiş

Matematiksel istatistik bir bilimdir. matematiksel yöntemler Bilimsel ve pratik sonuçlar için istatistiksel verilerin sistematikleştirilmesi ve kullanılması. Dallarının çoğunda, matematiksel istatistikler, sınırlı istatistiksel malzemeden çıkarılan sonuçların güvenilirliğini ve doğruluğunu değerlendirmeyi mümkün kılan olasılık teorisine dayanır (örneğin, gerekli doğrulukta sonuçları elde etmek için gerekli örnek büyüklüğünü tahmin etmek için). örnek bir ankette).

Olasılık teorisinde, rastgele değişkenlerözellikleri tam olarak bilinen belirli bir dağılım veya rastgele deneylerle. Olasılık teorisinin konusu, bu niceliklerin (dağılımların) özellikleri ve ilişkileridir.

Ancak çoğu zaman deney, deneyin kendisinin özellikleri hakkında bir sonuç çıkarmanın gerekli olduğu yalnızca bazı sonuçlar veren bir kara kutudur. Gözlemci, aynı rastgele deneyi aynı koşullar altında tekrarlayarak elde edilen bir dizi sayısal (veya sayısal hale getirilebilir) sonuçlara sahiptir.

Bu durumda, örneğin, şu sorular ortaya çıkar: Bir rastgele değişkeni gözlemlersek, birkaç deneyde bir dizi değerden dağılımı hakkında en doğru sonucu nasıl çıkarabiliriz?

Böyle bir dizi deneye bir örnek, sosyolojik bir araştırma, bir dizi ekonomik gösterge veya son olarak, bin kat yazı tura sırasında bir dizi arma ve kuyruktur.

Yukarıdaki faktörlerin tümü aşağıdakilere yol açar: alaka ve mevcut aşamadaki çalışma konusunun önemi, matematiksel istatistiklerin temel kavramlarının derin ve kapsamlı bir şekilde incelenmesini amaçlamaktadır.

Bu bağlamda, bu çalışmanın amacı matematiksel istatistik kavramlarına ilişkin bilgileri sistematize etmek, biriktirmek ve pekiştirmektir.

1. Matematiksel istatistiklerin konusu ve yöntemleri

Matematiksel istatistik, toplu gözlemler (ölçümler, deneyler) sırasında elde edilen verileri analiz etmek için matematiksel yöntemlerin bilimidir. Gözlemlerin belirli sonuçlarının matematiksel doğasına bağlı olarak, matematiksel istatistikler sayı istatistiklerine, çok boyutlu istatistiklere bölünmüştür. istatistiksel analiz, fonksiyonların (süreçlerin) ve zaman serilerinin analizi, sayısal olmayan nitelikteki nesnelerin istatistikleri. Matematiksel istatistiklerin önemli bir kısmı olasılıksal modellere dayanmaktadır. tahsis genel görevler verilerin tanımları, hipotezlerin değerlendirilmesi ve test edilmesi. Ayrıca örnek anketler yürütme, bağımlılıkları geri yükleme, sınıflandırmalar (tipolojiler) oluşturma ve kullanma vb. ile ilgili daha özel görevleri de dikkate alırlar.

Verileri tanımlamak için tablolar, çizelgeler ve diğer görsel temsiller, örneğin korelasyon alanları oluşturulur. Olasılık modelleri genellikle kullanılmaz. Bazı veri tanımlama yöntemleri, gelişmiş teoriye ve modern bilgisayarların yeteneklerine dayanır. Bunlar arasında özellikle birbirine benzeyen nesne gruplarını tanımlamayı amaçlayan küme analizi ve nesnelerin bir düzlemde görselleştirilmesini mümkün kılan ve aralarındaki mesafeleri en az ölçüde bozan çok boyutlu ölçekleme yer alır.

Tahmin ve hipotez test yöntemleri, olasılıksal veri üretme modellerine dayanır. Bu modeller parametrik ve parametrik olmayan olarak ikiye ayrılır. Parametrik modellerde, incelenen nesnelerin az sayıda (1-4) sayısal parametreye bağlı dağıtım fonksiyonları tarafından tanımlandığı varsayılır. Parametrik olmayan modellerde dağılım fonksiyonlarının keyfi sürekli olduğu varsayılır. Matematiksel istatistikte, dağılımın parametreleri ve özellikleri (matematiksel beklenti, medyan, varyans, nicelikler vb.), yoğunluklar ve dağılım fonksiyonları, değişkenler arasındaki bağımlılıklar (doğrusal ve parametrik olmayan korelasyon katsayılarına dayalı, ayrıca parametrik veya non-parametrik). Bağımlılıkları ifade eden fonksiyonların parametrik tahminleri) değerlendirilir vb. Nokta ve aralık (gerçek değerler için sınırlar vererek) tahminlerini kullanın.

Matematiksel istatistikte genel bir hipotez testi teorisi vardır ve Büyük sayı Spesifik hipotezleri test etmeye adanmış yöntemler. Parametrelerin ve özelliklerin değerleri, homojenliğin kontrol edilmesi (yani, iki örnekte özelliklerin veya dağılım fonksiyonlarının çakışması hakkında), ampirik dağılım fonksiyonunun belirli bir dağılım fonksiyonu veya bir parametrik ile uyuşması hakkında hipotezler düşünülür. bu tür işlevlerin ailesi, dağılımın simetrisi vb.

Büyük önem taşıyan, çeşitli örnekleme şemalarının özellikleri ve hipotezleri tahmin etmek ve test etmek için yeterli yöntemlerin oluşturulması ile örnek anketlerin yürütülmesiyle ilgili matematiksel istatistik bölümüdür.

Bağımlılık kurtarma sorunları, 1794'te K. Gauss tarafından en küçük kareler yönteminin geliştirilmesinden bu yana 200 yıldan fazla bir süredir aktif olarak incelenmiştir. Şu anda, bilgilendirici bir değişken alt kümesi arama yöntemleri ve parametrik olmayan yöntemler en alakalı olanlardır.

Veri yaklaşımı ve tanım boyutunun azaltılması için yöntemlerin geliştirilmesi, 100 yıldan daha uzun bir süre önce K. Pearson'ın temel bileşen yöntemini oluşturmasıyla başlamıştır. Daha sonra faktör analizi ve çok sayıda doğrusal olmayan genellemeler geliştirildi.

Sınıflandırmaların (tipolojiler) çeşitli oluşturma (küme analizi), analiz ve kullanım (ayırt edici analizi) yöntemlerine ayrıca örüntü tanıma yöntemleri (öğretmenli ve öğretmensiz), otomatik sınıflandırma vb.

İstatistikteki matematiksel yöntemler, sayısal olmayan nesnelerin istatistiklerinde olduğu gibi, ya toplamların (olasılık teorisinin Merkezi Limit Teoremine dayalı olarak) ya da fark göstergelerinin (mesafeler, metrikler) kullanımına dayanır. Genellikle sadece asimptotik sonuçlar kesin olarak doğrulanır. Günümüzde bilgisayarlar matematiksel istatistiklerde büyük rol oynamaktadır. Hem hesaplamalar hem de simülasyon modellemesi için kullanılırlar (özellikle örnekleme yöntemlerinde ve asimptotik sonuçların uygunluğunun incelenmesinde).

Matematiksel istatistiklerin temel kavramları

2.1 Örnekleme yönteminin temel kavramları

Rastgele bir deneyde gözlemlenen bir rastgele değişken olsun. Olasılık uzayının verildiği varsayılır (ve bizi ilgilendirmeyecektir).

Bu deneyi aynı koşullar altında bir kez gerçekleştirdikten sonra, bu rastgele değişkenin sayılarını , , , - birinci, ikinci vb. deneyler. Rastgele bir değişken, kısmen veya tamamen bizim için bilinmeyen bir dağılıma sahiptir.

Örnek adı verilen bir kümeye daha yakından bakalım.

Halihazırda gerçekleştirilmiş bir dizi deneyde, bir örnek bir sayı kümesidir. Ancak bu deney dizisi tekrar tekrarlanırsa, bu küme yerine yeni bir sayı kümesi elde ederiz. Bir sayı yerine, rastgele bir değişkenin değerlerinden biri olan başka bir sayı görünecektir. Yani (ve , ve , vb.) rastgele değişken ile aynı değerleri alabilen ve aynı sıklıkta (aynı olasılıklarla) bir değişkendir. Bu nedenle, deneyden önce - ile eşit olarak dağılmış bir rastgele değişken ve deneyden sonra - bu ilk deneyde gözlemlediğimiz sayı, yani. rastgele değişkenin olası değerlerinden biri.

Hacim örneği, ve gibi bir dağılıma sahip, bağımsız ve özdeş olarak dağıtılmış rastgele değişkenler ("kopyalar") kümesidir.

“Bir örnekten dağılım hakkında bir sonuç çıkarmak” ne anlama geliyor? Dağılım, bir dağılım fonksiyonu, yoğunluk veya tablo, bir dizi sayısal özellik - , , vb. ile karakterize edilir. Örneğe dayanarak, tüm bu özellikler için yaklaşımlar oluşturabilmelidir.

.2 Örnekleme

Numunenin bir temel sonuç üzerinde uygulanmasını düşünün - bir dizi sayı , , . Uygun bir olasılık uzayında, içinde olasılıklar olan, , değerlerini alan bir rastgele değişken tanıtıyoruz (eğer bazı değerler çakışıyorsa, olasılıkları karşılık gelen sayıda ekliyoruz). Olasılık dağılım tablosu ve rastgele değişken dağılım işlevi şöyle görünür:

Bir miktarın dağılımına ampirik veya örnek dağılım denir. Bir niceliğin matematiksel beklentisini ve varyansını hesaplayalım ve bu niceliklerin gösterimini verelim:

Aynı şekilde sipariş anını da hesaplıyoruz.

Genel durumda, miktarla belirtiriz

Tarafımızdan tanıtılan tüm özellikleri oluştururken, örneği , , , , rasgele değişkenler kümesi olarak kabul edersek, bu özelliklerin kendileri - , , , , - rastgele değişkenler haline gelecektir. Bu örnek dağılım özellikleri, gerçek dağılımın karşılık gelen bilinmeyen özelliklerini tahmin etmek (yaklaşık olarak) için kullanılır.

Gerçek dağılımın (veya ) özelliklerini tahmin etmek için dağılımın özelliklerini kullanmanın nedeni, bu dağılımların büyük ölçüde yakın olmasıdır.

Örneğin, normal bir zar atmayı düşünün. İzin vermek - -inci atışta düşen puan sayısı, . Örnekteki bir tanesinin bir, iki - bir kez vb. olacağını varsayalım. Sonra rastgele değişken değerleri alacak 1 , , 6 sırasıyla , olasılıkları ile. Ancak bu oranlar, büyük sayılar yasasına göre büyüme ile yaklaşır. Yani, büyüklük dağılımı bir anlamda doğru kalıp atıldığında düşen noktaların sayısının gerçek dağılımına yaklaşır.

Numunenin yakınlığı ve gerçek dağılımların ne anlama geldiğini belirtmeyeceğiz. Aşağıdaki paragraflarda, yukarıda tanıtılan özelliklerin her birine daha yakından bakacağız ve artan örneklem büyüklüğü ile davranışı da dahil olmak üzere özelliklerini inceleyeceğiz.

.3 Ampirik dağılım fonksiyonu, histogram

Bilinmeyen dağılım, örneğin dağılım fonksiyonu ile tanımlanabileceğinden, bu fonksiyon için örnekten bir “tahmin” oluşturacağız.

Tanım 1.

Bir hacim örneğine dayanan ampirik bir dağılım fonksiyonuna denir. rastgele işlev, her eşit için

Hatırlatma: rastgele işlev

olay göstergesi denir. Her biri için bu, parametreli bir Bernoulli dağılımına sahip rastgele bir değişkendir. Neden?

Başka bir deyişle, rastgele değişkenin 'den küçük olmasının gerçek olasılığına eşit olan herhangi bir değer için, daha küçük örnek öğelerin oranı tahmin edilir.

Örnek elemanlar , , artan düzende sıralanırsa (her temel sonuca göre), varyasyon serisi adı verilen yeni bir rastgele değişken seti elde edilir:

, öğesi varyasyon serisinin th üyesi veya th mertebeden istatistik olarak adlandırılır .

örnek 1

Örneklem:

Varyasyon serisi:

Pirinç. bir.örnek 1

Ampirik dağılım fonksiyonu, örnek noktalarda atlamalara sahiptir, noktadaki atlama değeri, ile eşleşen örnek öğelerin sayısıdır.

inşa edilebilir ampirik fonksiyon varyasyon serisine göre dağılım:

Dağılımın bir başka özelliği de tablodur (için ayrık dağılımlar) veya yoğunluk (kesinlikle sürekli için). Bir tablonun veya yoğunluğun ampirik veya seçici bir analogu, sözde histogramdır.

Histogram, gruplandırılmış verilere dayanmaktadır. Rastgele bir değişkenin (veya örnek veri aralığının) tahmini değer aralığı, numuneden bağımsız olarak belirli sayıda aralığa bölünür (mutlaka aynı değildir). Gruplama aralıkları adı verilen satırdaki aralıklar olsun. Aralığa giren örnek elemanların sayısı ile gösterelim:

(1)

Aralıkların her birinde, alanı orantılı olan bir dikdörtgen inşa edilir. Tüm dikdörtgenlerin toplam alanı bire eşit olmalıdır. Aralığın uzunluğu olsun. Yukarıdaki dikdörtgenin yüksekliği

Ortaya çıkan şekle histogram denir.

Örnek 2

Mevcut varyasyon serisi(bkz. örnek 1):

İşte ondalık logaritma, bu nedenle, yani. örnek iki katına çıkarıldığında, gruplama aralıklarının sayısı 1 artar. Ancak, mertebesindeki aralıkların sayısını alırsak, o zaman büyüme ile histogram yoğunluğa yaklaşmaz.

Aşağıdaki ifade doğrudur:

Örnek yoğunluğu ise sürekli fonksiyon, daha sonra , histogramın olasılığında yoğunluğa noktasal yakınsama gerçekleşir.

Dolayısıyla logaritma seçimi mantıklıdır, ancak mümkün olan tek seçenek değildir.

Çözüm

Matematiksel (veya teorik) istatistik, olasılık teorisinin yöntem ve kavramlarına dayanır, ancak bir anlamda ters problemleri çözer.

İki (veya daha fazla) işaretin eşzamanlı tezahürünü gözlemlersek, yani. birkaç rastgele değişkenden oluşan bir dizi değere sahibiz - bağımlılıkları hakkında ne söylenebilir? O orada mı, değil mi? Ve eğer öyleyse, bu bağımlılık nedir?

"Kara kutuda" gizlenen dağılım veya özellikleri hakkında bazı varsayımlarda bulunmak çoğu zaman mümkündür. Bu durumda deneysel verilere göre bu varsayımların (“hipotezler”) doğrulanması veya çürütülmesi gerekmektedir. Aynı zamanda, "evet" veya "hayır" cevabının ancak belirli bir kesinlikle verilebileceğini ve deneyi ne kadar uzun süre devam ettirebilirsek, sonuçların o kadar doğru olabileceğini hatırlamalıyız. Araştırma için en uygun durum, gözlemlenen deneyin bazı özellikleri hakkında - örneğin, gözlemlenen nicelikler arasında işlevsel bir bağımlılığın varlığı, dağılımın normalliği, simetrisi, varlığı hakkında - güvenle iddia edilebildiği zamandır. dağılımdaki yoğunluk veya ayrık doğası vb.

Bu nedenle, eğer (matematiksel) istatistikleri hatırlamak mantıklıdır:

özellikleri kısmen veya tamamen bilinmeyen rastgele bir deney var,

Bu deneyi aynı koşullar altında bazı (veya daha iyisi, herhangi bir) sayıda yeniden üretebiliriz.

bibliyografya

1. Baumol W. Ekonomik teori ve yöneylem araştırması. - M.; Bilim, 1999.

2. Bolşev L.N., Smirnov N.V. Matematiksel istatistik tabloları. Moskova: Nauka, 1995.

3. Borovkov A.A. Matematik istatistikleri. Moskova: Nauka, 1994.

4. Korn G., Korn T. Bilim adamları ve mühendisler için matematik el kitabı. - St. Petersburg: Lan Yayınevi, 2003.

5. Korshunov D.A., Chernova N.I. Matematiksel istatistikte görev ve alıştırmaların toplanması. Novosibirsk: Matematik Enstitüsü Yayınevi. SL Sobolev SB RAS, 2001.

6. Peheletsky kimliği Matematik: öğrenciler için ders kitabı. - M.: Akademi, 2003.

7. Sukhodolsky V.G. Beşeri bilimler için yüksek matematik dersleri. - St. Petersburg Yayınevi, St. Petersburg Devlet Üniversitesi. 2003

8. Feller V. Olasılık teorisine giriş ve uygulamaları. - M.: Mir, T.2, 1984.

9. Harman G., Modern faktör analizi. - M.: İstatistikler, 1972.


Harman G., Modern faktör analizi. - M.: İstatistikler, 1972.

Matematiksel istatistik, matematik gibi bir bilimin ana bölümlerinden biridir ve belirli verileri işlemek için yöntem ve kuralları inceleyen bir dalıdır. Başka bir deyişle, örnek anketlerine dayalı olarak, aynı nesnelerden oluşan geniş koleksiyonların doğasında bulunan kalıpları ortaya çıkarmanın yollarını araştırır.

Bir görev bu bölüm Elde edilen sonuçlara dayalı olarak, gelişen olayların doğası hakkında olasılığı tahmin etmek veya belirli bir karar vermek için yöntemler oluşturmaktan oluşur. Verileri tanımlamak için tablolar, çizelgeler ve korelasyon alanları kullanılır. nadiren uygulanır.

Matematiksel istatistikler bilimin çeşitli alanlarında kullanılmaktadır. Örneğin, homojen olgu ve nesne kümeleri hakkındaki bilgileri işlemek ekonomi için önemlidir. Endüstri, personel, kar verileri vb. Tarafından üretilen ürünler olabilirler. Gözlem sonuçlarının matematiksel doğasına bağlı olarak, sayıların istatistiklerini, sayısal olmayan nitelikteki işlevlerin ve nesnelerin analizini ve çok boyutlu olarak ayırt edilebilir. analiz. Ayrıca, genel ve özel (bağımlılıkların restorasyonu, sınıflandırmaların kullanımı, seçici çalışmalar ile ilgili) görevleri dikkate alırlar.

Bazı ders kitaplarının yazarları matematiksel istatistik teorisinin olasılık teorisinin sadece bir bölümü olduğuna inanırken, diğerleri onun kendi amaçları, amaçları ve yöntemleri ile bağımsız bir bilim olduğuna inanmaktadır. Ancak, her durumda, kullanımı çok kapsamlıdır.

Bu nedenle, matematiksel istatistikler en açık şekilde psikolojide uygulanabilir. Kullanımı, uzmanın doğru bir şekilde kanıtlamasına, veriler arasındaki ilişkiyi bulmasına, genelleştirmesine, birçok mantıksal hatadan kaçınmasına ve çok daha fazlasına izin verecektir. Şunu veya bu psikolojik fenomeni veya kişilik özelliğini hesaplama prosedürleri olmadan ölçmenin genellikle imkansız olduğuna dikkat edilmelidir. Bu, bu bilimin temellerinin gerekli olduğunu göstermektedir. Başka bir deyişle, olasılık teorisinin kaynağı ve temeli olarak adlandırılabilir.

İstatistiksel verilerin dikkate alınmasına dayanan araştırma yöntemi diğer alanlarda kullanılmaktadır. Bununla birlikte, farklı bir köken doğasına sahip nesnelere uygulandığında özelliklerinin her zaman benzersiz olduğu hemen belirtilmelidir. Bu nedenle, fizik bilimini tek bir bilimde birleştirmenin bir anlamı yoktur. Ortak özellikler Bu method belirli bir gruba dahil olan belirli sayıda nesneyi saymaya ve dağılımı incelemeye indirgenir. nicel özellikler ve belirli sonuçlara ulaşmak için olasılık teorisinin uygulanması.

Matematiksel istatistiklerin unsurları fizik, astronomi vb. alanlarda kullanılır. Burada, özelliklerin ve parametrelerin değerleri, iki örnekte herhangi bir özelliğin çakışması hakkında hipotezler, dağılımın simetrisi hakkında ve çok daha fazlası olabilir. düşünülen.

Matematiksel istatistikler bunların uygulanmasında önemli bir rol oynar ve amaçları genellikle hipotezleri tahmin etmek ve test etmek için yeterli yöntemler oluşturmaktır. Şu anda, bilgisayar teknolojileri bu bilimde büyük önem taşımaktadır. Yalnızca hesaplama sürecini önemli ölçüde basitleştirmeye değil, aynı zamanda çoğaltma için veya pratikte elde edilen sonuçların uygunluğunu incelerken örnekler oluşturmaya da izin verirler.

Genel durumda, matematiksel istatistik yöntemleri iki sonuç çıkarmaya yardımcı olur: ya incelenen verilerin doğası veya özellikleri ve ilişkileri hakkında istenen kararı vermek ya da elde edilen sonuçların sonuç çıkarmak için yeterli olmadığını kanıtlamak.


İçerik.

1. Giriş:
- Olasılık ve matematiksel istatistikler nasıl kullanılır? - sayfa 2
- "Matematiksel istatistik" nedir? - sayfa 3
2) Olasılık teorisi ve matematiksel istatistik uygulama örnekleri:
- Seçim. - sayfa 4
- Değerlendirme görevleri. – sayfa 6
- Olasılıksal-istatistiksel yöntemler ve optimizasyon. – sayfa 7
3) Sonuç.

Giriiş.

Olasılık ve matematiksel istatistikler nasıl kullanılır? Bu disiplinler, olasılıksal-istatistiksel karar verme yöntemlerinin temelidir. Onlardan yararlanmak için matematiksel aparat, karar verme problemlerini olasılıksal-istatistiksel modeller açısından ifade etmek gerekir. Belirli bir olasılıksal-istatistiksel karar verme yönteminin uygulanması üç aşamadan oluşur:
- ekonomik, yönetsel, teknolojik gerçeklikten soyut bir matematiksel ve istatistiksel şemaya geçiş, yani. özellikle istatistiksel kontrol sonuçlarına dayalı olarak bir kontrol sistemi, teknolojik süreç, karar verme prosedürü vb. için olasılıklı bir model oluşturmak.
- olasılıklı bir model çerçevesinde tamamen matematiksel yollarla hesaplamalar yapmak ve sonuçlar elde etmek;
- gerçek bir durumla ilgili olarak matematiksel ve istatistiksel sonuçların yorumlanması ve uygun bir karar verilmesi (örneğin, ürün kalitesinin belirlenmiş gerekliliklere uygunluğu veya uygunsuzluğu, teknolojik süreci ayarlama ihtiyacı vb.), özellikle , sonuçlar (bir partideki kusurlu ürün birimlerinin oranı, teknolojik sürecin kontrollü parametrelerinin dağıtım yasalarının özel biçimi vb.).

Matematiksel istatistik, olasılık teorisinin kavramlarını, yöntemlerini ve sonuçlarını kullanır. Ekonomik, yönetsel, teknolojik ve diğer durumlarda olasılıklı karar verme modelleri oluşturmanın ana konularını ele alalım. Olasılıksal-istatistiksel karar verme yöntemlerine ilişkin normatif-teknik ve öğretici-metodik belgelerin aktif ve doğru kullanımı için ön bilgiye ihtiyaç vardır. Bu nedenle, bir veya başka bir belgenin hangi koşullar altında uygulanması gerektiğini, seçimi ve uygulaması için hangi ilk bilgilere sahip olunması gerektiğini, veri işleme sonuçlarına göre hangi kararların alınması gerektiğini vb. bilmek gerekir.

"Matematiksel istatistik" nedir? Matematiksel istatistik, “istatistiksel verilerin toplanması, sistemleştirilmesi, işlenmesi ve yorumlanmasının yanı sıra bunları bilimsel veya pratik sonuçlar için kullanmaya yönelik matematiksel yöntemlere ayrılmış bir matematik bölümü olarak anlaşılır. Matematiksel istatistiklerin kuralları ve prosedürleri, her bir problemde elde edilen sonuçların doğruluğunu ve güvenilirliğini mevcut istatistiksel materyal temelinde değerlendirmeyi mümkün kılan olasılık teorisine dayanmaktadır. Aynı zamanda, istatistiksel veriler, belirli özelliklere sahip, az ya da çok kapsamlı bir koleksiyondaki nesnelerin sayısı hakkındaki bilgileri ifade eder.

Çözülmekte olan problemlerin türüne göre, matematiksel istatistikler genellikle üç bölüme ayrılır: veri tanımı, tahmin ve hipotez testi.

İşlenen istatistiksel verilerin türüne göre, matematiksel istatistikler dört alana ayrılır:

Bir gözlemin sonucunun gerçek bir sayı ile tanımlandığı tek boyutlu istatistikler (rastgele değişkenlerin istatistikleri);

Bir nesnenin gözlem sonucunun birkaç sayı (vektör) ile tanımlandığı çok değişkenli istatistiksel analiz;

Gözlem sonucunun bir fonksiyon olduğu rastgele süreçlerin ve zaman serilerinin istatistikleri;

Bir gözlemin sonucunun sayısal olmayan bir yapıya sahip olduğu, örneğin bir küme (geometrik bir şekil), bir sıralama veya bir ölçüm sonucu elde edilen sayısal olmayan nitelikteki nesnelerin istatistikleri. niteliksel bir nitelik.

Olasılık teorisi ve matematiksel istatistik uygulama örnekleri.
Olasılıksal-istatistiksel modellerin yönetimsel, endüstriyel, ekonomik ve ulusal ekonomik sorunları çözmek için iyi bir araç olduğu birkaç örneği ele alalım. Yani örneğin lot olarak kullanılan bir madeni para "simetrik" olmalıdır, yani. atıldığında, ortalama olarak, vakaların yarısında arma düşmeli ve vakaların yarısında - kafes (kuyruk, sayı). Ama "ortalama" ne anlama geliyor? Her seride çok sayıda 10 atışlık bir seri harcarsanız, genellikle bir madeni paranın bir arma ile 4 kez düştüğü seriler olacaktır. Simetrik bir madeni para için bu, serinin %20,5'inde gerçekleşecek. Ve 100.000 atış için 40.000 arma varsa, madeni para simetrik olarak kabul edilebilir mi? Karar verme prosedürü, olasılık teorisine ve matematiksel istatistiklere dayanmaktadır.

Söz konusu örnek yeterince ciddi görünmeyebilir. Ancak öyle değil. Çekiliş, endüstriyel fizibilite deneylerinin düzenlenmesinde yaygın olarak kullanılır, örneğin, çeşitli teknolojik faktörlere (koruma ortamının etkisi, ölçüm öncesi yatak hazırlama yöntemleri, ölçüm sürecinde yatak yükünün etkisi, vb.) P.). Farklı koruyucu yağlarda, yani; A ve B bileşimindeki yağlarda. Böyle bir deney planlanırken, hangi yatakların A yağ bileşimine ve hangilerinin - yağ bileşimi B'ye, ancak öznelliği önleyecek ve nesnelliği sağlayacak şekilde yerleştirilmesi gerektiği sorusu ortaya çıkar. karar.

Örneklem
Bu sorunun cevabı kura çekilerek alınabilir. Benzer bir örnek herhangi bir ürünün kalite kontrolü ile verilebilir. Denetlenen bir ürün partisinin belirlenmiş gereksinimleri karşılayıp karşılamadığına karar vermek için, ondan bir numune alınır. Numune kontrolünün sonuçlarına dayanarak, tüm parti hakkında bir sonuca varılır. Bu durumda numunenin oluşumunda öznellikten kaçınmak çok önemlidir, yani kontrollü partideki her bir ürün biriminin numunede aynı seçilme olasılığına sahip olması gerekir. Üretim koşulları altında, numunedeki üretim birimlerinin seçimi genellikle parti ile değil, özel rasgele sayı tabloları veya bilgisayar rasgele sayı üreteçleri yardımıyla gerçekleştirilir.
Üretim, ücretlendirme, ihale ve yarışmalar düzenlerken, boş pozisyonlar için adayları seçerken, vb. Her yerde bir piyango veya benzeri prosedürlere ihtiyacınız var. Olimpik sisteme göre bir turnuva düzenlemede en güçlü ve en güçlü ikinci takımı belirleme örneğini kullanarak açıklayalım (kaybeden elenir). Bırakın güçlü olan takım her zaman zayıf olana galip gelsin. En güçlü takımın kesinlikle şampiyon olacağı açıktır. İkinci en güçlü takım, ancak ve ancak finalden önce geleceğin şampiyonu ile maçı yoksa finale çıkacaktır. Böyle bir oyun planlanırsa, en güçlü ikinci takım finale çıkamaz. Turnuvayı planlayan kişi, turnuvadaki en güçlü ikinci takımı programdan önce "nakavt edebilir", liderle ilk görüşmede onu aşağı indirebilir veya ikinci sırayı garantileyerek finale kadar daha zayıf takımlarla toplantılar sağlayabilir. Öznellikten kaçınmak için kura çekin. 8 takımlı bir turnuva için, en güçlü iki takımın finalde karşılaşma olasılığı 4/7'dir. Buna göre, 3/7 olasılıkla ikinci en güçlü takım turnuvayı planlanandan önce terk edecek.
Ürün birimlerinin herhangi bir ölçümünde (kumpas, mikrometre, ampermetre vb. kullanılarak) hatalar vardır. Sistematik hataların olup olmadığını anlamak için, özellikleri bilinen bir üretim biriminin (örneğin standart bir numune) tekrarlanan ölçümlerini yapmak gerekir. Unutulmamalıdır ki sistematik hatanın yanında rastgele bir hata da vardır.

Bu nedenle, sistematik bir hata olup olmadığının ölçüm sonuçlarından nasıl öğrenileceği sorusu ortaya çıkmaktadır. Sadece bir sonraki ölçüm sırasında elde edilen hatanın pozitif mi yoksa negatif mi olduğunu not edersek, bu sorun bir öncekine indirgenebilir. Gerçekten de, ölçümü bir madeni para atmakla, pozitif hatayı - armanın kaybıyla, negatifi - kafesle karşılaştıralım (ölçeğin yeterli sayıda bölünmesiyle sıfır hata neredeyse hiç oluşmaz). Daha sonra sistematik bir hatanın olmadığını kontrol etmek, madalyonun simetrisini kontrol etmekle eşdeğerdir.

Bu düşüncelerin amacı, sistematik bir hatanın yokluğunu kontrol etme problemini, bir madeni paranın simetrisini kontrol etme problemine indirgemektir. Yukarıdaki akıl yürütme, matematiksel istatistiklerde sözde "işaret ölçütü"ne yol açar.
"İşaret testi" - örneğin p=1/2 parametresiyle binom dağılımına uyduğuna dair boş hipotezi test etmenize izin veren istatistiksel bir test. İşaret testi, medyanın belirli bir değere (özellikle sıfıra) eşit olduğu hipotezini ve ayrıca birbirine bağlı iki örnekte bir kayma olmaması (işleme etkisi yok) hipotezini test etmek için parametrik olmayan istatistiksel bir test olarak kullanılabilir. Ayrıca, dağılım simetrisi hipotezini test etmenize izin verir, ancak bunun için daha güçlü kriterler vardır - tek örnek Wilcoxon testi ve modifikasyonları.

Matematiksel istatistik yöntemlerine dayanan teknolojik süreçlerin istatistiksel olarak düzenlenmesinde, teknolojik süreçlerdeki düzensizliğin zamanında tespit edilmesini ve bunları düzeltmek ve ürünlerin serbest bırakılmasını önlemek için önlemler almayı amaçlayan süreçlerin istatistiksel kontrolü için kurallar ve planlar geliştirilir. belirlenmiş gereksinimleri karşılamıyor. Bu önlemler, üretim maliyetlerini ve düşük kaliteli ürünlerin tedarikinden kaynaklanan kayıpları azaltmayı amaçlamaktadır. İstatistiksel kabul kontrolü ile, matematiksel istatistik yöntemlerine dayalı olarak, ürün partilerinden numuneler analiz edilerek kalite kontrol planları geliştirilir. Zorluk, yukarıda sorulan soruları yanıtlamanın mümkün olduğu temelinde, olasılıksal-istatistiksel karar verme modellerini doğru bir şekilde oluşturabilmekte yatmaktadır. Matematiksel istatistiklerde, bunun için hipotezleri test etmek için olasılıksal modeller ve yöntemler geliştirilmiştir, özellikle kusurlu üretim birimlerinin oranının belirli bir p0 sayısına eşit olduğu hipotezleri, örneğin, p0 = 0.23.

Değerlendirme görevleri.
Bir dizi yönetimsel, endüstriyel, ekonomik, ulusal ekonomik durumda, farklı türde sorunlar ortaya çıkar - olasılık dağılımlarının özelliklerini ve parametrelerini tahmin etme sorunları.

Bir örnek düşünün. Kontrole bir grup N elektrik lambası gelsin. Bu partiden rastgele n adet elektrik lambası örneği seçildi. Bir dizi doğal soru ortaya çıkıyor. Örnek elemanların test sonuçlarından elektrik lambalarının ortalama hizmet ömrü nasıl belirlenebilir ve bu özellik hangi doğrulukla tahmin edilebilir? Daha büyük bir örnek alınırsa doğruluk nasıl değişir? Elektrik lambalarının en az %90'ının T veya daha fazla saat dayanacağı kaç saatte T garanti edilebilir?

Diyelim ki n adet elektrik lambası örneğini test ederken, X adet elektrik lambası arızalı çıktı. Sonra aşağıdaki sorular ortaya çıkıyor. Bir partideki arızalı elektrik lambalarının D sayısı, kusurluluk D/N seviyesi vb. için hangi sınırlar belirlenebilir?

Veya teknolojik süreçlerin doğruluğunun ve kararlılığının istatistiksel bir analizinde, kontrol edilen parametrenin ortalama değeri ve söz konusu süreçte yayılma derecesi gibi kalite göstergelerini değerlendirmek gerekir. Olasılık teorisine göre, matematiksel beklentisini rastgele bir değişkenin ortalama değeri olarak ve yayılımın istatistiksel bir özelliği olarak varyans, standart sapma veya varyasyon katsayısının kullanılması tavsiye edilir. Bu şu soruyu gündeme getiriyor: Bu istatistiksel özellikler örnek verilerden nasıl tahmin edilir ve bu hangi doğrulukla yapılabilir? Buna benzer birçok örnek var. Burada istatistiksel ürün kalite yönetimi alanında kararlar alınırken olasılık teorisi ve matematiksel istatistiklerin üretim yönetiminde nasıl kullanılabileceğini göstermek önemliydi.

Olasılıksal-istatistiksel yöntemler ve optimizasyon. Optimizasyon fikri, modern uygulamalı matematiksel istatistiklere ve diğer istatistiksel yöntemlere nüfuz eder. Yani, deneyleri planlama yöntemleri, istatistiksel kabul kontrolü, teknolojik süreçlerin istatistiksel kontrolü vb. Öte yandan, karar teorisindeki optimizasyon formülasyonları, örneğin, ürün kalitesini ve standart gereksinimleri optimize etme uygulamalı teorisi, yaygın olarak kullanılmasını sağlar. olasılıksal-istatistiksel yöntemler, öncelikle uygulamalı matematiksel istatistikler.

Özellikle üretim yönetiminde, ürün kalitesi ve standart gereksinimleri optimize edilirken, ilk aşamada istatistiksel yöntemlerin uygulanması özellikle önemlidir. yaşam döngüsüürünler, yani deneysel tasarım geliştirmelerinin araştırma hazırlığı aşamasında (ürünler için umut verici gereksinimlerin geliştirilmesi, ön tasarım, deneysel tasarım geliştirme için referans şartları). Bunun nedeni, ürün yaşam döngüsünün ilk aşamasında mevcut olan sınırlı bilgi ve gelecek için teknik olasılıkları ve ekonomik durumu tahmin etme ihtiyacıdır. Bir optimizasyon problemini çözmenin tüm aşamalarında istatistiksel yöntemler uygulanmalıdır - değişkenleri ölçeklerken, ürün ve sistemlerin işleyişi için matematiksel modeller geliştirirken, teknik ve ekonomik deneyler yaparken vb.

Ürün kalitesinin optimizasyonu ve standart gereksinimleri de dahil olmak üzere optimizasyon problemlerinde, istatistiklerin tüm alanları kullanılır. Yani, rastgele değişkenlerin istatistikleri, çok değişkenli istatistiksel analiz, rastgele süreçlerin ve zaman serilerinin istatistikleri, sayısal olmayan nesnelerin istatistikleri. Spesifik verilerin analizi için istatistiksel bir yöntem seçimi önerilere göre yapılmalıdır.

Çözüm.
AT
vb.................

Rastgele fenomenler alanındaki her araştırma, her zaman deneye, deneysel verilere dayanır. Bir nesnenin herhangi bir özelliği incelenirken toplanan sayısal verilere denir. istatistiksel. İstatistiksel veriler, çalışmanın ilk materyalidir. Bilimsel veya pratik değere sahip olmaları için matematiksel istatistik yöntemleriyle işlenmeleri gerekir.

Matematik istatistikleri büyük rastgele olayların gözlemleri sonucunda elde edilen istatistiksel deneysel verilerin kaydedilmesi, tanımlanması ve analiz edilmesi için yöntemlerin geliştirilmesi olan bilimsel bir disiplindir.

Matematiksel istatistiklerin ana görevleri şunlardır:

    bir rastgele değişkenin veya bir rastgele değişkenler sisteminin dağılım yasasının belirlenmesi;

    hipotezlerin makullüğünü test etmek;

    bilinmeyen dağılım parametrelerinin belirlenmesi.

Tüm matematiksel istatistik yöntemleri, olasılık teorisine dayanmaktadır. Bununla birlikte, çözülmekte olan problemlerin özgüllüğü nedeniyle, matematiksel istatistik, olasılık teorisinden bağımsız bir alana ayrılmıştır. Olasılık teorisinde olgunun modelinin verildiği kabul edilir ve bu olgunun olası gerçek seyri hesaplanır (Şekil 1), o zaman matematiksel istatistikte istatistiksel verilere dayalı olarak uygun bir olasılıksal model seçilir (Şekil 2). ).

Şekil 1. Olasılık teorisinin genel problemi

İncir. 2. Matematiksel istatistiklerin genel problemi

Bilimsel bir disiplin olarak matematiksel istatistik, olasılık teorisi ile birlikte gelişmiştir. Bu bilimin matematiksel aygıtı 19. yüzyılın ikinci yarısında inşa edildi.

2. Genel popülasyon ve örneklem.

İstatistiksel yöntemleri incelemek için genel ve örnek popülasyon kavramları tanıtılır. Genel olarak, altında Genel popülasyon dağıtım fonksiyonu ile X rastgele değişkeni olarak anlaşılır
. Belirli bir rasgele değişken X için bir numune seti veya bir hacim numunesi bir kümedir.
bu miktarın bağımsız gözlemleri, nerede rasgele değişken X'in örnek değeri veya uygulaması olarak adlandırılır. Böylece, örneklemden örneğe değiştiği için sayı (deney yapılmışsa ve örnek alınmışsa) ve rastgele değişkenler (deneyden önce) olarak kabul edilebilir.

örnek 1. Bir ağaç gövdesinin kalınlığının yüksekliğine bağlılığını belirlemek için 200 ağaç seçildi. Bu durumda örneklem büyüklüğü n=200'dür.

Örnek 2 Daire testere üzerinde yonga levhaların kesilmesi sonucunda, spesifik kesme işinin 15 değeri elde edildi. Bu durumda, n=15.

D
Örneklem verilerine göre ilgilendiğimiz genel popülasyonun özelliğini güvenle yargılayabilmek için, örneğin nesnelerinin onu doğru bir şekilde temsil etmesi, yani örneklemin doğru bir şekilde temsil edilmesi gerekir. temsilci(temsilci). Numunenin temsil edilebilirliği genellikle nesnelerin rastgele seçilmesiyle sağlanır: genel popülasyonun her bir nesnesine, diğerleriyle birlikte örneğe dahil edilme olasılığı eşittir.

Şek. 3. Örneklemin temsil edilebilirliğinin gösterilmesi