Olasılık ve matematiksel istatistikler nasıl kullanılır? Bu disiplinler, olasılıksal-istatistiksel yöntemlerin temelidir. karar verme. Matematiksel aygıtlarını kullanmak için görevlere ihtiyacınız var karar verme olasılıksal-istatistiksel modeller cinsinden ifade eder. Belirli bir olasılıksal-istatistiksel yöntemin uygulanması karar vermeüç aşamadan oluşur:

  • ekonomik, yönetsel, teknolojik gerçeklikten soyut bir matematiksel ve istatistiksel şemaya geçiş, yani. bir kontrol sisteminin, bir teknolojik sürecin olasılıksal bir modelini oluşturmak, karar verme prosedürleri, özellikle istatistiksel kontrol sonuçlarına göre vb.;
  • olasılıksal bir model çerçevesinde tamamen matematiksel yollarla hesaplamalar yapmak ve sonuçlar elde etmek;
  • gerçek bir durumla ilgili olarak matematiksel ve istatistiksel sonuçların yorumlanması ve uygun bir karar verilmesi (örneğin, ürün kalitesinin belirlenmiş gerekliliklere uygunluğu veya uygunsuzluğu, teknolojik süreci ayarlama ihtiyacı vb.), özellikle, sonuçlar (bir partideki kusurlu ürün birimlerinin oranı, belirli dağıtım yasaları biçimi hakkında) kontrollü parametreler teknolojik süreç, vb.)

Matematiksel istatistik, olasılık teorisinin kavramlarını, yöntemlerini ve sonuçlarını kullanır. Olasılıksal modeller oluşturmanın ana konularını düşünün karar verme ekonomik, yönetsel, teknolojik ve diğer durumlarda. Olasılıksal-istatistiksel yöntemlere ilişkin normatif-teknik ve öğretici-metodik belgelerin aktif ve doğru kullanımı için karar vermeön bilgi gereklidir. Bu nedenle, bir veya başka bir belgenin hangi koşullar altında uygulanması gerektiğini, seçimi ve uygulaması için hangi ilk bilgilere sahip olunması gerektiğini, veri işleme sonuçlarına göre hangi kararların alınması gerektiğini vb. bilmek gerekir.

Olasılık teorisi ve matematiksel istatistik uygulama örnekleri. Olasılıksal-istatistiksel modellerin yönetimsel, endüstriyel, ekonomik ve ulusal ekonomik sorunları çözmek için iyi bir araç olduğu birkaç örneği ele alalım. Örneğin, A.N.'nin romanında. Strukov, İvan İlyiç'e Tolstoy'un "İşkencelerin arasından yürümek" (cilt 1) diyor ki: "Atölye evliliğin yüzde yirmi üçünü veriyor, siz bu rakama tutunuyorsunuz," dedi.

Bir üretim birimi %23 oranında kusurlu olamayacağından, fabrika yöneticilerinin konuşmasında bu sözlerin nasıl anlaşılacağı sorusu ortaya çıkıyor. İyi veya kusurlu olabilir. Belki de Strukov, büyük bir partinin kusurlu birimlerin yaklaşık %23'ünü içerdiğini kastetmişti. Sonra soru ortaya çıkıyor, "hakkında" ne anlama geliyor? Test edilen 100 ürün biriminden 30'unun kusurlu veya 1000-300'den veya 100.000-30000'den vb. Çıkmasına izin verin, Strukov yalan söylemekle suçlanmalı mı?

Veya başka bir örnek. Lot olarak kullanılan jeton "simetrik" olmalıdır, yani. atıldığında, ortalama olarak, vakaların yarısında arma düşmeli ve vakaların yarısında - kafes (kuyruk, sayı). Ama "ortalama" ne anlama geliyor? Her seride çok sayıda 10 atışlık bir seri harcarsanız, genellikle bir madeni paranın bir arma ile 4 kez düştüğü seriler olacaktır. Simetrik bir madeni para için bu, serinin %20,5'inde gerçekleşecek. Ve 100.000 atış için 40.000 arma varsa, madeni para simetrik olarak kabul edilebilir mi? prosedür karar verme olasılık teorisine ve matematiksel istatistiklere dayanmaktadır.

Söz konusu örnek yeterince ciddi görünmeyebilir. Ancak öyle değil. Endüstriyel fizibilite deneylerinin organizasyonunda, örneğin, çeşitli teknolojik faktörlere (koruma ortamının etkisi, ölçüm öncesi rulman hazırlama yöntemleri) bağlı olarak rulmanların kalite indeksini (sürtünme momenti) ölçme sonuçları işlenirken, lot çizimi yaygın olarak kullanılmaktadır. , ölçüm sürecinde rulman yükünün etkisi vb.) P.). Farklı koruyucu yağlarda, yani; bileşim yağlarında ve . Böyle bir deney planlanırken, bileşim yağına hangi yatakların ve hangilerinin - bileşim yağına, ancak öznellikten kaçınacak ve kararın nesnelliğini sağlayacak şekilde yerleştirilmesi gerektiği sorusu ortaya çıkar.

Bu sorunun cevabı kura çekilerek alınabilir. Benzer bir örnek herhangi bir ürünün kalite kontrolü ile verilebilir. Örnekleme, denetlenen bir ürün partisinin belirtilen gereksinimleri karşılayıp karşılamadığına karar vermek için yapılır. Numune kontrolünün sonuçlarına dayanarak, tüm parti hakkında bir sonuca varılır. Bu durumda, örneğin oluşumunda öznellikten kaçınmak çok önemlidir, yani. kontrol edilen partideki her bir ürün biriminin numunede aynı seçilme olasılığına sahip olması gerekir. Üretim koşulları altında, numunedeki üretim birimlerinin seçimi genellikle parti ile değil, özel rasgele sayı tablolarıyla veya bilgisayar rasgele sayı üreteçlerinin yardımıyla gerçekleştirilir.

Farklı şemaları karşılaştırırken, karşılaştırmanın nesnelliğini sağlamada benzer sorunlar ortaya çıkar. üretim organizasyonu, ücretlendirme, ihale ve yarışmalar sırasında, boş pozisyonlar için aday seçimi vb. Her yerde bir piyango veya benzeri prosedürlere ihtiyacınız var. Olimpik sisteme göre bir turnuva düzenlerken en güçlü ve ikinci en güçlü takımları belirleme örneği ile açıklayalım (kaybeden elenir). Bırakın güçlü olan takım her zaman zayıf olana galip gelsin. En güçlü takımın kesinlikle şampiyon olacağı açıktır. İkinci en güçlü takım, ancak ve ancak finalden önce geleceğin şampiyonu ile maçı yoksa finale çıkacaktır. Böyle bir oyun planlanırsa, en güçlü ikinci takım finale çıkamaz. Turnuvayı planlayan kişi, liderle ilk görüşmede turnuvanın en güçlü ikinci takımını önceden "nakavt edebilir" veya ikinci sırayı garantileyerek finale kadar daha zayıf takımlarla buluşmasını sağlayabilir. Öznellikten kaçınmak için kura çekin. 8 takımlı bir turnuva için, en güçlü iki takımın finalde karşılaşma olasılığı 4/7'dir. Buna göre, 3/7 olasılıkla ikinci en güçlü takım turnuvayı planlanandan önce terk edecek.

Ürün birimlerinin herhangi bir ölçümünde (kumpas, mikrometre, ampermetre vb. kullanılarak) hatalar vardır. Sistematik hataların olup olmadığını anlamak için özellikleri bilinen bir ürün biriminin (örneğin standart bir numune) tekrarlanan ölçümlerinin yapılması gerekir. Unutulmamalıdır ki sistematik hatanın yanında rastgele bir hata da vardır.

Bu nedenle, ölçüm sonuçlarından sistematik bir hata olup olmadığının nasıl öğrenileceği sorusu ortaya çıkmaktadır. Sadece bir sonraki ölçüm sırasında elde edilen hatanın pozitif mi yoksa negatif mi olduğunu not edersek, bu sorun bir öncekine indirgenebilir. Aslında, ölçümü bir madeni para atmakla, pozitif hatayı - armanın kaybıyla, negatifi - kafesle karşılaştıralım (ölçeğin yeterli sayıda bölünmesiyle sıfır hata neredeyse hiç oluşmaz). Daha sonra sistematik bir hatanın olmadığını kontrol etmek, madalyonun simetrisini kontrol etmekle eşdeğerdir.

Bu düşüncelerin amacı, sistematik bir hatanın yokluğunu kontrol etme problemini, bir madeni paranın simetrisini kontrol etme problemine indirgemektir. Yukarıdaki akıl yürütme, matematiksel istatistiklerde sözde "işaret ölçütü"ne yol açar.

Teknolojik süreçlerin istatistiksel olarak düzenlenmesinde, matematiksel istatistik yöntemlerine dayanarak, teknolojik süreçlerdeki düzensizliğin zamanında tespit edilmesini, bunları ayarlamak ve ürünlerin serbest bırakılmasını önlemek için önlemler almayı amaçlayan süreçlerin istatistiksel kontrolü için kurallar ve planlar geliştirilir. belirlenmiş gereksinimleri karşılamıyor. Bu önlemler, üretim maliyetlerini ve düşük kaliteli ürünlerin tedarikinden kaynaklanan kayıpları azaltmayı amaçlamaktadır. İstatistiksel kabul kontrolü ile, matematiksel istatistik yöntemlerine dayalı olarak, ürün partilerinden numuneler analiz edilerek kalite kontrol planları geliştirilir. Zorluk, olasılıksal-istatistiksel modelleri doğru bir şekilde oluşturabilmekte yatmaktadır. karar verme yukarıdaki sorular buna göre cevaplanabilir. Matematiksel istatistiklerde, bunun için hipotezleri test etmek için olasılıklı modeller ve yöntemler geliştirilmiştir, özellikle, hatalı üretim birimlerinin oranının belirli bir sayıya eşit olduğu hipotezleri, örneğin (A.N.'nin romanından Strukov'un sözlerini hatırlayın). Tolstoy).

Değerlendirme görevleri. Bir dizi yönetimsel, endüstriyel, ekonomik, ulusal ekonomik durumda, farklı türde sorunlar ortaya çıkar - olasılık dağılımlarının özelliklerini ve parametrelerini tahmin etme sorunları.

Bir örnek düşünün. Kontrole bir grup N elektrik lambası gelsin. Bu partiden rastgele n adet elektrik lambası örneği seçildi. Bir dizi doğal soru ortaya çıkıyor. Örnek elemanların test sonuçlarından elektrik lambalarının ortalama hizmet ömrü nasıl belirlenebilir ve bu özellik hangi doğrulukla tahmin edilebilir? Daha büyük bir örnek alınırsa doğruluk nasıl değişecek? Elektrik lambalarının en az %90'ının saatten daha uzun ömürlü olacağı kaç saatte garanti edilebilir?

Bir miktar elektrik lambası ile bir numuneyi test ederken, elektrik lambalarının arızalı olduğu ortaya çıktı. Sonra aşağıdaki sorular ortaya çıkıyor. Bir partideki kusurlu elektrik lambası sayısı, kusur düzeyi vb. için hangi sınırlar belirlenebilir?

Veya teknolojik süreçlerin doğruluğunun ve kararlılığının istatistiksel analizinde, bu tür değerlendirmeleri yapmak gerekir. kalite göstergeleri, ortalama olarak kontrollü parametre ve incelenen süreçte yayılma derecesi. Olasılık teorisine göre, rastgele bir değişkenin ortalama değeri olarak kullanılması tavsiye edilir. beklenen değer ve yayılmanın istatistiksel bir özelliği olarak - dağılım, standart sapma veya varyasyon katsayısı. Bu, şu soruyu gündeme getiriyor: bunların nasıl değerlendirileceği istatistiksel özelliklerörnek verilere göre ve bu hangi doğrulukla yapılabilir? Buna benzer birçok örnek var. Burada istatistiksel ürün kalite yönetimi alanında kararlar alınırken olasılık teorisi ve matematiksel istatistiklerin üretim yönetiminde nasıl kullanılabileceğini göstermek önemliydi.

"Matematiksel istatistik" nedir? Matematiksel istatistik, "istatistiksel verilerin toplanması, sistemleştirilmesi, işlenmesi ve yorumlanmasının yanı sıra bunları bilimsel veya pratik sonuçlar için kullanmanın matematiksel yöntemlerine ayrılmış bir matematik dalı olarak anlaşılır. Matematiksel istatistiklerin kuralları ve prosedürleri, olasılık teorisine dayanır, bu, mevcut istatistiksel materyale dayalı olarak her görevde elde edilen sonuçların doğruluğunu ve güvenilirliğini değerlendirmeyi mümkün kılar" [ [ 2.2], s. 326]. Aynı zamanda, istatistiksel veriler, belirli özelliklere sahip az ya da çok kapsamlı bir koleksiyondaki nesnelerin sayısı hakkındaki bilgileri ifade eder.

Çözülmekte olan problemlerin türüne göre, matematiksel istatistikler genellikle üç bölüme ayrılır: veri tanımı, tahmin ve hipotez testi.

İşlenen istatistiksel verilerin türüne göre, matematiksel istatistikler dört alana ayrılır:

  • bir gözlemin sonucunun gerçek bir sayı ile tanımlandığı tek boyutlu istatistikler (rastgele değişkenlerin istatistikleri);
  • çok boyutlu istatistiksel analiz, nesne üzerindeki gözlemin sonucunun birkaç sayı (vektör) ile tanımlandığı yerde;
  • gözlem sonucunun bir fonksiyon olduğu rastgele süreçlerin ve zaman serilerinin istatistikleri;
  • bir gözlemin sonucunun sayısal olmayan bir yapıya sahip olduğu sayısal olmayan nitelikteki nesnelerin istatistikleri, örneğin, bir küme (geometrik bir şekil), bir sıralama veya bir ölçüm sonucu elde edilen niteliksel bir nitelik.

Tarihsel olarak, sayısal olmayan nesnelerin istatistiklerinin bazı alanları (özellikle, evlilik yüzdesini tahmin etme ve bununla ilgili hipotezleri test etme sorunları) ve tek boyutlu istatistikler ilk ortaya çıkanlardı. Matematiksel aparat onlar için daha basittir, bu nedenle örnekleriyle genellikle matematiksel istatistiklerin ana fikirlerini gösterirler.

Yalnızca bu veri işleme yöntemleri, yani. matematiksel istatistikler, ilgili gerçek fenomen ve süreçlerin olasılıksal modellerine dayanan kanıta dayalıdır. Tüketici davranış modelleri, risklerin ortaya çıkması, teknolojik ekipmanın işleyişi, bir deneyin sonuçlarının elde edilmesi, bir hastalığın seyri vb. Gerçek bir olgunun olasılıksal modeli, eğer incelenen nicelikler ve aralarındaki ilişkiler olasılık teorisi ile ifade ediliyorsa, oluşturulmuş olarak kabul edilmelidir. Gerçekliğin olasılıksal modeline uygunluk, yani. yeterliliği, özellikle hipotezleri test etmek için istatistiksel yöntemler kullanılarak doğrulanır.

İnanılmaz veri işleme yöntemleri keşif amaçlıdır, sınırlı istatistiksel malzeme temelinde elde edilen sonuçların doğruluğunu ve güvenilirliğini değerlendirmeyi mümkün kılmadıkları için yalnızca ön veri analizinde kullanılabilirler.

olasılıksal ve istatistiksel yöntemler bir fenomen veya sürecin olasılıksal bir modelini oluşturmanın ve doğrulamanın mümkün olduğu her yerde uygulanabilir. Numune verilerinden elde edilen sonuçlar tüm popülasyona aktarıldığında (örneğin, bir numuneden tüm ürün serisine) bunların kullanımı zorunludur.

Belirli uygulamalarda, olasılıksal olarak kullanılırlar. istatistiksel yöntemler geniş uygulama yanı sıra belirli olanlar. Örneğin, ürün kalite kontrolünün istatistiksel yöntemlerine ayrılmış üretim yönetimi bölümünde, uygulamalı matematiksel istatistikler (deneylerin tasarımı dahil) kullanılır. Yöntemleri yardımıyla, istatistiksel analiz teknolojik süreçlerin doğruluğu ve kararlılığı ve istatistiksel değerlendirme kalite. Spesifik yöntemler, ürün kalitesinin istatistiksel kabul kontrolünü, teknolojik süreçlerin istatistiksel düzenlemesini, güvenilirliğin değerlendirilmesini ve kontrolünü vb. içerir.

Güvenilirlik teorisi ve kuyruk teorisi gibi uygulamalı olasılıksal-istatistiksel disiplinler yaygın olarak kullanılmaktadır. Bunlardan ilkinin içeriği başlıktan açıktır, ikincisi rastgele zamanlarda çağrı alan bir telefon santrali gibi sistemlerin incelenmesiyle ilgilidir - telefonlarında numara çeviren abonelerin gereksinimleri. Bu gereksinimlerin hizmet süresi, yani. konuşmaların süresi de rastgele değişkenler tarafından modellenir. Bu disiplinlerin gelişimine büyük katkı, SSCB Bilimler Akademisi Sorumlu Üyesi A.Ya. Khinchin (1894-1959), Ukrayna SSR B.V. Gnedenko (1912-1995) ve diğer yerli bilim adamları.

Kısaca matematiksel istatistiklerin tarihi hakkında. Bir bilim olarak matematiksel istatistik, olasılık teorisine dayanarak araştıran ve doğrulayan ünlü Alman matematikçi Carl Friedrich Gauss'un (1777-1855) çalışmalarıyla başlar. en küçük kareler yöntemi, 1795'te onun tarafından yaratıldı ve astronomik verileri işlemek için kullanıldı (küçük gezegen Ceres'in yörüngesini iyileştirmek için). En popüler olasılık dağılımlarından biri olan normal olan genellikle onun adıyla anılır ve rastgele süreçler teorisinde ana çalışma konusu Gauss süreçleridir.

AT geç XIX içinde. - yirminci yüzyılın başı. matematiksel istatistiklere büyük bir katkı, başta K. Pearson (1857-1936) ve R.A. olmak üzere İngiliz araştırmacılar tarafından yapılmıştır. Fischer (1890-1962). Özellikle, Pearson test için "ki-kare" testini geliştirdi. istatistiksel hipotezler ve Fischer - varyans analizi, deney planlama teorisi, parametre tahmininin maksimum olabilirlik yöntemi.

Yirminci yüzyılın 30'larında. Pole Jerzy Neumann (1894-1977) ve İngiliz E. Pearson, istatistiksel hipotezleri test etmek için genel bir teori geliştirdi ve Sovyet matematikçileri Akademisyen A.N. Kolmogorov (1903-1987) ve SSCB Bilimler Akademisi N.V. Smirnov (1900-1966) parametrik olmayan istatistiklerin temellerini attı. Yirminci yüzyılın kırklarında. Rumen A. Wald (1902-1950) tutarlı istatistiksel analiz teorisini oluşturdu.

Matematiksel istatistikler günümüzde hızla gelişmektedir. Dolayısıyla, son 40 yılda, temelde dört yeni araştırma alanı ayırt edilebilir [ [ 2.16 ] ]:

  • deneyleri planlamak için matematiksel yöntemlerin geliştirilmesi ve uygulanması;
  • uygulamalı matematiksel istatistikte bağımsız bir yön olarak sayısal olmayan nitelikteki nesnelerin istatistiklerinin geliştirilmesi;
  • kullanılan olasılıksal modelden küçük sapmalara dirençli istatistiksel yöntemlerin geliştirilmesi;
  • istatistiksel veri analizi için tasarlanmış bilgisayar yazılım paketlerinin oluşturulmasına yönelik çalışmaların yaygınlaştırılması.

Olasılıksal-istatistiksel yöntemler ve optimizasyon. Optimizasyon fikri, modern uygulamalı matematiksel istatistiklere ve diğer istatistiksel yöntemler. Yani, deney planlama yöntemleri, istatistiksel kabul kontrolü, teknolojik süreçlerin istatistiksel düzenlenmesi vb. Öte yandan, teoride optimizasyon formülasyonları karar vermeörneğin, uygulamalı ürün kalitesi optimizasyonu teorisi ve standartların gereklilikleri, öncelikle uygulamalı matematiksel istatistikler olmak üzere olasılıksal-istatistiksel yöntemlerin yaygın olarak kullanılmasını sağlar.

Özellikle üretim yönetiminde, ürün kalitesi ve standart gereklilikleri optimize edilirken, özellikle uygulanması önemlidir. istatistiksel yöntemler ilk aşamada yaşam döngüsüürünler, yani deneysel tasarım geliştirmelerinin araştırma hazırlığı aşamasında (ürünler için umut verici gereksinimlerin geliştirilmesi, ön tasarım, deneysel tasarım geliştirme için referans şartları). Bunun nedeni, ürün yaşam döngüsünün ilk aşamasında mevcut olan sınırlı bilgi ve gelecek için teknik olasılıkları ve ekonomik durumu tahmin etme ihtiyacıdır. İstatistiksel Yöntemler optimizasyon problemini çözmenin tüm aşamalarında uygulanmalıdır - değişkenleri ölçeklerken, ürün ve sistemlerin işleyişi için matematiksel modeller geliştirirken, teknik ve ekonomik deneyler yaparken vb.

Ürün kalitesinin optimizasyonu ve standart gereksinimleri de dahil olmak üzere optimizasyon problemlerinde, istatistiklerin tüm alanları kullanılır. Yani - rastgele değişkenlerin istatistikleri, çok değişkenli istatistiksel analiz, rastgele süreçlerin ve zaman serilerinin istatistikleri, sayısal olmayan nitelikteki nesnelerin istatistikleri. Spesifik verilerin analizi için istatistiksel bir yöntem seçimi, önerilere göre yapılmalıdır [

3.5.1. Olasılıksal-istatistiksel araştırma yöntemi.

Çoğu durumda, yalnızca deterministik değil, aynı zamanda rastgele olasılıklı (istatistiksel) süreçleri de araştırmak gerekir. Bu süreçler olasılık teorisi temelinde değerlendirilir.

Rastgele değişken x'in toplamı, birincil matematiksel malzemedir. Bir koleksiyon, bir dizi homojen olay olarak anlaşılmaktadır. Bir kitle fenomeninin en çeşitli varyantlarını içeren kümeye genel popülasyon veya büyük bir örnek N. Genellikle genel popülasyonun sadece bir kısmı incelenir. örneklem popülasyonu veya küçük örneklem.

olasılık R(x) gelişmeler X vaka sayısının oranı denir N(x), olayın gerçekleşmesine neden olan X, ile toplam sayısı olası vakalar N:

P(x)=N(x)/N.

Olasılık teorisi Rastgele değişkenlerin teorik dağılımlarını ve özelliklerini dikkate alır.

Matematik istatistikleri ampirik olayları işleme ve analiz etme yolları ile ilgilenir.

Bu iki ilgili bilim, analiz için yaygın olarak kullanılan, toplu rastgele süreçlerin birleşik bir matematiksel teorisini oluşturur. bilimsel araştırma.

Çok sık, olasılık ve matematiksel istatistik yöntemleri, çeşitli bilim ve teknoloji dallarında yaygın olarak kullanılan güvenilirlik, hayatta kalma ve güvenlik teorisinde kullanılır.

3.5.2. İstatistiksel modelleme yöntemi veya istatistiksel testler (Monte Carlo yöntemi).

Bu yöntem Sayısal yöntem karmaşık problemleri çözme ve olasılıksal süreçleri simüle eden rasgele sayıların kullanımına dayanır. Bu yöntemle çözümün sonuçları, incelenen süreçlerin bağımlılıklarını ampirik olarak belirlemeyi mümkün kılar.

Monte Carlo yöntemini kullanarak problem çözme, yalnızca yüksek hızlı bilgisayarların kullanılmasıyla etkilidir. Monte Carlo yöntemini kullanarak problemleri çözmek için istatistiksel bir seriye sahip olmak, dağılım yasasını, matematiksel beklentinin ortalama değerini bilmek gerekir. t(x), standart sapma.

Bu yöntemi kullanarak, çözümün keyfi olarak verilen bir doğruluğu elde edilebilir, yani.

-> m(x)

3.5.3. Sistem analiz yöntemi.

Sistem analizi, karmaşık etkileşimli öğeler kümesi olan karmaşık sistemleri incelemek için bir dizi teknik ve yöntem olarak anlaşılır. Sistem öğelerinin etkileşimi, doğrudan ve geri besleme bağlantıları ile karakterize edilir.

Sistem analizinin özü, bu ilişkileri tanımlamak ve bir bütün olarak tüm sistemin davranışı üzerindeki etkilerini belirlemektir. En eksiksiz ve derin sistem analizi, optimizasyon ve kontrol amacıyla bilgileri algılayabilen, depolayabilen ve işleyebilen karmaşık dinamik sistemlerin bilimi olan sibernetik yöntemleri kullanılarak gerçekleştirilebilir.

Sistem analizi dört aşamadan oluşmaktadır.

İlk aşama, görevin belirlenmesinden oluşur: çalışmanın amacını, amaçlarını ve hedeflerini ve ayrıca nesneyi incelemek ve yönetmek için kriterleri belirlerler.

İkinci aşamada, incelenen sistemin sınırları belirlenir ve yapısı belirlenir. Hedefle ilgili tüm nesneler ve süreçler iki sınıfa ayrılır - incelenen sistem ve dış ortam. Ayırt etmek kapalı ve açık sistemler. araştırma yaparken kapalı sistemler etkilemek dış ortam davranışları ihmal edilir. Ardından, sistemin bileşenlerini - öğelerini ayırın, bunlar ile dış çevre arasındaki etkileşimi kurun.

Sistem analizinin üçüncü aşaması, incelenen sistemin matematiksel bir modelinin derlenmesidir. İlk olarak sistem parametrelendirilir, sistemin ana elemanları ve sistem üzerindeki temel etkiler belirli parametreler kullanılarak açıklanır. Aynı zamanda, sürekli ve ayrık, deterministik ve olasılıksal süreçleri karakterize eden parametreler vardır. Proseslerin özelliklerine bağlı olarak bir veya daha fazla kullanılmaktadır. matematiksel aparat.

Sistem analizinin üçüncü aşamasının bir sonucu olarak, sistemin resmi, örneğin algoritmik bir dilde açıklanan eksiksiz matematiksel modelleri oluşturulur.

Dördüncü aşamada, ortaya çıkan matematiksel model analiz edilir, süreçleri ve kontrol sistemlerini optimize etmek ve sonuçları formüle etmek için aşırı koşulları bulunur. Optimizasyon, bu durumda uç değerler (minimum, maksimum, minimaks) alan optimizasyon kriterine göre değerlendirilir.

Genellikle bir kriter seçilir ve diğerleri için eşik maksimum izin verilen değerler belirlenir. Bazen birincil parametrelerin bir fonksiyonu olan karışık kriterler kullanılır.

Seçilen optimizasyon kriterine dayanarak, optimizasyon kriterinin incelenen nesnenin (sürecin) modelinin parametrelerine bağımlılığı derlenir.

İncelenen modelleri optimize etmek için çeşitli matematiksel yöntemler vardır: doğrusal, doğrusal olmayan veya dinamik programlama yöntemleri; kuyruk teorisine dayalı olasılıksal-istatistiksel yöntemler; süreçlerin gelişimini rastgele durumlar olarak ele alan oyun teorisi.

Bilginin kendi kendini kontrol etmesi için sorular

Teorik araştırma metodolojisi.

Bilimsel araştırmanın teorik gelişim aşamasının ana bölümleri.

Model türleri ve çalışma nesnesinin modelleme türleri.

Analitik araştırma yöntemleri.

Deney kullanarak analitik araştırma yöntemleri.

Olasılıksal-analitik araştırma yöntemi.

Statik modelleme yöntemleri (Monte Carlo yöntemi).

Sistem analizi yöntemi.

İstatistiksel Yöntemler

istatistiksel yöntemler- istatistiksel verilerin analiz yöntemleri. Bilimsel araştırmanın tüm alanlarında ve ülke ekonomisinin herhangi bir sektöründe uygulanabilen uygulamalı istatistik yöntemleri ve uygulanabilirliği belirli bir alanla sınırlı olan diğer istatistiksel yöntemler vardır. Bu, istatistiksel kabul kontrolü, teknolojik süreçlerin istatistiksel kontrolü, güvenilirlik ve test etme ve deney tasarımı gibi yöntemleri ifade eder.

İstatistiksel yöntemlerin sınıflandırılması

İstatistiksel veri analizi yöntemleri, insan faaliyetinin hemen hemen tüm alanlarında kullanılmaktadır. Bir grup (nesneler veya özneler) hakkında içsel heterojenliğe sahip herhangi bir yargıyı elde etmek ve doğrulamak gerektiğinde kullanılırlar.

İstatistiksel veri analizi yöntemleri alanında (belirli problemlere daldırma ile ilgili yöntemlerin özgüllük derecesine göre) üç tür bilimsel ve uygulamalı faaliyetin ayırt edilmesi tavsiye edilir:

a) uygulama alanının özelliklerini dikkate almadan genel amaçlı yöntemlerin geliştirilmesi ve araştırılması;

b) belirli bir faaliyet alanının ihtiyaçlarına göre gerçek olayların ve süreçlerin istatistiksel modellerinin geliştirilmesi ve incelenmesi;

c) belirli verilerin istatistiksel analizi için istatistiksel yöntem ve modellerin uygulanması.

Uygulanmış istatistikler

Veri türünün ve bunların oluşum mekanizmasının tanımı, herhangi bir verinin başlangıcıdır. istatistiksel çalışma. Verileri tanımlamak için hem deterministik hem de olasılıksal yöntemler kullanılır. Deterministik yöntemlerin yardımıyla, yalnızca araştırmacının emrinde olan verileri analiz etmek mümkündür. Örneğin, resmi devlet istatistik organları tarafından işletmeler ve kuruluşlar tarafından sunulan istatistiksel raporlara dayalı olarak hesaplanan tabloları elde etmek için kullanıldılar. Elde edilen sonuçları daha geniş bir kümeye aktarmak, tahmin ve kontrol için kullanmak ancak olasılıksal-istatistiksel modelleme temelinde mümkündür. Bu nedenle, yalnızca olasılık teorisine dayalı yöntemler genellikle matematiksel istatistiklere dahil edilir.

Deterministik ve olasılıksal-istatistiksel yöntemlere karşı çıkmanın mümkün olduğunu düşünmüyoruz. Bunları istatistiksel analizin ardışık aşamaları olarak görüyoruz. İlk aşamada, mevcut verilerin analiz edilmesi, tablo ve çizelgeler kullanılarak anlaşılması kolay bir biçimde sunulması gerekir. Ardından, istatistiksel verilerin belirli olasılıksal-istatistiksel modeller temelinde analiz edilmesi tavsiye edilir. Gerçek bir fenomenin veya sürecin özüne ilişkin daha derin bir kavrayış olasılığının, yeterli bir matematiksel modelin geliştirilmesiyle sağlandığına dikkat edin.

En basit durumda, istatistiksel veriler, incelenen nesnelerin bazı özellik özelliklerinin değerleridir. Değerler nicel olabilir veya nesnenin atanabileceği kategorinin bir göstergesini temsil edebilir. İkinci durumda, niteliksel bir işaretten bahsediyoruz.

Birkaç nicel veya nitel özellik ile ölçüm yaparken, nesne hakkında istatistiksel veri olarak bir vektör elde ederiz. Yeni bir veri türü olarak kabul edilebilir. Bu durumda, örnek bir dizi vektörden oluşur. Koordinatların bir kısmı sayılarsa ve bir kısmı nitel (kategorize edilmiş) verilerse, o zaman heterojen bir veri vektöründen bahsediyoruz.

Numunenin bir elemanı, yani bir boyutu, bir bütün olarak bir fonksiyon olabilir. Örneğin, göstergenin dinamiklerini, yani zaman içindeki değişimini açıklamak, hastanın elektrokardiyogramı veya motor şaftının atımlarının genliğidir. Veya belirli bir firmanın performansının dinamiklerini tanımlayan bir zaman serisi. Daha sonra örnek bir dizi fonksiyondan oluşur.

Numunenin öğeleri başka matematiksel nesneler de olabilir. Örneğin, ikili ilişkiler. Bu nedenle, uzmanlar yoklarken, genellikle uzmanlık nesnelerinin sırasını (sıralamalarını) kullanırlar - ürün örnekleri, yatırım projeleri, yönetim kararları için seçenekler. Uzman çalışmasının düzenlemelerine bağlı olarak, numunenin öğeleri çeşitli ikili ilişkiler (sıralama, bölümleme, tolerans), kümeler, kümeler olabilir. bulanık kümeler vb.

Bu nedenle, uygulamalı istatistiğin çeşitli problemlerinde örnek elemanların matematiksel doğası çok farklı olabilir. Bununla birlikte, iki sınıf istatistik ayırt edilebilir - sayısal ve sayısal olmayan. Buna göre, uygulamalı istatistikler iki kısma ayrılır - sayısal istatistikler ve sayısal olmayan istatistikler.

Sayısal istatistikler sayılar, vektörler, fonksiyonlardır. Katsayılarla çarpılarak eklenebilirler. Bu nedenle sayısal istatistiklerde büyük önem farklı miktarları var. Rastgele örnek öğelerin toplamlarını analiz etmek için kullanılan matematiksel aygıt, büyük sayıların (klasik) yasaları ve merkezi limit teoremleridir.

Sayısal olmayan istatistiksel veriler, kategorize edilmiş veriler, heterojen özelliklerin vektörleri, ikili ilişkiler, kümeler, bulanık kümeler vb.'dir. Bunlar katsayılarla toplanamaz ve çarpılamaz. Bu yüzden sayısal olmayan istatistiklerin toplamları hakkında konuşmak mantıklı değil. Sayısal olmayan matematiksel uzayların (kümeler) elemanlarıdır. Sayısal olmayan istatistiksel verilerin analizi için matematiksel aparat, bu tür boşluklarda elemanlar arasındaki mesafelerin (yanı sıra yakınlık ölçüleri, fark göstergeleri) kullanımına dayanmaktadır. Mesafelerin yardımıyla ampirik ve teorik ortalamalar belirlenir, büyük sayıların yasaları kanıtlanır, olasılık dağılım yoğunluğunun parametrik olmayan tahminleri oluşturulur, teşhis ve küme analizi sorunları çözülür, vb. (bkz.).

Uygulamalı araştırma istatistiksel verileri kullanır Çeşitli türler. Bu, özellikle onları elde etme yöntemlerinden kaynaklanmaktadır. Örneğin, bazı teknik cihazların testleri belirli bir zamana kadar devam ederse, sözde olanı alırız. bir dizi sayıdan oluşan sansürlü veriler - birkaç cihazın arızadan önceki çalışma süresi ve test sonunda kalan cihazların çalışmaya devam ettiği bilgisi. Sansürlü veriler genellikle teknik cihazların güvenilirliğinin değerlendirilmesinde ve kontrolünde kullanılır.

Genellikle, ilk üç türün istatistiksel veri analizi yöntemleri ayrı ayrı değerlendirilir. Bu sınırlama, yukarıda belirtilen, sayısal olmayan bir yapıya sahip verileri analiz etmeye yönelik matematiksel aygıtın, sayılar, vektörler ve işlevler biçimindeki veriler için olandan esasen farklı olması durumundan kaynaklanır.

Olasılıksal-istatistiksel modelleme

İstatistiksel yöntemleri ulusal ekonominin belirli alanlarında ve sektörlerinde uygularken, “sanayide istatistiksel yöntemler”, “tıpta istatistiksel yöntemler” vb. gibi bilimsel ve pratik disiplinler elde ederiz. Bu açıdan ekonometri, “istatistikseldir. Ekonomide Yöntemler”. b) grubunun bu disiplinleri genellikle uygulama alanının özelliklerine göre oluşturulmuş olasılıksal-istatistiksel modellere dayanmaktadır. Kullanılan olasılıksal-istatistiksel modelleri karşılaştırmak çok öğreticidir. Çeşitli bölgeler, yakınlıklarını keşfetmek ve aynı zamanda bazı farklılıkları belirtmek için. Böylece, bilimsel tıbbi araştırma, belirli alanlarda problem ifadelerinin ve bunları çözmek için kullanılan istatistiksel yöntemlerin yakınlığı görülebilir. sosyolojik araştırma ve pazarlama araştırması veya kısaca tıp, sosyoloji ve pazarlama. Bunlar genellikle "örnekleme çalışmaları" adı altında gruplandırılır.

Seçici çalışmalar ve uzman çalışmalar arasındaki fark, her şeyden önce, incelenen nesne veya konu sayısında kendini gösterir - seçici çalışmalarda, genellikle yüzlerce ve uzman çalışmalarda onlarca hakkında konuşuruz. Ancak uzman araştırma teknolojisi çok daha karmaşıktır. Spesifiklik, demografik veya lojistik modellerde, anlatısal (metinsel, yıllık) bilgilerin işlenmesinde veya faktörlerin karşılıklı etkisinin incelenmesinde daha da belirgindir.

Teknik cihazların ve teknolojilerin güvenilirliği ve güvenliği, kuyruk teorisi, çok sayıda bilimsel makalede ayrıntılı olarak ele alınmaktadır.

Belirli verilerin istatistiksel analizi

Belirli verilerin istatistiksel analizi için istatistiksel yöntemlerin ve modellerin uygulanması, ilgili alanın sorunlarıyla yakından bağlantılıdır. Belirlenen bilimsel ve uygulamalı etkinlik türlerinin üçüncüsünün sonuçları, disiplinlerin kesiştiği noktadadır. İstatistiksel yöntemlerin pratik uygulamalarının örnekleri olarak kabul edilebilirler. Ancak onları karşılık gelen insan faaliyeti alanına atfetmek için daha az neden yoktur.

Örneğin, hazır kahve tüketicilerine yönelik bir anketin sonuçları doğal olarak pazarlamaya atfedilir (pazarlama araştırması hakkında ders verirken yaptıkları şey budur). Bağımsız olarak toplanan bilgilerden hesaplanan enflasyon endekslerini kullanarak fiyat büyüme dinamiklerinin incelenmesi, öncelikle ekonomi ve yönetim açısından ilgi çekicidir. ulusal ekonomi(hem makro düzeyde hem de bireysel organizasyonlar düzeyinde).

Kalkınma beklentileri

İstatistiksel yöntemler teorisi, gerçek problemleri çözmeyi amaçlar. Bu nedenle, içinde sürekli olarak istatistiksel veri analizinin matematiksel problemlerinin yeni ifadeleri ortaya çıkar, yeni yöntemler geliştirilir ve doğrulanır. Gerekçelendirme genellikle matematiksel yollarla, yani teoremlerin kanıtlanmasıyla gerçekleştirilir. Metodolojik bileşen tarafından önemli bir rol oynar - görevlerin tam olarak nasıl belirleneceği, daha fazla matematiksel çalışma amacıyla hangi varsayımların kabul edileceği. modernin rolü Bilişim Teknolojileriözellikle, bir bilgisayar deneyi.

Acil bir görev, gelişme eğilimlerini belirlemek ve bunları tahmin için uygulamak için istatistiksel yöntemlerin geçmişini analiz etmektir.

Edebiyat

2. Naylor T. Modellerle makine simülasyonu deneyleri ekonomik sistemler. - M.: Mir, 1975. - 500 s.

3. Kramer G. Matematiksel Yöntemlerİstatistik. - M.: Mir, 1948 (1. baskı), 1975 (2. baskı). - 648 s.

4. Bolshev L.N., Smirnov N.V. Matematiksel istatistik tabloları. - M.: Nauka, 1965 (1. baskı), 1968 (2. baskı), 1983 (3. baskı).

5. Smirnov N. V., Dunin-Barkovsky I. V. Teknik uygulamalar için olasılık teorisi ve matematiksel istatistik dersi. Ed. 3. stereotipik. - E.: Nauka, 1969. - 512 s.

6. Norman Draper, Harry Smith Uygulamalı regresyon analizi. Çoklu Regresyon = Uygulamalı Regresyon Analizi. - 3. baskı. - E.: "Diyalektik", 2007. - S. 912. - ISBN 0-471-17082-8

Ayrıca bakınız

Wikimedia Vakfı. 2010 .

  • Yat Kha
  • Amalgam (anlam ayrım)

Diğer sözlüklerde "İstatistiksel Yöntemler" in ne olduğunu görün:

    İSTATİSTİKSEL YÖNTEMLER- İSTATİSTİKSEL YÖNTEMLER bilimsel yöntemler nicel (sayısal) bir ifadeye izin veren kitle fenomenlerinin tanımları ve çalışmaları. “İstatistik” kelimesi (Yigal. stato durumundan) “durum” kelimesiyle ortak bir köke sahiptir. Başlangıçta bu …… Felsefi Ansiklopedi

    İSTATİSTİKSEL YÖNTEMLER -- nicel (sayısal) ifadeye izin veren kitle olaylarının bilimsel açıklama ve çalışma yöntemleri. "İstatistik" kelimesi (İtalyanca stato - devletten gelir) "devlet" kelimesiyle ortak bir köke sahiptir. Başlangıçta, yönetim bilimine atıfta bulundu ve ... Felsefi Ansiklopedi

    İstatistiksel Yöntemler- (ekoloji ve biyosenolojide) bütünü (örneğin, fitosenoz, nüfus, üretkenlik) kendi özel kümelerinde (örneğin, kayıt sitelerinde elde edilen verilere göre) keşfetmenize ve doğruluk derecesini değerlendirmenize izin veren varyasyon istatistikleri yöntemleri ... ... Ekolojik sözlük

    istatistiksel yöntemler- (psikolojide) (Latince statü statüsünden) psikolojide temel olarak deneysel sonuçları işlemek için kullanılan bazı uygulamalı matematiksel istatistik yöntemleri. S. m kullanmanın temel amacı, sonuçların geçerliliğini ... ... Büyük Psikolojik Ansiklopedi

    İstatistiksel Yöntemler- 20.2. İstatistiksel Yöntemler Faaliyetleri düzenlemek, düzenlemek ve doğrulamak için kullanılan belirli istatistiksel yöntemler, bunlarla sınırlı olmamak üzere şunları içerir: a) deney tasarımı ve faktör analizi; b) varyans analizi ve … Normatif ve teknik dokümantasyon terimlerinin sözlük referans kitabı

    İSTATİSTİKSEL YÖNTEMLER- Miktarların incelenmesi için yöntemler. kitle toplumlarının yönleri. fenomenler ve süreçler. S. m., toplumlarda süregelen değişiklikleri karakterize etmeyi dijital terimlerle mümkün kılar. süreçler, farklı çalışmak için. sosyal ekonomik biçimler. desenler, değişim ... ... Tarım Ansiklopedik Sözlük

    İSTATİSTİKSEL YÖNTEMLER- deneysel sonuçları işlemek için kullanılan bazı uygulamalı matematiksel istatistik yöntemleri. Kalite güvencesi için özel olarak bir dizi istatistiksel yöntem geliştirilmiştir. psikolojik testler, profesyonel kullanım için ... ... Profesyonel eğitim. Sözlük

    İSTATİSTİKSEL YÖNTEMLER- (mühendislik psikolojisinde) (Latince statü statüsünden) mühendislik psikolojisinde deneysel sonuçları işlemek için kullanılan bazı uygulamalı istatistik yöntemleri. S. m kullanmanın temel amacı, sonuçların geçerliliğini ... ... Ansiklopedik Psikoloji ve Pedagoji Sözlüğü

İyi çalışmalarınızı bilgi tabanına gönderin basittir. Aşağıdaki formu kullanın

Bilgi tabanını çalışmalarında ve çalışmalarında kullanan öğrenciler, yüksek lisans öğrencileri, genç bilim adamları size çok minnettar olacaktır.

Yayınlanan http://www.allbest.ru/

Yayınlanan http://www.allbest.ru/

giriiş

1. Ki-kare dağılımı

Çözüm

Başvuru

giriiş

Olasılık teorisinin yaklaşımları, fikirleri ve sonuçları hayatımızda nasıl kullanılıyor? matematiksel kare teorisi

Temel, gerçek bir fenomenin veya sürecin olasılıksal bir modelidir, yani. matematiksel model nesnel ilişkilerin olasılık teorisi cinsinden ifade edildiği . Olasılıklar, öncelikle karar verirken dikkate alınması gereken belirsizlikleri tanımlamak için kullanılır. Bu, hem istenmeyen fırsatları (riskler) hem de çekici olanları ("şanslı şans") ifade eder. Bazen rastgelelik, örneğin kura çekerken, kontrol için birimlerin rastgele seçimi, piyangolar veya tüketici anketleri yaparken duruma kasıtlı olarak dahil edilir.

Olasılık teorisi, araştırmacının ilgisini çeken diğer olasılıkları hesaplamaya izin verir.

Bir fenomenin veya sürecin olasılıksal bir modeli, matematiksel istatistiklerin temelidir. İki paralel kavram dizisi kullanılır - teori ile ilgili olanlar (olasılıklı bir model) ve uygulama ile ilgili olanlar (gözlemsel sonuçların bir örneği). Örneğin teorik olasılık, örnekten bulunan frekansa karşılık gelir. Matematiksel beklenti (teorik seri), örnek aritmetik ortalamaya (pratik seri) karşılık gelir. Kural olarak, örnek özellikler teorik olanların tahminleridir. Aynı zamanda, "araştırmacıların kafasında olan" teorik dizilerle ilgili miktarlar, fikirler dünyasına atıfta bulunur (eski Yunan filozofu Platon'a göre), doğrudan ölçüm için mevcut değildir. Araştırmacılar, yalnızca teorik bir olasılıksal modelin özelliklerini kendileri için ilgilendiren özelliklerini oluşturmaya çalıştıkları seçici verilere sahiptir.

Neden olasılıksal bir modele ihtiyacımız var? Gerçek şu ki, yalnızca onun yardımıyla, belirli bir örneğin analizinin sonuçlarıyla oluşturulan özelliklerin diğer örneklere ve ayrıca sözde genel popülasyonun tamamına aktarılması mümkündür. "Nüfus" terimi şu durumlarda kullanılır: Konuşuyoruz incelenmekte olan büyük ama sonlu bir birim kümesi hakkında. Örneğin, Rusya'nın tüm sakinlerinin toplamı veya Moskova'daki tüm hazır kahve tüketicilerinin toplamı hakkında. Pazarlama veya sosyolojik araştırmaların amacı, yüzlerce veya binlerce kişiden oluşan bir örneklemden alınan ifadeleri, birkaç milyonluk genel nüfusa aktarmaktır. Kalite kontrolünde, bir ürün partisi genel bir popülasyon olarak hareket eder.

Bir örneklemden çıkarımları daha büyük bir popülasyona aktarmak için, örneklem özelliklerinin bu daha büyük popülasyonun özellikleri ile ilişkisi hakkında bazı varsayımlara ihtiyaç vardır. Bu varsayımlar uygun bir olasılık modeline dayanmaktadır.

Elbette, bir veya başka bir olasılık modeli kullanmadan örnek verileri işlemek mümkündür. Örneğin, örnek aritmetik ortalamasını hesaplayabilir, belirli koşulların yerine getirilme sıklığını vb. hesaplayabilirsiniz. Bununla birlikte, hesaplamaların sonuçları yalnızca belirli bir örnek için geçerli olacaktır, onların yardımıyla elde edilen sonuçların başka herhangi bir kümeye aktarılması yanlıştır. Bu aktiviteye bazen "veri analizi" denir. Olasılıksal-istatistiksel yöntemlerle karşılaştırıldığında, veri analizi sınırlı bilişsel değere sahiptir.

Bu nedenle, örneklem özellikleri yardımıyla hipotezlerin tahmin edilmesine ve test edilmesine dayalı olasılıksal modellerin kullanılması, olasılıksal-istatistiksel karar verme yöntemlerinin özüdür.

1. Ki-kare dağılımı

Normal dağılım, şu anda istatistiksel veri işlemede sıklıkla kullanılan üç dağılımı tanımlar. Bunlar Pearson ("ki - kare"), Student ve Fisher dağılımlarıdır.

Dağıtıma ("ki - kare") odaklanacağız. Bu dağılım ilk olarak 1876'da astronom F. Helmert tarafından incelenmiştir. Gauss hata teorisi ile bağlantılı olarak, n adet bağımsız standart normal dağılımlı rastgele değişkenin karelerinin toplamını inceledi. Daha sonra, Karl Pearson bu dağılım fonksiyonunu "ki-kare" olarak adlandırdı. Ve şimdi dağıtım onun adını taşıyor.

Normal dağılımla yakın ilişkisi nedeniyle h2 dağılımı, olasılık teorisi ve matematiksel istatistikte önemli bir rol oynar. h2 dağılımı ve h2 dağılımı tarafından tanımlanan diğer birçok dağılım (örneğin, Student dağılımı), normal dağılımlı gözlemlerden çeşitli fonksiyonların örnek dağılımlarını tanımlar ve güven aralıkları ve istatistiksel testler oluşturmak için kullanılır.

Pearson dağılımı (ki - kare) - X1, X2, ..., Xn'nin normal bağımsız rastgele değişkenler olduğu ve her birinin matematiksel beklentisinin sıfır olduğu ve standart sapmanın bir olduğu bir rastgele değişkenin dağılımı.

kareler toplamı

yasaya göre dağıtılır ("ki - kare").

Bu durumda, terim sayısı, yani. n, ki-kare dağılımının "serbestlik derecesi sayısı" olarak adlandırılır. Serbestlik derecesi sayısı arttıkça dağılım yavaş yavaş normale yaklaşır.

Bu dağılımın yoğunluğu

Bu nedenle, h2'nin dağılımı bir parametre n'ye bağlıdır - serbestlik derecesi sayısı.

h2 dağıtım fonksiyonu şu şekildedir:

h2?0 ise. (2.7.)

Şekil 1, farklı serbestlik dereceleri için olasılık yoğunluğunun ve χ2 dağılım fonksiyonunun bir grafiğini göstermektedir.

Şekil 1 Farklı sayıda serbestlik derecesi için h2 (ki - kare) dağılımındaki olasılık yoğunluğunun q (x) bağımlılığı

"Ki-kare" dağılımının anları:

Ki-kare dağılımı, varyansı tahmin etmede (bir güven aralığı kullanarak), uyuşma, homojenlik, bağımsızlık hipotezlerini test etmede, öncelikle sınırlı sayıda değer alan nitel (kategorize edilmiş) değişkenler için ve diğer birçok istatistiksel görevde kullanılır. veri analizi.

2. İstatistiksel veri analizi problemlerinde "ki-kare"

İstatistiksel veri analizi yöntemleri, insan faaliyetinin hemen hemen tüm alanlarında kullanılmaktadır. Bir grup (nesneler veya özneler) hakkında içsel heterojenliğe sahip herhangi bir yargıyı elde etmek ve doğrulamak gerektiğinde kullanılırlar.

İstatistiksel yöntemlerin geliştirilmesinin modern aşaması, İngiliz K. Pearson'ın "Biometrika" dergisini kurduğu 1900'den itibaren sayılabilir. 20. yüzyılın ilk üçte biri parametrik istatistiklerin işareti altında geçti. Pearson ailesi eğrileri tarafından tanımlanan dağılımların parametrik ailelerinden elde edilen verilerin analizine dayalı yöntemler incelenmiştir. En popüler olanı normal dağılımdı. Hipotezleri test etmek için Pearson, Student ve Fisher kriterleri kullanıldı. Maksimum olabilirlik yöntemi, varyans analizi önerildi ve deneyi planlamak için ana fikirler formüle edildi.

Ki-kare dağılımı, istatistiksel hipotezleri test etmek için istatistikte en yaygın kullanılanlardan biridir. En güçlü uyum iyiliği testlerinden biri olan "ki-kare" dağılımına dayalı olarak Pearson'ın "ki-kare" testi oluşturulmuştur.

Uyum iyiliği testi, bilinmeyen dağılımın önerilen yasası hakkındaki hipotezi test etmek için bir kriterdir.

p2 ("ki-kare") testi, farklı dağılımların hipotezini test etmek için kullanılır. Bu onun liyakatidir.

Kriterin hesaplama formülü şuna eşittir:

burada m ve m" sırasıyla ampirik ve teorik frekanslardır.

düşünülen dağıtım;

n, serbestlik derecesi sayısıdır.

Doğrulama için deneysel (gözlemlenen) ve teorik (normal dağılım varsayımı altında hesaplanan) frekansları karşılaştırmamız gerekir.

Ampirik frekanslar, hesaplanan veya beklenen frekanslarla tamamen örtüşüyorsa, S (E - T) = 0 ve ch2 kriteri de sıfıra eşit olacaktır. S (E - T) sıfıra eşit değilse, bu hesaplanan frekanslar ile serinin ampirik frekansları arasında bir uyumsuzluk olduğunu gösterecektir. Bu gibi durumlarda teorik olarak sıfırdan sonsuza kadar değişebilen p2 kriterinin önemini değerlendirmek gerekir. Bu, ch2f'nin fiilen elde edilen değeri ile kritik değeri (ch2st) (a) ve serbestlik derecesi sayısı (n) karşılaştırılarak yapılır.

Rastgele değişken h2'nin olası değerlerinin dağılımı sürekli ve asimetriktir. Serbestlik derecesi (n) sayısına ve yaklaşımlara bağlıdır. normal dağılım gözlem sayısı arttıkça Bu nedenle, değerlendirmeye p2 kriterinin uygulanması ayrık dağılımlarözellikle küçük örnekler için değerini etkileyen bazı hatalarla ilişkilidir. Daha doğru tahminler elde etmek için varyasyon serisinde dağıtılan numunenin en az 50 seçeneği olmalıdır. Doğru Uygulama p2 kriteri ayrıca uç sınıflardaki varyantların frekanslarının 5'ten az olmamasını gerektirir; 5'ten az varsa, komşu sınıfların frekansları ile birleştirilirler, böylece toplam miktar 5'e eşit veya daha büyük olur. Frekansların birleşimine göre, sınıf sayısı (N) da azalır. Serbestlik derecesi sayısı, değişkenlik özgürlüğü üzerindeki kısıtlamaların sayısı dikkate alınarak ikincil sınıf sayısına göre belirlenir.

p2 kriterinin belirlenmesinin doğruluğu büyük ölçüde teorik frekansların (T) hesaplanmasının doğruluğuna bağlı olduğundan, ampirik ve hesaplanmış frekanslar arasındaki farkı elde etmek için yuvarlatılmamış teorik frekanslar kullanılmalıdır.

Örnek olarak, beşeri bilimlerde istatistiksel yöntemlerin uygulanmasına adanmış bir web sitesinde yayınlanan bir çalışmayı ele alalım.

Ki-kare testi, normal dağılmış olsun ya da olmasın, frekans dağılımlarının karşılaştırılmasını sağlar.

Sıklık, bir olayın meydana gelme sayısını ifade eder. Genellikle, bir olayın meydana gelme sıklığı, değişkenler isim ölçeğinde ölçüldüğünde ve sıklık dışındaki diğer özelliklerin seçilmesi imkansız veya sorunlu olduğunda ele alınır. Başka bir deyişle, değişken niteliksel özelliklere sahip olduğunda. Ayrıca, birçok araştırmacı test puanlarını seviyelere (yüksek, orta, düşük) çevirme ve bu seviyelerdeki insan sayısını bulmak için puan dağılım tabloları oluşturma eğilimindedir. Düzeylerden birinde (kategorilerden birinde) insan sayısının gerçekten daha fazla (daha az) olduğunu kanıtlamak için Ki-kare katsayısı da kullanılır.

En basit örneğe bir göz atalım.

Genç ergenler arasında bir benlik saygısı testi yapıldı. Test puanları üç seviyeye çevrildi: yüksek, orta, düşük. Frekanslar şu şekilde dağıtıldı:

Yüksek (H) 27 kişi.

Orta (C) 12 kişi

Düşük (H) 11 kişi.

Benlik saygısı yüksek olan çocukların büyük çoğunluğunun, ancak bunun istatistiksel olarak kanıtlanması gerektiği açıktır. Bunu yapmak için Ki-kare testini kullanıyoruz.

Görevimiz, elde edilen ampirik verilerin teorik olarak eşit derecede olası olanlardan farklı olup olmadığını kontrol etmektir. Bunu yapmak için teorik frekansları bulmak gerekir. Bizim durumumuzda teorik frekanslar, tüm frekansların toplanması ve kategori sayısına bölünmesiyle bulunan eş olasılıklı frekanslardır.

Bizim durumumuzda:

(B + C + H) / 3 \u003d (27 + 12 + 11) / 3 \u003d 16.6

Ki-kare testinin hesaplanması için formül:

h2 \u003d? (E - T) I / T

Bir tablo oluşturuyoruz:

ampirik (Ah)

Teorik (T)

(E - T)І / T

Son sütunun toplamını bulun:

Şimdi kritik değerler tablosuna göre kriterin kritik değerini bulmanız gerekiyor (Ekteki Tablo 1). Bunu yapmak için serbestlik derecesi (n) sayısına ihtiyacımız var.

n = (R - 1) * (C - 1)

burada R tablodaki satır sayısıdır, C sütun sayısıdır.

Bizim durumumuzda, yalnızca bir sütun (orijinal ampirik frekanslar anlamına gelir) ve üç satır (kategoriler) vardır, bu nedenle formül değişir - sütunları hariç tutarız.

n = (R - 1) = 3-1 = 2

Hata olasılığı p?0.05 ve n = 2 için kritik değer h2 = 5.99'dur.

Elde edilen ampirik değer kritik değerden büyüktür - frekans farkları önemlidir (n2= 9.64; p≤0.05).

Gördüğünüz gibi kriterin hesaplanması çok basit ve fazla zaman almıyor. Ki-kare testinin pratik değeri çok büyüktür. Bu yöntem, anketlere verilen yanıtların analizinde en değerli olanıdır.

Daha karmaşık bir örnek alalım.

Örneğin, bir psikolog, öğretmenlerin kızlardan çok erkeklere karşı daha önyargılı olduğunun doğru olup olmadığını bilmek ister. Şunlar. kızları övmek daha olasıdır. Bunu yapmak için psikolog, öğretmenler tarafından yazılan öğrencilerin özelliklerini üç kelimenin oluşum sıklığına göre analiz etti: "aktif", "çalışkan", "disiplinli", kelimelerin eş anlamlıları da sayıldı.

Sözcüklerin ortaya çıkma sıklığına ilişkin veriler tabloya girildi:

Elde edilen verileri işlemek için ki-kare testi kullanıyoruz.

Bunu yapmak için, ampirik frekansların bir dağılım tablosu oluşturuyoruz, yani. gözlemlediğimiz frekanslar:

Teorik olarak, frekansların eşit olarak dağıtılmasını bekliyoruz, yani. sıklık kız ve erkek çocuklar arasında orantılı olarak dağıtılacaktır. Teorik frekansların bir tablosunu oluşturalım. Bunu yapmak için, satır toplamını sütun toplamı ile çarpın ve elde edilen sayıyı toplam toplam(lar)a bölün.

Hesaplamalar için ortaya çıkan tablo şöyle görünecektir:

ampirik (Ah)

Teorik (T)

(E - T)І / T

erkekler

"Aktif"

"Gayretli"

"Disiplinli"

"Aktif"

"Gayretli"

"Disiplinli"

Tutar: 4.21

h2 \u003d? (E - T) I / T

burada R, tablodaki satır sayısıdır.

Bizim durumumuzda ki-kare = 4.21; n = 2.

Kriterin kritik değerleri tablosuna göre şunları buluyoruz: n = 2 ve 0,05 hata seviyesi ile kritik değer h2 = 5,99.

Ortaya çıkan değer kritik değerden küçüktür, bu da sıfır hipotezinin kabul edildiği anlamına gelir.

Sonuç: Öğretmenler çocuğun özelliklerini yazarken cinsiyetine önem vermemektedir.

Çözüm

Hemen hemen tüm uzmanlık alanlarından öğrenciler, yüksek matematik dersinin sonundaki "olasılık teorisi ve matematiksel istatistik" bölümünü incelerler, gerçekte sadece bazı temel kavramlar ve sonuçlarla tanışırlar, bunlar açıkça yeterli değildir. pratik iş. Öğrenciler özel derslerde bazı matematiksel araştırma yöntemleriyle tanışırlar (örneğin, "Tahmin ve teknik ve ekonomik planlama", "Teknik ve ekonomik analiz", "Ürün kalite kontrolü", "Pazarlama", "Kontrol etme", "Matematiksel araştırma yöntemleri". tahmin ", "İstatistikler" ve diğerleri - ekonomik uzmanlık öğrencileri durumunda), ancak çoğu durumda sunum çok kısaltılmış ve reçetedir. Sonuç olarak, uygulamalı istatistikçilerin bilgisi yetersizdir.

Bu nedenle, "Uygulamalı İstatistik" dersi teknik üniversiteler, ve ekonomik üniversiteler- "Ekonometri" dersi, çünkü ekonometri, bildiğiniz gibi, belirli ekonomik verilerin istatistiksel bir analizidir.

Olasılık teorisi ve matematiksel istatistik, uygulamalı istatistik ve ekonometri için temel bilgiler sağlar.

Pratik çalışma için uzmanlar için gereklidirler.

Sürekli olasılıklı bir model düşündüm ve kullanılabilirliğini örneklerle göstermeye çalıştım.

Ve çalışmamın sonunda, matematiksel-statik veri analizinin temel prosedürlerinin yetkin bir şekilde uygulanmasının, hipotezlerin statik testinin, "ki-kare" modelinin yanı sıra yetenek bilgisi olmadan imkansız olduğu sonucuna vardım. masasını kullanmak için.

bibliyografya

1. Orlov A.I. Uygulanmış istatistikler. M.: Yayınevi "Sınav", 2004.

2. Gmurman V.E. Olasılık Teorisi ve Matematiksel İstatistik. M.: Yüksek Lisans, 1999. - 479'lar.

3. Ayvozyan S.A. Olasılık Teorisi ve Uygulamalı İstatistik, v.1. M.: Birlik, 2001. - 656'lar.

4. Khamitov G.P., Vedernikova T.I. Olasılıklar ve istatistikler. Irkutsk: BSUEP, 2006 - 272p.

5. Ezhova L.N. Ekonometri. Irkutsk: BSUEP, 2002. - 314p.

6. Mosteller F. Çözümleri olan elli eğlenceli olasılıksal problem. M.: Nauka, 1975. - 111p.

7. Mosteller F. Olasılık. M.: Mir, 1969. - 428'ler.

8. Yaglom A.M. Olasılık ve bilgi. M.: Nauka, 1973. - 511'ler.

9. Chistyakov V.P. Olasılık kursu. M.: Nauka, 1982. - 256'lar.

10. Kremer N.Ş. Olasılık Teorisi ve Matematiksel İstatistik. M.: UNITI, 2000. - 543s.

11. Matematiksel ansiklopedi, v.1. M.: Sovyet Ansiklopedisi, 1976. - 655'ler.

12. http://psystat.at.ua/ - Psikoloji ve pedagojide istatistikler. Makale Ki-kare testi.

Başvuru

Kritik dağıtım noktaları p2

tablo 1

Allbest.ru'da barındırılıyor

...

Benzer Belgeler

    Olasılık modeli ve aksiyomatik A.N. Kolmogorov. Rastgele değişkenler ve vektörler, olasılık teorisinin klasik limit problemi. İstatistiksel verilerin birincil işlenmesi. Sayısal özelliklerin nokta tahminleri. Hipotezlerin istatistiksel olarak test edilmesi.

    eğitim kılavuzu, eklendi 03/02/2010

    Yürütme ve tasarım kuralları kontrol işleri için Yazışma bölümü. Matematiksel istatistik ve olasılık teorisinde problem çözme görevleri ve örnekleri. Dağıtım referans veri tabloları, standart normal dağılım yoğunluğu.

    eğitim kılavuzu, 29.11.2009 eklendi

    Rastgele olayların resmileştirilmiş tanımı ve analizi, olasılık teorisinin fiziksel ve sayısal deneylerinin sonuçlarının işlenmesi ve analizi için temel yöntemler. Olasılık teorisinin temel kavramları ve aksiyomları. Matematiksel istatistiklerin temel kavramları.

    dersler, eklendi 04/08/2011

    Matematiksel istatistikte ölçüm sonuçlarının olasılık dağılım yasasının belirlenmesi. Uygunluk kontrolü ampirik dağılım teorik. Ölçülen büyüklük değerinin bulunduğu güven aralığının belirlenmesi.

    dönem ödevi, eklendi 02/11/2012

    Rastgele değişken dizilerinin yakınsaması ve olasılık dağılımları. Karakteristik fonksiyonlar yöntemi. İstatistiksel hipotezlerin test edilmesi ve merkezi olarak gerçekleştirilmesi limit teoremi verilen bağımsız rastgele değişken dizileri için.

    dönem ödevi, eklendi 11/13/2012

    Doğal gözlemlerden elde edilen verilerin matematiksel istatistik yöntemiyle işlenmesinin ana aşamaları. Elde edilen sonuçların değerlendirilmesi, doğa koruma ve doğa yönetimi alanında yönetsel kararların alınmasında kullanılması. İstatistiksel hipotezlerin test edilmesi.

    pratik çalışma, 24/05/2013 eklendi

    Dağıtım yasasının özü ve istatistiksel problemlerin çözümü için pratik uygulaması. Rastgele bir değişkenin varyansının, matematiksel beklentinin ve standart sapmanın belirlenmesi. Tek yönlü varyans analizinin özellikleri.

    test, eklendi 12/07/2013

    Olasılık ve genel tanımı. Olasılıkların toplama ve çarpma teoremleri. Kesikli rasgele değişkenler ve bunların sayısal özellikler. Büyük sayılar yasası. Numunenin istatistiksel dağılımı. Korelasyon ve regresyon analizinin unsurları.

    ders dersi, eklendi 06/13/2015

    Ders programı, olasılık teorisinin temel kavramları ve formülleri, gerekçeleri ve önemi. Matematiksel istatistiğin disiplin içindeki yeri ve rolü. Bu akademik disiplinlerin çeşitli konularında en yaygın görevleri çözmek için örnekler ve açıklamalar.

    eğitim kılavuzu, 01/15/2010 eklendi

    Olasılık teorisi ve matematiksel istatistikler, rastgele kütlesel olayların nicel analiz yöntemleriyle ilgili bilimlerdir. Rastgele bir değişkenin değer kümesine örnek, kümenin öğelerine rasgele değişkenin örnek değerleri denir.

Özellikle ilgi çekicidir niceleme matematiksel istatistik yöntemlerini kullanarak girişimcilik riski. Bu değerlendirme yönteminin ana araçları şunlardır:

§ rastgele bir değişkenin meydana gelme olasılığı,

§ Çalışma altındaki rastgele değişkenin matematiksel beklentisi veya ortalama değeri,

§ varyans,

§ standart (kök ortalama kare) sapma,

§ varyasyon katsayısı,

§ İncelenen rastgele değişkenin olasılık dağılımı.

Bir karar vermek için iki kriterle ölçülen riskin büyüklüğünü (derecesini) bilmeniz gerekir:

1) ortalama beklenen değer (matematiksel beklenti),

2) olası bir sonucun dalgalanmaları (değişkenliği).

Ortalama beklenen değer durumun belirsizliği ile ilişkili bir rasgele değişkenin ağırlıklı ortalamasıdır:

,

rastgele değişkenin değeri nerede.

Ortalama beklenen değer, ortalama olarak beklediğimiz sonucu ölçer.

Ortalama değer, genelleştirilmiş bir niteliksel özelliktir ve rastgele bir değişkenin herhangi bir özel değeri lehine karar verilmesine izin vermez.

Bir karar vermek için göstergelerdeki dalgalanmaları ölçmek, yani olası bir sonucun değişkenliğinin ölçüsünü belirlemek gerekir.

Olası sonucun dalgalanması, beklenen değerin ortalama değerden sapma derecesidir.

Bunu yapmak için pratikte genellikle birbiriyle yakından ilişkili iki kriter kullanılır: "dağılım" ve "standart sapma".

Dağılım – karelerin ağırlıklı ortalaması fiili sonuç beklenen ortalamadan:

standart sapma varyansın kare köküdür. Boyutsal bir niceliktir ve incelenen nesnenin ölçüldüğü birimlerle ölçülür. rastgele değer:

.

Dağılım ve standart sapma, mutlak dalgalanmanın bir ölçüsü olarak hizmet eder. Analiz için genellikle varyasyon katsayısı kullanılır.

varyasyon katsayısı standart sapmanın ortalama beklenen değere oranıdır, %100 ile çarpılır

veya .

Varyasyon katsayısı, çalışılan göstergenin mutlak değerlerinden etkilenmez.

Varyasyon katsayısının yardımıyla, farklı ölçü birimlerinde ifade edilen özelliklerin dalgalanmaları bile karşılaştırılabilir. Varyasyon katsayısı %0 ile %100 arasında değişebilir. Oran ne kadar büyük olursa, dalgalanma o kadar büyük olur.


AT ekonomik istatistikler varyasyon katsayısının farklı değerlerinin aşağıdaki tahmini oluşturulmuştur:

%10'a kadar - zayıf dalgalanma, %10 - 25 - orta, %25'in üzerinde - yüksek.

Buna göre, dalgalanmalar ne kadar yüksek olursa, risk de o kadar büyük olur.

Örnek. Küçük bir dükkân sahibi, her günün başında, satılmak üzere bozulabilir bir ürün alır. Bu ürünün bir birimi 200 UAH'dır. Satış fiyatı - 300 UAH. bir birim için. Gözlemlerden gün boyunca bu ürüne olan talebin 4, 5, 6 veya 7 birim olabileceği ve buna karşılık gelen olasılıklar 0.1 olduğu bilinmektedir; 0,3; 0,5; 0.1. Ürün gün içinde satılmazsa, günün sonunda her zaman 150 UAH fiyattan satın alınacaktır. bir birim için. Gün başında mağaza sahibi bu üründen kaç adet almalı?

Çözüm. Mağaza sahibi için bir kar matrisi oluşturalım. Örneğin, mal sahibinin 7 birim ürün alıp 6. gün ve günün sonunda bir birim satması durumunda elde edeceği karı hesaplayalım. Gün içinde satılan ürünün her bir birimi 100 UAH kar verir ve günün sonunda - 200 - 150 = 50 UAH zarar verir. Böylece, bu durumda kar şöyle olacaktır:

Hesaplamalar, diğer arz ve talep kombinasyonları için benzer şekilde yapılır.

Beklenen kâr, karşılık gelen olasılıklar dikkate alınarak, oluşturulan matrisin her satırı için olası kâr değerlerinin matematiksel beklentisi olarak hesaplanır. Gördüğünüz gibi, beklenen karlar arasında en büyüğü 525 UAH. Söz konusu ürünün 6 adet tutarında satın alınmasına tekabül etmektedir.

Ürünün gerekli sayıda biriminin satın alınmasına ilişkin nihai tavsiyeyi doğrulamak için, ürünün olası her bir arz ve talep kombinasyonu (kâr matrisinin her satırı) için varyansı, standart sapmasını ve varyasyon katsayısını hesaplarız:

400 0,1 40 16000
400 0,3 120 48000
400 0,5 200 80000
400 0,1 40 16000
1,0 400 160000
350 0,1 35 12250
500 0,3 150 75000
500 0,5 250 125000
500 0,1 50 25000
1,0 485 2372500
300 0,1 30 9000
450 0,3 135 60750
600 0,5 300 180000
600 0,1 60 36000
1,0 525 285750

Mağaza sahibi tarafından 5 ve 4 adet ürün satın alınmasına kıyasla 6 adet ürün satın alınması ile ilgili olarak, bu açık değildir, çünkü 6 adet ürün satın alma riski (%19.2), 5 birim satın alma riskinden (9.3) daha fazladır. %) ve hatta 4 birim (%0) satın alırken olduğundan daha fazla.

Böylece, beklenen karlar ve riskler hakkında tüm bilgilere sahibiz. Ve mağaza sahibi için her sabah kaç adet ürün almanız gerektiğine, tecrübesini, risk iştahını göz önünde bulundurarak karar verin.

Bize göre, mağaza sahibine her sabah 5 birim ürün alması tavsiye edilmelidir ve ortalama beklenen karı 485 UAH'a eşit olacaktır. ve bunu, ortalama beklenen kârın 525 UAH olduğu, yani 40 UAH olan 6 adet ürünün satın alınmasıyla karşılaştırırsak. daha fazla, ancak bu durumda risk 2.06 kat daha büyük olacaktır.