• Тархалт ба нарийвчлалын диаграммын арга. Жижиг дээжүүд Тархалт ба нарийвчлалын графикийн арга

    21.07.2023

    Хүн өөрийн чадвараа хэрэгжүүлэх гэж оролдсоноор л таньж чадна. (Сенека)

    Bootstrap, жижиг дээжүүд, өгөгдлийн шинжилгээнд ашиглах програм

    гол утга

    Ачаалах аргыг 1979 онд Б.Эфрон Жак хутганы аргын хөгжил гэж санал болгосон.

    Bootstrap-ийн гол санааг тайлбарлая.

    Өгөгдлийн шинжилгээний зорилго нь хамгийн үнэн зөвийг олж авах явдал юм сонгомолүнэлгээ хийж, үр дүнг нийт хүн амд нэгтгэнэ.

    Түүврээс авсан тоон мэдээллийн техникийн нэр томъёо нь түүвэр статистик юм.

    Үндсэн тайлбарлах статистикууд нь сонгомолдундаж, дундаж, стандарт хазайлт гэх мэт.

    Түүврийн дундаж, медиан, корреляци зэрэг хураангуй статистик нь түүврээс түүвэрт өөр өөр байх болно.

    Судлаач хүн амын тооноос хамаарч эдгээр өөрчлөлтийн хэмжээг мэдэх шаардлагатай. Үүний үндсэн дээр алдааны хязгаарыг тооцоолно.

    Хүн бүрийн анхны зураг боломжит утгуудмагадлалын тархалт хэлбэрээр түүвэр статистикийг түүвэрлэлтийн тархалт гэнэ.

    Гол нь хэмжээдээж. Хэрэв түүврийн хэмжээ бага бол яах вэ? Нэг боломжийн арга бол Санамсаргүйодоо байгаа дээжээс өгөгдөл гаргаж авах арга.

    Ачаалагчийн санаа нь статистикийн түүврийн тархалтыг тодорхойлохын тулд дээж дээрх тооцооллын үр дүнг "зохиомол популяци" болгон ашиглах явдал юм. Үнэндээ дүн шинжилгээ хийдэг томачаалах дээж гэж нэрлэгддэг "хий үзэгдэл" дээжийн тоо.

    Ихэвчлэн хэдэн мянган дээжийг санамсаргүй байдлаар үүсгэдэг бөгөөд энэ багцаас бид сонирхож буй статистикийн ачааллын тархалтыг олох боломжтой.

    Тиймээс, бид дээж авъя, эхний алхамд бид түүврийн элементүүдийн аль нэгийг санамсаргүй байдлаар сонгож, энэ элементийг түүвэр рүү буцаана, дахин санамсаргүй байдлаар элемент сонгоно гэх мэт.

    Тайлбарласан санамсаргүй сонголтын процедурыг n удаа давтъя.

    Bootstrap дээр санамсаргүй сонголтыг ашиглан хийдэг буцах,анхны дээжийн сонгосон элементүүд буцаж ирдэгсонгоод дараа нь дахин сонгож болно.

    Албан ёсоор бид алхам бүрт 1/n магадлал бүхий анхны түүврийн элементийг сонгоно.

    Нийтдээ бид анхны түүврийн n элементтэй бөгөөд Ni нь 0-ээс n хооронд хэлбэлздэг тоотой (N 1 ... Nn) түүврийг авах магадлалыг олон гишүүнт тархалтаар тодорхойлдог.

    Хэдэн мянган ийм дээжийг бий болгодог бөгөөд энэ нь орчин үеийн компьютеруудын хувьд нэлээд боломжтой юм.

    Түүвэр бүрийн хувьд ашиг сонирхлын тоо хэмжээг тооцоолж, дараа нь тооцооллыг дундажлана.

    Олон түүврүүд байдаг тул тооцооллын эмпирик тархалтын функцийг байгуулж, дараа нь квантилуудыг тооцоолж, итгэлийн интервалыг тооцоолох боломжтой.

    Ачаалах арга нь Монте Карлогийн аргын өөрчлөлт болох нь тодорхой байна.

    Хэрэв дээж үүссэн бол буцаж ирэхгүйэлементүүд, дараа нь энэ нь болж байна мэдэгдэж байгаа аргаэвхдэг хутга

    Асуулт: Яагаад үүнийг хийдэг вэ, бодит мэдээллийн шинжилгээнд энэ аргыг хэзээ ашиглах нь зүйтэй вэ?

    Ачаалахдаа бид шинэ мэдээлэл олж авдаггүй, харин байгаа даалгаврын дагуу байгаа өгөгдлийг ухаалгаар ашигладаг.

    Жишээлбэл, bootstrap-г ашиглаж болно жижигтүүвэр, медианыг тооцоолох, харилцан хамаарал, итгэлцлийн интервалыг бий болгох болон бусад нөхцөл байдалд.

    Эфроны анхны ажил нь n = 15 түүврийн хэмжээтэй хос корреляцийн тооцоог авч үзсэн.

    B = 1000 bootstrap дээжийг үүсгэсэн (bootstrap replication).

    Олж авсан ro 1 ... ro B коэффициентүүд дээр үндэслэн корреляцийн коэффициентийн ерөнхий тооцоо, стандарт хазайлтын тооцоог байгуулав.

    Хэвийн ойролцоо тооцоогоор тооцоолсон түүврийн корреляцийн коэффициентийн стандарт алдаа нь:

    корреляцийн коэффициент 0.776 бол анхны түүврийн хэмжээ n = 15 байна.

    Стандарт алдааны ачааллын тооцоолол нь 0.127, Efron, Gall Gong, 1982.

    Онолын суурь

    Судалгааны зорилтот параметр, жишээлбэл, сонгосон нийгмийн дундаж орлого байцгаая.

    Хэмжээний дурын түүврийг ашиглан бид өгөгдлийн багцыг олж авна. Харгалзах түүврийн статистикийг үзье

    Ихэнх жишээ статистикийн хувьд энд томутга (>30), түүврийн тархалт нь төв ба стандарт хазайлттай хэвийн муруй бөгөөд эерэг параметр нь популяци болон статистикийн төрлөөс хамаардаг.

    Энэхүү сонгодог үр дүнг төв хязгаарын теорем гэж нэрлэдэг.

    Мэдээллийн шаардлагатай стандарт хазайлтыг тооцоолоход техникийн ноцтой хүндрэлүүд ихэвчлэн гардаг.

    Жишээлбэл, хэрэв дундажэсвэл дээжийн хамаарал.

    Ачаалах арга нь эдгээр бэрхшээлийг даван туулдаг.

    Санаа нь энгийн: анхны түүврээс олж авсан ачаалах түүврээс тооцоолсон ижил статистикийг илэрхийлдэг дурын утгаараа тэмдэглэе.

    Хэрэв "анхны" түүвэр тогтмол байвал түүврийн хуваарилалтын талаар юу хэлэх вэ?

    Хязгаарт түүвэрлэлтийн тархалт нь мөн параметрүүдтэй хонх хэлбэртэй байна

    Тиймээс bootstrap тархалт нь түүврийн тархалттай ойролцоо байна

    Бид нэг дээжээс нөгөөд шилжихэд зөвхөн , илэрхийлэлд өөрчлөлт орж байгааг анхаарна уу, учир нь үүнийг ашиглан тооцоолсон

    Энэ нь үндсэндээ төв хязгаарын теоремын ачаалах хувилбар юм.

    Түүнчлэн хэрэв статистик функцийн ахиу түүвэрлэлтийн тархалт нь популяцийн үл мэдэгдэх зүйлсийг агуулаагүй бол ачаалах тархалт нь төвийн хязгаарын теоремоос түүврийн тархалтыг илүү ойртуулдаг болохыг олж мэдсэн.

    Ялангуяа статистикийн функц нь стандарт алдааны үнэн эсвэл түүврийн үнэлгээг илэрхийлдэг хэлбэртэй байвал хязгаарлах түүврийн тархалт нь ихэвчлэн стандарт хэвийн байдаг.

    Энэ нөлөөг bootstrapping ашиглан хоёр дахь дарааллын залруулга гэж нэрлэдэг.

    Өө. хүн амын дундаж гэх мэт. түүврийн дундаж; Энэ нь популяцийн стандарт хазайлт бөгөөд анхны өгөгдлөөс тооцоолсон түүврийн стандарт хазайлт бөгөөд ачаалах түүврээс тооцоологддог.

    Дараа нь , утгын түүврийн тархалт нь ачаалах түүврийн тархалтаар ойролцоологдох бөгөөд энэ нь ачаалах түүврийн дундаж, .

    Үүний нэгэн адил түүвэрлэлтийн тархалтыг ачаалах тархалтаар ойролцоолно, энд .

    Хоёрдахь эрэмбийн засварын эхний үр дүнг Бабу, Сингх нар 1981-83 онд нийтлэв.

    Bootstrap програмууд

    Түүврийн тооцооны стандарт алдааны ойролцоо тооцоолол

    Параметр нь популяцийн хувьд мэдэгдэж байна гэж үзье

    Хэмжээний санамсаргүй түүврийн үндсэн дээр хийсэн тооцоолол байг, өөрөөр хэлбэл. функц нь Түүвэр нь бүх боломжит түүврийн багцад харилцан адилгүй байдаг тул стандарт алдааг тооцоолохын тулд дараах аргыг ашиглана.

    Хэмжээ тус бүрийн өөр өөр ачаалах дээж дээр үндэслэн ашигласан ижил томъёог ашиглан тооцоолъё. Бүдүүлэгээр хэлэхэд маш том биш л бол хүлээж авч болно. Энэ тохиолдолд та үүнийг богиносгож болно n ln n. Дараа нь үүнийг ачаалах аргын мөн чанарт үндэслэн тодорхойлж болно: популяци (түүвэр) эмпирик популяци (түүвэр) -ээр солигдоно.

    Bootstrap аргыг ашиглан Bayesian засвар

    Түүвэрлэлтийн тархалтын дундаж нь ихэвчлэн том хэмжээтэй, өөрөөр хэлбэл Байесийн ойролцоолсоноос хамаардаг.

    bootstrap хуулбарууд хаана байна. Дараа нь тохируулсан утга нь -

    Жак хутганы арга гэж нэрлэгддэг өмнөх дахин дээж авах арга нь илүү алдартай болохыг тэмдэглэх нь зүйтэй.

    Итгэлийн интервалууд

    Өгөгдсөн параметрийн итгэлцлийн интервал (CI) нь түүвэрт суурилсан мужууд юм.

    Энэ муж нь маш өндөр (урьдчилан тодорхойлсон) магадлал бүхий утгад хамаарах шинж чанартай байдаг. Үүнийг ач холбогдлын түвшин гэж нэрлэдэг. Мэдээжийн хэрэг, энэ магадлал нь ямар ч боломжит дээжинд хамаарах ёстой, учир нь Дээж бүр итгэлийн интервалыг тодорхойлоход хувь нэмэр оруулдаг. Хамгийн түгээмэл хэрэглэгддэг хоёр ач холбогдлын түвшин нь 95% ба 99% юм. Энд бид 95% гэсэн утгыг хязгаарлах болно.

    Уламжлал ёсоор CI нь тоо хэмжээний түүврийн тархалтаас, илүү нарийвчлалтай хязгаараас хамаардаг. Bootstrap ашиглан бүтээж болох хоёр үндсэн итгэлийн интервал байдаг.

    Хувийн арга

    Энэ аргыг танилцуулгад аль хэдийн дурьдсан бөгөөд энэ нь энгийн, байгалийн байдлаас шалтгаалан маш их алдартай байдаг. Бидэнд 1000 bootstrap хуулбар байна гэж бодъё, тэдгээрийг дараах байдлаар тэмдэглэе. Дараа нь итгэлцлийн интервал нь мужаас авсан утгуудыг багтаана. Аргын онолын үндэслэл рүү буцахдаа энэ нь түүвэрлэлтийн тархалтын тэгш хэмийг шаарддаг гэдгийг тэмдэглэх нь зүйтэй тархалт, гэхдээ логикийн хувьд үүнийг тэмдгийн эсрэг утгатай ойролцоо утгатай байх ёстой.

    Төвлөрсөн ачаалах хувь хэмжээ арга

    Түүвэрлэлтийн тархалтыг ачаалах тархалтыг ашиглан ойролцоолсон гэж үзье, өөрөөр хэлбэл ачаалах үед анх таамаглаж байсан шиг. 100-р хувь (ачаалах давталтаар) гэж тэмдэглэе. Дараа нь утга нь 95% -ийн магадлалтайгаар зөв байх болно. Ижил илэрхийлэл нь -аас хүртэлх мужийг ижил төстэй илэрхийлэл болгон хувиргаж болно.

    Bootstrap-t тест

    Өмнө дурьдсанчлан bootstrap нь стандарт алдааны түүврийн тооцоолол байгаа маягтын функцийг ашигладаг

    Энэ нь нэмэлт нарийвчлалыг өгдөг.

    Үндсэн жишээ болгон стандарт t-статистикийг авч үзье (иймээс аргын нэр): өөрөөр хэлбэл, онцгой тохиолдол (хүн амын дундаж), (түүврийн дундаж) ба - түүврийн стандарт хазайлт. Ийм функцийн ачаалах аналог нь юм Энд зөвхөн ачаалах түүврийг ашиглахтай ижил аргаар тооцоолно.

    100-р ачаалах хувь хэмжээг тэмдэглэж, утга нь интервалд оршдог гэж үзье.

    Тэгш байдлыг ашиглах та өмнөх мэдэгдлийг дахин бичиж болно, өөрөөр хэлбэл. интервалд оршдог

    Энэ интервалыг 95% түвшинд ачаалах t-ийн итгэлийн интервал гэж нэрлэдэг.

    Уран зохиолд үүнийг өмнөх аргаас илүү нарийвчлалтай болгоход ашигладаг.

    Бодит өгөгдлийн жишээ

    Эхний жишээ болгон, дэгдээхэйний ангаахайн хурдад гэрлийн нөлөөг харуулсан Холландер ба Вулфийн 1999 оны 63-р хуудасны өгөгдлийг ав.

    Стандарт хайрцагны график нь популяцийн өгөгдөлд хэвийн бус гэж үздэг. Бид медиан ба дундаж утгыг ачаалах шинжилгээ хийсэн.

    Стандарт хязгаарын муруйгаас ялгаатай ачаалах t-гистограмд ​​тэгш хэм байхгүй байгааг тусад нь тэмдэглэх нь зүйтэй. Дундаж ба дундаж (bootstrap хувийн арга ашиглан тооцоолсон) 95% итгэлийн интервал нь ойролцоогоор мужийг хамардаг.

    Энэ хүрээ нь гэрэлтүүлгийн функцээр дэгдээхэйний ангаахай үржлийн үр дүнгийн ерөнхий ялгааг (өсөлт) илэрхийлдэг.

    Хоёрдахь жишээ болгон, мэргэжлийн хөлбөмбөгчдийн биохимийн хүчилтөрөгчийн хэрэгцээ (BOD) болон гидростатик жингийн (HW) үр дүнгийн хоорондын хамаарлыг судалсан Devore 2003, хуудас 553-ын өгөгдлийг авч үзье.

    Хоёр хэмжээст өгөгдөл нь хосоос бүрдэх ба ачаалагчийн дахин дээж авах үед хосыг санамсаргүй байдлаар сонгож болно. Жишээлбэл, эхлээд дараа нь ав гэх мэт.

    Зураг дээр хайрцагны сахалтай график нь суурь популяцийн хувьд хэвийн бус байгааг харуулж байна. Ачаалагч хоёр хувьсах өгөгдлөөр тооцсон корреляцийн гистограммууд нь тэгш бус (зүүн тийш шилжсэн) байна.

    Ийм учраас энэ тохиолдолд төвлөрсөн хувь ачаалах арга нь илүү тохиромжтой.

    Шинжилгээгээр хэмжилтүүд хүн амын дор хаяж 78% -д хамааралтай болохыг тогтоожээ.

    Өгөгдөл жишээ 1:

    8.5 -4.6 -1.8 -0.8 1.9 3.9 4.7 7.1 7.5 8.5 14.8 16.7 17.6 19.7 20.6 21.9 23.8 24.7 24.7 25.0 40.7 46.9 48.3 52.8 54.0

    Жишээ нь өгөгдөл 2:

    2.5 4.0 4.1 6.2 7.1 7.0 8.3 9.2 9.3 12.0 12.2 12.6 14.2 14.4 15.1 15.2 16.3 17.1 17.9 17.9

    8.0 6.2 9.2 6.4 8.6 12.2 7.2 12.0 14.9 12.1 15.3 14.8 14.3 16.3 17.9 19.5 17.5 14.3 18.3 16.2

    Уран зохиолд ихэвчлэн янз бүрийн статистик нөхцөл байдалд найдвартай үр дүнг өгч болох өөр өөр ачаалах схемүүдийг санал болгодог.

    Дээр дурдсан зүйл бол зөвхөн хамгийн үндсэн элементүүд бөгөөд өөр олон схемийн сонголтууд байдаг. Жишээлбэл, хоёр үе шаттай түүвэр эсвэл давхрагатай түүврийн хувьд аль аргыг ашиглах нь дээр вэ?

    Энэ тохиолдолд байгалийн схемийг гаргах нь хэцүү биш юм. Регрессийн загвартай өгөгдлийн хувьд ачаалах нь ихэвчлэн хүмүүсийн анхаарлыг татдаг. Хоёр үндсэн арга байдаг: нэгдүгээрт, ковариац болон хариултын хувьсагчдыг хамтад нь дахин загварчлах (хосоор ачаалах), хоёрдугаарт, ачаалах ажлыг үлдэгдэл дээр гүйцэтгэдэг (үлдэгдэл ачаалах).

    Загваруудын алдааны зөрүү тэнцүү биш байсан ч хосын арга нь зөв хэвээр байна (үр дүнгийн хувьд). Энэ тохиолдолд хоёр дахь арга нь буруу байна. Ийм схем нь стандарт алдааг тооцоолох нэмэлт нарийвчлалыг өгдөг тул энэ сул талыг нөхдөг.

    Хугацааны цувааны өгөгдөлд ачаалах тохиргоог ашиглах нь илүү хэцүү байдаг.

    Гэсэн хэдий ч цаг хугацааны цуврал шинжилгээ нь эконометрикийн гол чиглэлүүдийн нэг юм. Энд хоёр гол бэрхшээл бий: нэгдүгээрт, хугацааны цувааны өгөгдөл нь дараалсан хамааралтай байх хандлагатай байдаг. Энэ нь, гэх мэтээс хамаарна.

    Хоёрдугаарт, статистик популяци цаг хугацааны явцад өөрчлөгддөг, өөрөөр хэлбэл тогтворгүй байдал гарч ирдэг.

    Энэ зорилгоор эх өгөгдлийн хамаарлыг ачаалах дээж, тухайлбал блок дизайн руу шилжүүлэх аргуудыг боловсруулсан.

    Ачаалагч дээжийн оронд дээжийг нэн даруй бүтээдэг блоканхны түүврийн хамаарлыг хадгалсан өгөгдөл.

    Эконометрикийн салбарт ачаалах аргыг ашиглах чиглэлээр нэлээд олон судалгаа хийгдэж байгаа бөгөөд энэ арга нь идэвхтэй хөгжиж байна.

    Цөөн тооны нэгж ажиглагдсан дээж (n< 30), принято называть малыми выборками. Они обычно применяются в том случае, когда невозможно или нецелесообразно использовать большую выборку (исследование качества продукции, если это связано с ее разрушением, в частности на прочность, на продолжительность срока службы и т.д.).

    Жижиг түүврийн ахиу алдааг дараах томъёогоор тодорхойлно.

    Дундаж жижиг түүврийн алдаа:

    жижиг түүврийн зөрүү хаана байна:

    дээж дэх шинж чанарын дундаж утга хаана байна;

    Эрх чөлөөний зэрэглэлийн тоо

    Жижиг түүврийн итгэлцлийн коэффициент нь зөвхөн өгөгдсөн итгэлийн магадлалаас гадна түүвэрлэлтийн нэгжийн тооноос хамаарна.

    Ерөнхий дундаж нь тодорхой хязгаарт байх магадлалыг томъёогоор тодорхойлно

    Оюутны функцийн утга хаана байна.

    Итгэлийн коэффициентийг тооцоолохын тулд дараах томъёог ашиглан функцийн утгыг тодорхойлно.

    Дараа нь Оюутны хуваарилалтын хүснэгтийг ашиглан (Хавсралт 4-ийг үзнэ үү) функцын утга ба градусын тооноос хамааран утгыг тодорхойлно.

    Энэ функцийг мөн бодит нормчлогдсон хазайлт нь хүснэгтийн утгаас хэтрэхгүй байх магадлалыг тодорхойлоход хэрэглэгддэг.


    Сэдэв 7. Харилцааны статистик судалгаа: Статистикийн харилцааны тухай ойлголт. Статистикийн харилцааны төрөл, хэлбэрүүд. Үзэгдлийн хоорондын хамаарлыг статистик судлах асуудал. Нийгэм-эдийн засгийн үзэгдлүүдийн хоорондын холболтын онцлог. Харилцааны статистикийн судалгааны үндсэн аргууд.

    Корреляци - тохиолдол бүрт бус, харин олон тооны тохиолдлуудад дундаж утгаараа чиг хандлага хэлбэрээр илэрдэг холболт.

    Статистикийн судалгааны эцсийн зорилго нь хараат байдлын загварыг практикт ашиглах явдал юм. Энэ асуудлын шийдлийг дараах дарааллаар гүйцэтгэнэ.

    1. Судалж буй үзэгдлийн мөн чанар, шалтгаан-үр дагаврын хамаарлын логик шинжилгээ. Үүний үр дүнд гүйцэтгэлийн үзүүлэлтийг бий болгодог (y),үзүүлэлтээр тодорхойлогддог түүний өөрчлөлтийн хүчин зүйлүүд (x ( , x 2 , x 3 ,..., X").Хоёр тэмдгийн хоорондын хамаарал Тэгээд X)дуудсан хос хамаарал. Үр дүнтэй шинж чанарт хэд хэдэн хүчин зүйлийн нөлөөллийг нэрлэдэг олон хамаарал.

    Ерөнхийдөө холболтууд байж болно ЧигээрээТэгээд урвуу. Шинж чанар нэмэгдсэнтэй шууд холболттой xтэмдэг нь бас нэмэгддэг у,эсрэгээр - тэмдгийн өсөлттэй Xтэмдэг цагтбуурдаг.

    2. Анхдагч мэдээллийг цуглуулж, тархалтын нэгэн төрлийн, хэвийн эсэхийг шалгах. Популяцийн нэгэн төрлийн байдлыг үнэлэхийн тулд хүчин зүйлийн шинж чанарт суурилсан өөрчлөлтийн коэффициентийг ашигладаг

    Хэрэв вариацын коэффициент 33% -иас хэтрэхгүй бол популяцийг нэгэн төрлийн гэж үзнэ. Судалгаанд хамрагдсан хүчин зүйлийн шинж чанарын хэвийн тархалтыг шалгах ( x (, x 2, x 3,..., X")"гурван сигма" дүрмийг ашиглан гүйцэтгэнэ. Тархалтын хэвийн байдлын туршилтын үр дүнг хүснэгт хэлбэрээр үзүүлнэ.

    Жижиг түүврийн арга нь том түүврийн аргаас хэд хэдэн давуу талтай байдаг. Үүний гол давуу тал нь нэгдүгээрт, тооцооллын ажлын хэмжээг багасгах, хоёрдугаарт, том түүврийн аргыг ашиглан хийх боломжгүй цаг хугацааны явцад процессын нарийвчлалын өөрчлөлтийн динамикийг хянах чадвар юм. Том хэмжээний түүврийн арга нь зөвхөн дээж авах үеийн процессын нарийвчлал, тогтвортой байдлын талаархи ойлголтыг өгөх боломжтой бөгөөд хэрэв дээж авсны дараа процессын нөхцөл өөрчлөгдөхгүй бол ирээдүйд ч үлдэх боломжтой. Бодит байдал дээр үйлдвэрлэлийн нөхцлийн ийм хувиршгүй байдлыг урьдчилан таамаглах боломжгүй юм. Жишээлбэл, бар машин дээр ажиллахдаа ээлжийн үед материалыг хэд хэдэн удаа солих (бар солих), элэгдэлд орсон багажийг солих, машиныг тохируулах гэх мэт, энэ нь өмнө нь олж авсан зүйлд ихээхэн засвар хийх боломжтой. түгээлтийн параметрүүд. Бага оврын дээж авах арга нь хэрэв сүүлчийн ээлжийн туршид тодорхой интервалтайгаар тогтмол авдаг бол судалж буй хугацааны үйл явцын төлөв байдлын бүрэн дүр зургийг олж авах, түүний тогтвортой байдлын түвшинг тодорхойлох, мөн шалтгааныг тодорхойлох боломжийг олгодог. хэрэв байгаа бол цаг хугацааны явцад үйл явцын тогтвортой байдлын хангалтгүй байдлын төлөө.

    Жижиг дээж бүхий статистик шинжилгээг дараах байдлаар гүйцэтгэнэ. -ийн дээж n = 5-10 ширхэг. тодорхой тогтмол интервалаар (жишээлбэл, 15-30 минутын дараа) авдаг. Дээж авах хугацааг эмпирик байдлаар тогтоосон бөгөөд энэ нь машины бүтээмж, дээжийн хэмжээ, технологийн процессын тогтвортой байдлын зэргээс хамаарна. Дээж бүрийн хувьд та тооцоолох хэрэгтэй ба С. Дараа нь хоёр зэргэлдээх дээж тус бүрийг ашиглан түүврийн дисперсийн нэгэн төрлийн байдлын таамаглалыг шалгах шаардлагатай. Ф - Фишерийн шалгуур.

    Хэрэв таамаглал батлагдсан бол энэ нь тархалтын тогтвортой байдал эсвэл харьцуулж буй дээжийг ижил популяциас авсан болохыг харуулж байна. Хоёр түүврийн дисперсийн нэгэн төрлийн байдлын таамаглалыг батлахдаа хоёр түүврийн дундаж хэрэгслийн нэгэн төрлийн байдлын таамаглалыг шалгах хэрэгтэй. т -Оюутны шалгалт.

    Хоёр зэргэлдээ түүврийн тэгш байдлын таамаглалыг батлах нь энэ дээжийг авах үед тоног төхөөрөмжийн тохируулгын төв өөрчлөгдөхгүй бөгөөд өмнөх дээж авах үеийнхтэй ижил хэвээр байна гэсэн үг юм. үйл явц тогтвортой байдалд байна. Хоёр дундаж түүврийн тэгш байдлын таамаглал батлагдаагүй тохиолдолд энэ нь дээж авах үед машины тохируулгын төвд шилжсэнийг илтгэнэ. Дээжийг тодорхой интервалаар авдаг тул тааруулах төвийн шилжилт эсвэл тархалтын бүсийн өөрчлөлт илэрсэн тохиолдолд үйл явцын тогтвортой байдлын зөрчил гарсан хугацааг тодорхойлох боломжтой.

    Процессын тогтвортой байдлыг зөрчсөн баримтыг олж мэдсэний дараа энэ үзэгдлийн шалтгааныг хайж олох шаардлагатай газрыг тогтоох боломжтой. Тархалтын тогтворгүй байдлыг илтгэж буй дээжийн хэлбэлзлийн нэг төрлийн бус байдал нь үүний шалтгааныг машин эсвэл төхөөрөмжөөс хайх шаардлагатайг харуулж байна. механик шинж чанарболовсруулсан материал. Түүврийн хэрэгслийн нэг төрлийн бус байдал нь тааруулах төв рүү шилжиж байгааг илтгэнэ (шалтгааныг багажнаас хай).

    Тиймээс тодорхой хугацааны интервалаар ээлжийн үед машины одоогийн гаралтаас жижиг дээж авч, F ба t-шалгуурыг ашиглан тэдгээрийн зөрүүг харьцуулж, үнэлэх замаар дээжийн дундаж болон дисперсийг тооцож, моментуудыг тогтоох боломжтой болно. үйл явцын эмгэг, тэр ч байтугай эдгээр эмгэгийн эх үүсвэрүүд.

    жижиг түүвэр статистик

    S. m.v-ийн эхлэлийг ерөнхийд нь хүлээн зөвшөөрдөг. эсвэл "жижиг n" статистик гэж нэрлэгддэг "жижиг n" статистик нь 20-р зууны эхний арван жилд В.Госсегийн бүтээл хэвлэгдсэнээр үүсгэн байгуулагдсан бөгөөд тэрээр "оюутан"-ын дэвшүүлсэн t-хувралцалтыг байрлуулсан. хэсэг хугацааны дараа дэлхийн алдар нэрийг олж авсан. Тухайн үед Госсет Гиннесийн шар айрагны үйлдвэрт статистикчаар ажиллаж байсан. Түүний үүргүүдийн нэг нь шинэхэн исгэсэн портерын дараалсан багцад дүн шинжилгээ хийх явдал байв. Тэр хэзээ ч тайлбарлаагүй шалтгааны улмаас Госсет шар айрагны агуулах дахь маш олон тооны торхноос авсан дээжийн тоог мэдэгдэхүйц бууруулах санааг туршиж үзсэн бөгөөд портерын чанарыг санамсаргүйгээр хянах боломжтой байв. Энэ нь түүнийг t-тархалтыг дэвшүүлэхэд хүргэсэн. Гиннесийн шар айраг үйлдвэрлэгчдийн дүрэмд ажилчдаа судалгааны үр дүнг нийтлэхийг хориглодог байсан тул Госсет өөрийн туршилтын үр дүнг жижиг дээжийн хувьд t-тараалт болон уламжлалт z-тархалт (хэвийн тархалт) ашиглан чанарын хяналтын дээжийг харьцуулан "Оюутан" гэсэн нууц нэрээр нийтэлжээ. " - иймээс Оюутны t-тархалт гэсэн нэр).

    t-тархалт. t-тархалтын онол нь z-тархалтын онолын нэгэн адил хоёр түүвэр нь нэг популяциас санамсаргүй түүврүүд байдаг тул тооцоолсон статистик (жишээ нь дундаж ба стандарт хазайлт) нь популяцийн параметрүүдийн шударга бус тооцоолол гэсэн тэг таамаглалыг шалгахад хэрэглэгддэг. Гэсэн хэдий ч, хэвийн тархалтын онолоос ялгаатай нь жижиг түүврийн t-тархалтын онол нь априори мэдлэг, хүлээгдэж буй утга, популяцийн дисперсийн талаар нарийн тооцоолол шаарддаггүй. Түүнчлэн, хоёр том түүврийн дундаж хоорондын зөрүүг статистикийн ач холбогдлын үүднээс шалгахын тулд популяцийн шинж чанарууд нь хэвийн тархсан гэсэн үндсэн таамаглалыг шаарддаг боловч t-ийн тархалтын онол нь параметрүүдийн талаархи таамаглалыг шаарддаггүй.

    Ердийн тархалттай шинж чанаруудыг нэг муруй - Гауссын муруйгаар дүрсэлсэн нь дараахь тэгшитгэлийг хангадаг гэдгийг сайн мэддэг.

    t-тархалтын хувьд муруйн бүх бүлгийг дараах томъёогоор илэрхийлнэ.

    Ийм учраас t-ийн тэгшитгэл нь гамма функцийг агуулдаг бөгөөд энэ нь математикийн хувьд n өөрчлөгдөхөд өөр муруй өгөгдсөн тэгшитгэлийг хангана гэсэн үг юм.

    Эрх чөлөөний зэрэг

    t-ийн тэгшитгэлд n үсэг нь t тархалтын тэгшитгэл гэх мэт аливаа момент үүсгэгч функцийн хоёр дахь моментийг илэрхийлдэг популяцийн дисперсийн (S2) тооцоотой холбоотой эрх чөлөөний зэрэг (df)-ийг илэрхийлнэ. . S.-д эрх чөлөөний зэрэглэлийн тоо нь тодорхой төрлийн шинжилгээнд хэсэгчлэн ашигласны дараа хичнээн шинж чанар чөлөөтэй хэвээр байгааг харуулдаг. t-тархалтын хувьд түүврийн дунджаас нэг хазайлт үргэлж тогтмол байдаг, учир нь эдгээр бүх хазайлтын нийлбэр нь тэгтэй тэнцүү байх ёстой. Энэ нь түүврийн дисперсийг S2 параметрийн шударга бус үнэлгээ болгон тооцоолоход квадратуудын нийлбэрт нөлөөлж, df нь түүвэр тус бүрт нэгийг хассан хэмжилтийн тоотой тэнцүү болоход хүргэдэг. Эндээс тэг таамаглалыг шалгах t-статистикийг тооцоолох томъёо, журамд df = n - 2 байна.

    F-pacndivision. t тестээр шалгасан тэг таамаглал нь хоёр түүврийг нэг популяциас санамсаргүй байдлаар авсан эсвэл ижил хэлбэлзэлтэй хоёр өөр популяциас санамсаргүй байдлаар авсан гэсэн үг юм. Хэрэв та шинжилгээ хийх шаардлагатай бол юу хийх хэрэгтэй вэ илүүбүлгүүд? Энэ асуултын хариултыг Госсет т-тархалтыг нээснээс хойш хорин жилийн турш хайсан. 20-р зууны хамгийн нэр хүндтэй хоёр статистикч үүнийг үйлдвэрлэхэд шууд оролцсон. Нэг нь анхны онолыг дэвшүүлсэн Английн хамгийн том статистикч Р.А.Фишер юм. боловсруулалт нь F-тархалтыг үйлдвэрлэхэд хүргэсэн найрлага; Госсетийн санааг хөгжүүлсэн жижиг түүврийн онолын талаархи түүний ажил 20-иод оны дундуур хэвлэгджээ (Фишер, 1925). Өөр нэг нь Америкийн эртний статистикчдийн галактикийн нэг Жорж Снедекор бөгөөд тэрээр хоёр тооцооллын дисперсийн харьцааг тооцоолох замаар дурын хэмжээтэй бие даасан хоёр түүврийг харьцуулах аргыг боловсруулсан. Тэрээр энэ харилцааг Фишерийн нэрээр F-харьцаа гэж нэрлэсэн. Судалгааны үр дүн Snedecor нь F-тархалтыг хоёр статистикийн харьцааны хуваарилалт гэж тодорхойлж эхэлсэн c2, тус бүр өөрийн эрх чөлөөний зэрэгтэй:

    Эндээс Фишерийн дисперсийн шинжилгээний сонгодог бүтээл гарсан бөгөөд энэ нь жижиг түүврийн шинжилгээнд онцгой анхаарал хандуулсан статистикийн арга юм.

    Түүвэрлэлтийн тархалт F (энд n = df) дараах тэгшитгэлээр илэрхийлэгдэнэ.

    t-тархалтын нэгэн адил гамма функц нь F-ийн тэгшитгэлийг хангадаг тархалтын гэр бүл байдгийг харуулж байна. Гэхдээ энэ тохиолдолд дүн шинжилгээнд хоёр df хэмжигдэхүүн хамаарна: тоологчийн эрх чөлөөний градусын тоо ба F харьцааны хуваагч.

    t- болон F-статистикийг тооцоолох хүснэгт. Том түүврийн онол дээр үндэслэсэн S. ашиглан тэг таамаглалыг шалгахдаа ихэвчлэн зөвхөн нэг хайлтын хүснэгт шаардлагатай байдаг - ердийн хазайлтын хүснэгт (z), энэ нь дурын хоёр z утгын хоорондох хэвийн муруйн доорх талбайг тодорхойлох боломжийг олгодог. x тэнхлэг дээр. Гэсэн хэдий ч эдгээр хүснэгтүүд нь эрх чөлөөний зэрэглэлийн янз бүрийн үр дүнд бий болсон төрөл бүрийн хуваарилалт дээр суурилдаг тул t- ба F-тархалтын хүснэгтүүдийг заавал багц хүснэгтэд үзүүлэв. Хэдийгээр том түүврийн ердийн тархалт шиг t ба F-тархалт нь магадлалын нягтын тархалт боловч тэдгээрийг тодорхойлоход ашигладаг дөрвөн арга замаар сүүлийнхээс ялгаатай. Жишээлбэл, t тархалт нь бүх df-ийн хувьд тэгш хэмтэй (тэгшитгэлд t2-г анхаарна уу) боловч түүврийн хэмжээ багасах тусам дээд цэгтээ хүрдэг. Оргил муруй (хэвийн хэмжээнээс их куртозтой) нь Гауссын муруй гэх мэт хэвийн муруйлттай муруйг бодвол асимптоз бага (өөрөөр хэлбэл тархалтын төгсгөлд х тэнхлэгт бага ойрхон) байх хандлагатай байдаг. Энэ ялгаа нь t ба z утгуудад харгалзах x тэнхлэг дээрх цэгүүдийн хооронд мэдэгдэхүйц зөрүү гарахад хүргэдэг. df = 5 ба хоёр сүүлт α түвшин 0.05 бол t = 2.57, харин харгалзах z = 1.96. Тиймээс t = 2.57 нь 5%-ийн түвшинд статистикийн ач холбогдлыг харуулж байна. Гэсэн хэдий ч хэвийн муруйн хувьд z = 2.57 (илүү нарийвчлалтай 2.58) нь статистикийн ач холбогдлын 1% -ийн түвшинг аль хэдийн харуулах болно. Дээжийн тоо хоёр байх үед t нь F-тэй тэнцүү байх тул F тархалттай ижил төстэй харьцуулалтыг хийж болно.

    "Жижиг" дээж гэж юу вэ?

    Нэгэн цагт түүврийг бага гэж үзэхийн тулд хэр том байх ёстой вэ гэсэн асуулт гарч ирсэн. Энэ асуултад ердөө л тодорхой хариулт алга. Гэсэн хэдий ч жижиг ба том түүврийн хоорондох ердийн хил хязгаарыг df = 30 гэж үздэг. Энэ нь зарим талаараа дур зоргоороо шийдвэр гаргах үндэс нь t-тархалтыг хэвийн тархалттай харьцуулах үр дүн юм. Дээр дурдсанчлан t ба z утгуудын хоорондын зөрүү нь df буурах тусам нэмэгдэх хандлагатай бөгөөд df нэмэгдэх тусам буурах хандлагатай байдаг. Үнэн хэрэгтээ t нь df = ∞-ийн хувьд t = z байх хязгаарлах тохиолдлын өмнө z-д ойртож эхэлдэг. Хүснэгтийн t-ийн утгыг энгийн нүдээр шалгах нь df = 30 ба түүнээс дээш утгуудаас эхлэн энэ ойролцооллыг маш хурдан болгодог болохыг харуулж байна. t (df = 30 үед) ба z-ийн харьцуулсан утга нь тэнцүү байна: p = 0.05-ийн хувьд 2.04 ба 1.96; p = 0.01-ийн хувьд 2.75 ба 2.58; p = 0.001-ийн хувьд 3.65 ба 3.29.

    "Жижиг" дээжийн бусад статистик

    Хэдийгээр t, F гэх мэт статистик үзүүлэлтүүд нь жижиг дээжтэй ашиглахад тусгайлан зориулагдсан боловч том сорьцонд адилхан хамааралтай. Гэсэн хэдий ч жижиг дээжийг шинжлэхэд зориулагдсан өөр олон статистик аргууд байдаг бөгөөд энэ зорилгоор ихэвчлэн ашиглагддаг. Энэ нь гэж нэрлэгддэг зүйлийг хэлдэг. параметрийн бус эсвэл хуваарилалтгүй аргууд. Үндсэндээ эдгээр аргуудад гарч буй масштабууд нь харьцаа эсвэл интервалын хуваарийн тодорхойлолтыг хангаагүй масштабыг ашиглан олж авсан хэмжилтэд хэрэглэх зорилготой юм. Ихэнхдээ эдгээр нь дарааллын (зэрэглэл) эсвэл нэрлэсэн хэмжүүр юм. Параметрийн бус хуваарь нь тархалтын параметрүүдийн тухай, ялангуяа тархалтын тооцооны талаархи таамаглал шаарддаггүй, учир нь дарааллын болон нэрлэсэн масштабууд нь тархалтын тухай ойлголтыг арилгадаг. Ийм учраас жижиг дээжийг шинжилж, параметрийн аргыг хэрэглэхэд шаардагдах үндсэн таамаглалыг зөрчих магадлалтай үед интервал ба харьцааны хуваарийг ашиглан олж авсан хэмжилтэд параметрийн бус аргыг ашигладаг. Жижиг түүвэрт боломжийн хэрэглэж болох эдгээр тестүүдэд: Фишерийн үнэн зөв магадлалын тест, Фридманы хоёр хүчин зүйлийн параметрийн бус (зэрэглэл) дисперсийн шинжилгээ, Кендаллын t зэрэглэлийн корреляцийн коэффициент, Кендаллын конкордасын коэффициент (W), Крускалийн H тест - Уоллес орно. параметрийн бус (зэрэглэл) нэг талын дисперсийн шинжилгээ, Манн-Уитни U-тест, медиан тест, тэмдгийн тест, Спирманы зэрэглэлийн корреляцийн коэффициент r, Вилкоксон t-тест.

    Хувьсах чадварыг судлахдаа тоон болон чанарын шинж чанаруудыг ялгаж үздэг бөгөөд тэдгээрийн судалгааг магадлалын онол дээр үндэслэсэн вариацын статистикаар гүйцэтгэдэг. Магадлал нь тухайн хүн тодорхой шинж чанартай таарах давтамжийг илэрхийлдэг. P=m/n, энд m нь өгөгдсөн шинж чанарын үнэ цэнэ бүхий бодгалийн тоо; n нь бүлгийн бүх хүмүүсийн тоо юм. Магадлал нь 0-ээс 1 хооронд хэлбэлздэг (жишээлбэл, магадлал нь 0.02 - сүрэгт ихэр гарч ирэх, өөрөөр хэлбэл 100 төллөлт тутамд хоёр ихэр гарч ирэх). Тиймээс биометрийн судалгааны объект нь янз бүрийн шинж чанар бөгөөд судалгаа нь тодорхой бүлэг объектууд дээр хийгддэг, жишээлбэл. нийт. Ерөнхий болон түүвэр популяци байдаг. Хүн амЭнэ бол судалж буй шинж чанарт үндэслэн бидний сонирхлыг татдаг хүмүүсийн том бүлэг юм. Нийтлэг популяцид нэг төрлийн амьтан эсвэл үүлдэр багтаж болно. Нийт популяци (үүлдэр) нь хэдэн сая амьтдыг агуулдаг. Үүний зэрэгцээ үүлдэр нь олон бүлэгт хуваагддаг, өөрөөр хэлбэл. хувь хүний ​​фермийн сүрэг. Нийт хүн ам нь олон тооны бодгалиас бүрддэг тул үүнийг судлахад техникийн хувьд хүндрэлтэй байдаг. Тиймээс тэд нийт хүн амыг судалдаггүй, харин зөвхөн нэг хэсгийг нь гэж нэрлэдэг сонгонэсвэл түүвэр популяци.

    Түүврийн популяци дээр үндэслэн нийт хүн амыг бүхэлд нь дүгнэнэ. Дээжийг бүх дүрмийн дагуу хийх ёстой бөгөөд үүнд янз бүрийн шинж чанарын бүх үнэ цэнийг агуулсан хүмүүсийг багтаасан байх ёстой. Нийт хүн амын дундаас хүмүүсийг сонгохдоо азын зарчмаар буюу сугалаагаар явуулдаг. Биометрийн хувьд том, жижиг гэсэн хоёр төрлийн санамсаргүй түүвэрлэлт байдаг. Том дээж 30 гаруй хувь хүн эсвэл ажиглалтыг багтаасан нэг гэж нэрлэдэг ба жижиг дээж 30 хүрэхгүй хүн. Том, жижиг түүвэр популяцийн хувьд байдаг янз бүрийн аргамэдээлэл боловсруулах. Статистикийн мэдээллийн эх сурвалж нь амьтныг төрөхөөс эхлээд устгалд оруулах хүртэлх хугацаанд зоотехникийн болон мал эмнэлгийн бүртгэлээс авсан мэдээлэл байж болно. Мэдээллийн өөр нэг эх сурвалж нь хязгаарлагдмал тооны амьтдад хийсэн шинжлэх ухаан, үйлдвэрлэлийн туршилтын өгөгдөл байж болно. Дээжийг авсны дараа боловсруулалт эхэлнэ. Энэ нь сонирхсон амьтдын бүлгүүдийн шинж чанарыг тодорхойлдог олон тооны статистик хэмжигдэхүүн эсвэл коэффициентийг математик хэмжигдэхүүн хэлбэрээр олж авах боломжийг олгодог.

    Биометрийн аргыг ашиглан дараах статистик үзүүлэлт буюу үзүүлэлтүүдийг олж авна.

    1. Өөр өөр шинж чанарын дундаж утгууд (арифметик дундаж, горим, медиан, геометрийн дундаж).

    2. Өөрчлөлтийн хэмжээг хэмждэг коэффициентүүд i.e. (хувьсах чадвар) судалж буй шинж чанар (стандарт хазайлт, хэлбэлзлийн коэффициент).

    3. Шинж чанар хоорондын хамаарлын хэмжээг хэмжих коэффициент (корреляцийн коэффициент, регрессийн коэффициент ба корреляцийн харьцаа).

    4. Статистикийн алдаа, олж авсан статистик мэдээллийн найдвартай байдал.

    5. Генетик, селекцийн асуудлыг судлахтай холбоотой янз бүрийн хүчин зүйл болон бусад үзүүлэлтүүдийн нөлөөн дор үүссэн өөрчлөлтийн хувь хэмжээ.

    Түүврийг статистикийн хувьд боловсруулахдаа популяцийн гишүүдийг вариацын цуврал хэлбэрээр зохион байгуулдаг. Цуврал өөрчлөлт гэдэг нь судалж буй шинж чанарын үнэ цэнээс хамааран хүмүүсийг ангиудад нэгтгэх явдал юм. Вариацын цуваа нь ангилал ба давтамжийн цуврал гэсэн хоёр элементээс бүрдэнэ. Вариацын цуваа нь завсарлагатай эсвэл тасралтгүй байж болно. Зөвхөн бүхэл тоо авах боломжтой функцуудыг дуудна завсрын тоотолгой, өндөгний тоо, гахайн тоо болон бусад. Бутархай тоогоор илэрхийлж болох шинж чанаруудыг дууддаг Үргэлжилсэн(өндөр см, сүүний гарц кг, % өөх тос, амьдын жин ба бусад).

    Вариацын цувралыг бүтээхдээ дараах зарчим, дүрмийг баримтална.

    1. Вариацын цуваа (n) байгуулах хувь хүний ​​тоог тодорхойлох буюу тоолох.

    2. Судалж буй шинж чанарын хамгийн их ба мин утгыг ол.

    3. Ангийн интервалыг тодорхойлно K = max - min / ангийн тоо, ангийн тоог дур мэдэн авна.

    4. Ангиудыг байгуулж, анги тус бүрийн заагийг тогтооно, min+K.

    5. Тэд хүн амын гишүүдийг ангиудад хуваарилдаг.

    Ангиудыг байгуулж, хүмүүсийг ангиудад хуваарилсны дараа вариацын цувааны үндсэн үзүүлэлтүүдийг (X, σ, Cv, Mх, Мσ, Мcv) тооцоолно. Атрибутын дундаж утга нь хүн амыг тодорхойлоход хамгийн их утгыг авсан. Зоотехник, мал эмнэлэг, анагаах ухаан, эдийн засгийн болон бусад бүх асуудлыг шийдвэрлэхдээ тухайн шинж чанарын дундаж үнэ цэнийг (сүргийн сүүний дундаж гарц, өөх тос%, гахайн үржил шим, тахианы өндөгний үйлдвэрлэл болон бусад шинж чанарууд) тодорхойлдог. Шинж чанарын дундаж утгыг тодорхойлсон параметрүүдэд дараахь зүйлс орно.

    1. Арифметик дундаж.

    2. Жигнэсэн арифметик дундаж.

    3. Геометрийн дундаж.

    4. Загвар (Mo)

    5. Медиан (Me) болон бусад үзүүлэлтүүд.

    Арифметик дундажТухайн бүлгийн хувь хүмүүс бүгдэд ижил шинж чанартай байсан бол ямар шинж чанартай болохыг харуулдаг бөгөөд X = A + b × K томъёогоор тодорхойлогддог.

    Арифметик дундажийн гол шинж чанар нь шинж чанарын хэлбэлзлийг арилгаж, нийт хүн амд нийтлэг болгодогт оршино. Үүний зэрэгцээ арифметик дундаж нь хийсвэр утгыг авдаг гэдгийг тэмдэглэх нь зүйтэй. Үүнийг тооцоолохдоо бодит байдал дээр байхгүй байж болох бутархай үзүүлэлтүүдийг олж авдаг. Тухайлбал: 100 үнээнээс тугалын гарц 85.3 тугал, хээлтэгчийн үржил шим 11.8 гахай, тахианы өндөгний гарц 252.4 өндөг болон бусад үзүүлэлтүүд байна.

    Арифметик дундажийн утга нь мал аж ахуй, хүн амын онцлогт маш өндөр байдаг. Мал аж ахуй, тэр дундаа мал аж ахуйн практикт жигнэсэн арифметик утгыг ашиглан саалийн үед сүүний өөх тосны дундаж хэмжээг тодорхойлдог.

    Геометрийн дундаж утгаХэрэв арифметик дундаж нь өгөгдлийг гажуудуулж байгаа үед өсөлтийн хурд, хүн амын өсөлтийн хурдыг тодорхойлох шаардлагатай бол тооцоолно.

    Загвар тоон болон чанарын аль алиных нь ялгаатай шинж чанарын хамгийн их тохиолддог утгыг нэрлэ. Үнээний модаль дугаар нь хөхний дугаар-4 юм. Хэдийгээр тав, зургаан хөхтэй үнээ байдаг. Вариацын цувралд модаль анги нь хамгийн олон давтамжтай анги байх бөгөөд бид үүнийг тэг анги гэж тодорхойлдог.

    Медиан хүн амын бүх гишүүдийг хоёр тэнцүү хэсэгт хуваасан хувилбар гэж нэрлэдэг. Популяцийн гишүүдийн тал хувь нь дундаж үзүүлэлтээс бага хувьсах шинж чанартай байх ба нөгөө тал нь дундаж үзүүлэлтээс их байх болно (жишээлбэл: үүлдрийн стандарт). Чанарын шинж чанарыг тодорхойлоход медианыг ихэвчлэн ашигладаг. Жишээ нь: дэлэнгийн хэлбэр нь аяга хэлбэртэй, дугуй, ямаатай. Түүвэрлэлтийн зөв сонголттой бол бүх гурван үзүүлэлт ижил байх ёстой (жишээлбэл, X, Mo, Me). Тиймээс популяцийн эхний шинж чанар нь дундаж утгууд боловч тэдгээр нь хүн амыг шүүх хангалттай биш юм.

    Аливаа популяцийн хоёр дахь чухал үзүүлэлт бол шинж чанарын хэлбэлзэл эсвэл хувьсах чанар юм. Аливаа шинж чанарын хувьсах чадварыг олон хүчин зүйлээр тодорхойлдог гадаад орчинболон дотоод хүчин зүйлүүд, жишээлбэл. удамшлын хүчин зүйлүүд.

    Тухайн шинж чанарын хувьсах чадварыг тодорхойлох их ач холбогдол, биологи болон мал аж ахуйн практикт аль алинд нь. Тиймээс шинж чанарын хувьсах түвшинг хэмждэг статистик үзүүлэлтүүдийг ашиглан эдийн засгийн хувьд ашиг тустай янз бүрийн шинж чанаруудын үүлдрийн ялгааг тогтоох, янз бүрийн бүлгийн амьтдын сонгон шалгаруулалтын түвшин, түүний үр нөлөөг урьдчилан таамаглах боломжтой. .

    Одоогийн байдалСтатистикийн шинжилгээ нь фенотипийн хэлбэлзлийн илрэлийн түвшинг тогтоохоос гадна фенотипийн хувьсах чанарыг түүний бүрэлдэхүүн хэсэг, тухайлбал генотип ба паратипийн хувьсах чанарт хуваах боломжийг олгодог. Хувьсах байдлын энэхүү задралыг дисперсийн шинжилгээ ашиглан хийдэг.

    Хувьсах байдлын гол үзүүлэлтүүд нь дараах статистик утгууд юм.

    1. Хязгаарлалт;

    2. Стандарт хазайлт (σ);

    3. Хувьсах буюу хэлбэлзлийн коэффициент (Cv).

    Аливаа шинж чанарын хувьсах хэмжээг илэрхийлэх хамгийн энгийн арга бол хязгаар юм. Хязгаарыг дараах байдлаар тодорхойлно: атрибутын хамгийн их ба хамгийн бага утгуудын хоорондох зөрүү. Энэ ялгаа их байх тусам энэ шинж чанар нь өөрчлөгддөг. Тухайн шинж чанарын хувьсах чадварыг хэмжих гол параметр нь стандарт хазайлт буюу (σ) бөгөөд дараах томъёогоор тодорхойлогддог.

    σ = ±К ∙ √∑ Па 2- б 2

    Стандарт хазайлтын үндсэн шинж чанарууд i.e. (σ) нь дараах байдалтай байна.

    1. Сигма нь үргэлж нэрлэгдсэн утга бөгөөд илэрхийлэгддэг (кг, г, метр, см, ширхэг).

    2. Сигма нь үргэлж эерэг утгатай байдаг.

    3. σ-ийн утга их байх тусам шинж чанарын хэлбэлзэл их болно.

    4. Вариацын цувралд бүх давтамжийг ±3σ-д оруулна.

    Стандарт хазайлтыг ашиглан тухайн хувь хүн аль вариацын цувралд хамаарахыг тодорхойлж болно. Хязгаар ба стандарт хазайлтыг ашиглан шинж чанарын хувьсах чадварыг тодорхойлох аргууд нь сул талуудтай байдаг, учир нь хувьсах чадвараас хамааран өөр өөр шинж чанарыг харьцуулах боломжгүй байдаг. Нэг амьтан эсвэл нэг бүлгийн амьтдын янз бүрийн шинж чанаруудын хэлбэлзлийг мэдэх шаардлагатай, жишээлбэл: сүүний гарц, сүүний өөх тосны агууламж, амьд жин, сүүний өөхний хэмжээ. Тиймээс эсрэг шинж чанаруудын хувьсах чадварыг харьцуулж, тэдгээрийн хувьсах түвшинг тодорхойлох замаар хувьсах чадварын коэффициентийг дараахь томъёогоор тооцоолно.

    Ийнхүү популяцийн гишүүдийн шинж чанарын хэлбэлзлийг үнэлэх үндсэн аргууд нь: хязгаар; стандарт хазайлт (σ) ба хэлбэлзлийн коэффициент буюу хувьсах чадвар.

    Мал аж ахуйн практик болон туршилтын судалгаанд ихэвчлэн жижиг дээжтэй тулгардаг. Жижиг дээжтэд 30-аас ихгүй эсвэл 30-аас доош хувь хүн эсвэл амьтны тоог нэрлэдэг. Тогтсон хэв маягийг бага хэмжээний түүвэр ашиглан нийт популяцид шилжүүлдэг. Жижиг түүврийн хувьд том түүврийн (X, σ, Cv, Mx) ижил статистик үзүүлэлтүүдийг тодорхойлно. Гэсэн хэдий ч тэдгээрийн томъёо, тооцоолол нь том түүврээс (өөрөөр хэлбэл, вариацын цувралын томъёо, тооцооноос) ялгаатай байдаг.

    1. Арифметик дундаж утга X = ∑V

    V - сонголт эсвэл шинж чанарын үнэмлэхүй утга;

    n нь хувилбаруудын тоо эсвэл хувь хүний ​​тоо юм.

    2. Стандарт хазайлт σ = ± √ ∑α 2

    α = x-¯x, энэ нь сонголтын утга ба арифметик дундажийн хоорондох зөрүү юм. Энэ ялгаа α квадрат ба α 2 n-1 нь эрх чөлөөний зэрэглэлийн тоо, өөрөөр хэлбэл. бүх хувилбарууд эсвэл хувь хүмүүсийн тоо нэгээр буурсан (1).

    Хяналтын асуултууд:

    1. Биометр гэж юу вэ?

    2. Хүн амыг ямар статистик үзүүлэлтээр тодорхойлдог вэ?

    3.Хувьсах чанарыг ямар үзүүлэлтээр тодорхойлдог вэ?

    4. Жижиг дээж гэж юу вэ

    5. Мод ба медиан гэж юу вэ?

    Лекц №12

    Биотехнологи ба үр хөврөл шилжүүлэн суулгах

    1. Биотехнологийн тухай ойлголт.

    2. Донор болон реципиент үнээ сонгох, үр хөврөл шилжүүлэн суулгах.

    3. Мал аж ахуйд шилжүүлэн суулгахын ач холбогдол.



    Үүнтэй төстэй нийтлэлүүд
    • Баланс дахь өглөг

      Аж ахуйн нэгжийн эдийн засгийн үйл ажиллагаанд өр үүсэхэд хүргэдэг олон асуудал үүсдэг. Гэсэн хэдий ч энэ нь үргэлж сөрөг байдаггүй. Тухайлбал, байгууллагуудын өртэй (авлага) юу ч байхгүй...

      Керамик хавтанцар
    • Шар айраг, архинд хэдэн калори байдаг вэ?

      Согтууруулах ундааны калорийн агууламж нь согтууруулах ундааны агууламжаас шууд хамаардаг. Тэдний нэг болох хамгийн алдартай нь шар айраг учраас бид тэндээс мэдээллээр “аялал” эхлэх болно. Шар айрагны калорийн агууламж: 100 (нэг зуун) грамм бүтээгдэхүүнд дунджаар дөчин...

      Хувийн байшин
    • Нэрс чанамал бялууг хэрхэн хийх вэ

      Энэ нийтлэлд та нэрсний чанамалтай амттай богино талхны бялууг хэрхэн яаж ташуурдах талаар алхам алхмаар жор олох болно. Бэлтгэхэд хэцүү зүйл байхгүй, тэр ч байтугай энэ өдрөөс өмнө юу ч жигнэж үзээгүй хүүхэд ч гэсэн үүнийг даван туулж чадна гэж би бодож байна. талаар...

      Дулаан шал