Հոդվածներ

8.4. Median և IQR


8.4. Median և IQR

8.4. Median և IQR

Հիշենք, որ երբ մենք նկարագրում ենք քանակական փոփոխականի բաշխումը, մենք նկարագրում ենք տվյալների ընդհանուր ձևը (ձևը, կենտրոնը և տարածումը) և օրինաչափությունից շեղումները (դուրս): Քանակական տվյալների & # 8220Distributions կենտրոնի քանակի & # 8221 և & # 8220Measures կենտրոնում & # 8221 մենք կենտրոնացել ենք բաշխման ձևի և կենտրոնի նկարագրման վրա: Մենք նաև ուսումնասիրեցինք, թե ինչպես է ձևը ազդում կենտրոնի չափումների ընտրության վրա: & # 8220 «Միջին» և «8221» հարաբերականորեն փոփոխվող փոփոխականության և «Միջինին» համեմատ քանակական փոփոխականության մեջ և # 8221-ում մենք կենտրոնանում ենք բաշխման տարածումը ավելի ճշգրիտ նկարագրելու վրա:

Մենք սկսում ենք նկարագրել միջինի մասին տարածվածությունը:

Օրինակ


Outriers և Tukey Fences:

Երբ նմուշում չկան շրջագծեր, միջին և ստանդարտ շեղումները օգտագործվում են համապատասխանաբար բնորոշ արժեքը և փոփոխականությունը ամփոփելու համար: Երբ նմուշի մեջ կան ծայրամասեր, համապատասխանաբար բնորոշ արժեքը և փոփոխականությունը ամփոփելու համար օգտագործվում են միջինը և միջքարտային տիրույթը:

Նմուշում ծայրամասերը որոշելու մի քանի մեթոդներ կան: Շատ սիրված մեթոդը հիմնված է հետևյալի վրա.

Արտաքին արժեքները Q- ից ցածր արժեքներ են1-1.5 (Հ31) կամ Q- ից բարձր3+1.5 (Հ31) կամ դրան համարժեք `Q- ից ցածր արժեքներ1-1.5 IQR կամ ավելի բարձր Q3+1.5 IQR:

Դրանք հիշատակվում են որպես Tukey ցանկապատեր: 6 Դիաստոլիկ արյան ճնշման համար ստորին սահմանը 64 - 1.5 է (77-64) = 44.5, իսկ վերին սահմանը `77 + 1.5 (77-64) = 96.5: Դիաստոլիկ արյան ճնշումը տատանվում է 62-ից 81-ի սահմաններում: Տիպիկ դիաստոլիկ արյան ճնշման լավագույն ամփոփագիրը միջինն է (այս դեպքում ՝ 71.3), իսկ փոփոխականության լավագույն ամփոփագիրը տրված է ստանդարտ շեղմամբ (s = 7.2):

Աղյուսակ 13-ը ցույց է տալիս Ֆրամինգհեմի սերունդների ուսումնասիրության յոթերորդ քննությանը մասնակցած n = 10 մասնակիցների ենթանմուշի շարունակական փոփոխականներից յուրաքանչյուրի համար նախատեսված միջոցները, ստանդարտ շեղումները, մեդիանները, քառորդները և միջքարտերի միջակայքերը:


Բնակչության պարամետրերն ընդդեմ ընտրանքային վիճակագրության

Ամբողջ բնակչության համար նկարագրական միջոցը «պարամետր» է: Բնակչության բազմաթիվ պարամետրեր կան, օրինակ ՝ բնակչության չափը (N) մեկ պարամետր է, և միջին դիաստոլիկ արյան ճնշումը կամ բնակչության միջին մարմնի քաշը կլինի այլ պարամետրեր, որոնք վերաբերում են շարունակական փոփոխականներին: Բնակչության այլ պարամետրերը կենտրոնանում են դիսկրետ փոփոխականների վրա, ինչպիսիք են բնակչության ներկա ծխողների տոկոսը կամ 2-րդ տիպի շաքարային դիաբետով տառապող մարդկանց տոկոսը: Առողջության հետ կապված վարքագիծը կարելի է նաև այս կերպ մտածել, ինչպիսին է բնակչության այն տոկոսը, որը ամեն տարի պատվաստվում է գրիպի դեմ կամ տոկոսը, որը մեքենայի վարման ժամանակ կանոնավոր կերպով կապում է անվտանգության գոտին:

Այնուամենայնիվ, պարամետրերի ուղղակիորեն չափումը, ընդհանուր առմամբ, անհնար է, քանի որ այն պահանջում է տեղեկատվություն հավաքել բնակչության բոլոր անդամներից: Հետևաբար, մենք բնակչությունից նմուշներ ենք վերցնում, և նմուշի նկարագրական միջոցառումները կոչվում են որպես «« նմուշային վիճակագրություն »կամ պարզապես« վիճակագրություն »: Օրինակ ՝ միջին դիաստոլիկ արյան ճնշումը, մարմնի միջին քաշը և ծխողների տոկոսը բնակչության նմուշում կլինի ընտրանքային վիճակագրություն: Ստորև նկարում Մասաչուսեթսի մեծահասակների բնակչության համար իրական միջին դիաստոլիկ ճնշումը 78 միլիմետր սնդիկ է (մմ ս.ս.), սա բնակչության պարամետր է: Պատկերը ցույց է տալիս նաև երեք առանձին նմուշների միջին դիաստոլիկ ճնշումը: Այս միջոցները ընտրանքային վիճակագրություն են, որոնք մենք կարող ենք օգտագործել ամբողջ բնակչության պարամետրը գնահատելու համար: Այնուամենայնիվ, նշենք, որ ընտրանքային վիճակագրությունը բոլորը մի փոքր տարբեր են, և նրանցից ոչ մեկը հենց նմուշն է որպես բնակչության պարամետր:

Որոշ հիմունքներ նկարագրելու համար եկեք քննարկենք մի շատ փոքր նմուշ ՝ ստորև բերված աղյուսակում ներկայացված տվյալներով:

Աղյուսակ - Փոքր նմուշի տվյալների արժեքները

Նշենք, որ տվյալների աղյուսակում կան շարունակական փոփոխականներ (տարիքը, հիվանդանոցում մնալու տևողությունը, մարմնի զանգվածի ինդեքսը) և առանձնացված փոփոխականներ, որոնք երկփոփոխ են (տիպ 2 շաքարախտ և ներկայիս ծխելը): Եկեք առաջին հերթին կենտրոնանանք շարունակական փոփոխականների վրա, որոնք մենք կամփոփենք ՝ հաշվարկելով կենտրոնական չափում և նշելով, թե որքան տարածում կա այդ կենտրոնական գնահատման շուրջ:


Նեյրոբլաստոմայով հիվանդների ռեցիդիվից հետո կրկնության և գոյատևման տևողության հետ կապված գործոններ

Նախապատմություն. Չնայած թերապևտիկ առաջընթացին, նեյրոբլաստոմայով հիվանդների ռեցիդիվից հետո գոյատևումը մնում է աղքատ: Մենք ուսումնասիրեցինք կլինիկական և կենսաբանական գործոնները, կապված Մեծ Բրիտանիայի նեյրոբլաստոմայի հիվանդների ռեցիդիվից հետո, առանց պրոգրեսիայից ազատ և ընդհանուր գոյատևման:

Մեթոդներ. Վերականգնված նեյրոբլաստոմայի բոլոր դեպքերը, որոնք ախտորոշվել են 1990-2010թթ. Ընթացքում, հայտնաբերվել են մանկական ուռուցքաբանության չորս հիմնական բուժման կենտրոններից: Kaplan-Meier- ի և Cox- ի ռեգրեսիայի անալիզներն օգտագործվել են հետընտրական ռեցիդիվի ընդհանուր գոյատևման (ՊՐՈՍ), հետհարձակումային պրոգրեսիայից ազատ գոյատևման (PRPFS) հաշվարկման համար `ռեցիդիվի և հետագա առաջընթացի միջև, և ազդեցության գործոնները ուսումնասիրելու համար:

Արդյունքներ Բացահայտվել է հարյուր ութսունինը դեպք, 159 (84.0%) բարձր ռիսկի և 17 (9.0%), չվերականգնվող, MYCN ոչ ուժեղացված (ոչ MNA) միջանկյալ ռիսկ (IR): Բարձր ռիսկային հիվանդների մոտ ախտորոշված ​​& gt2000, միջին PROS- ը 8.4 ամիս էր (միջքարտոտ միջակայք (IQR) = 3.0-17.4), իսկ միջին PRPFS- ը ՝ 4.7 ամիս (IQR = 2.1-7.1): IR- ով չվերաբերվող ոչ MNA հիվանդների համար միջին PROS– ը 11,8 ամիս էր (IQR 9,0-51,6), իսկ 5-ամյա PROS– ը ՝ 24% (95% CI 7-45%): MYCN ուժեղացված (MNA) հիվանդությունն ու ոսկրածուծի մետաստազները ախտորոշման ժամանակ անկախորեն կապված էին բարձր ռիսկի դեպքերի ավելի վատ PROS- ի հետ: Բարձր ռիսկի ռեցիդիվների ութսուն տոկոսը տեղի է ունեցել ախտորոշումից 2 տարվա ընթացքում `համեմատած ոչ MNA IR անառողջացվող հիվանդության 50% -ի հետ:

Եզրակացություններ. Ռեցիդիվային ՄՌ նեյրոբլաստոմաներով հիվանդները պետք է շերտավորվեն ըստ MYCN կարգավիճակի, և PRPFS- ը պետք է լինի առաջնային վերջնական կետ վաղ փուլի կլինիկական փորձարկումների ժամանակ: Մտահոգիչ է IR նեյրոբլաստոմայի մեծ մասի փրկության ձախողումը `աջակցելով այս խմբի նախնական բուժման ռեժիմների ակտիվացման հետաքննությանը` պարզելու, թե արդյո՞ք դրանց օգտագործումը կնվազեցնի ռեցիդիվի հավանականությունը:

Շահերի բախման մասին հայտարարություն

Դոկտոր Լուկաս Մորենոն բացահայտում է հետևյալ գործողությունները. Խորհրդատվական / խորհրդատվական խորհրդի մասնակցություն Novartis- ի, AstraZeneca- ի, RocheGenentech- ի, Mundipharma- ի և Bayer- ի համար: Մնացած հեղինակները շահերի բախում չեն հայտարարում:


Բեռնել փաթեթները

Օգտագործման ամենապարզ դեպքը

Օգտագործման ամենապարզ դեպքն է ՝ ամբողջ տվյալների բազայի ամփոփումը: Դուք պարզապես կարող եք տվյալների շրջանակում կերակրել CreatTableOne () հիմնական աշխատանքային ձիու գործառույթին: Դուք կարող եք տեսնել, որ տվյալների շտեմարանում կա 418 հիվանդ:

Կատեգորիայի փոփոխական փոխակերպում

Կատեգորիկ փոփոխականների մեծ մասը ծածկագրված է թվայինորեն, ուստի մենք կամ ստիպված ենք դրանք վերափոխել տվյալների բազայի գործոնների, կամ էլ գործարկման գործոն օգտագործել ՝ դրանք թռիչքի ժամանակ փոխակերպելու համար: Նաև ավելի լավ պրակտիկա է հստակեցնել, թե որ փոփոխականներն է ամփոփել vars փաստարկի միջոցով և բացառել ID փոփոխական (ներ) ը: Ինչպե՞ս իմանալ, թե որոնք են թվային կոդավորված կատեգորիկ փոփոխականներ: Խնդրում ենք ստուգել ձեր տվյալների բառարանը (այս դեպքում օգնեք (pbc)): Այս անգամ արդյունքի օբյեկտը փրկում եմ փոփոխականում:

ԼԱՎ. Հիմա դա ավելի մեկնաբանելի է: Երկուական կատեգորիկ փոփոխականներն ամփոփվում են որպես երկրորդ մակարդակի հաշվարկներ և տոկոսներ: Օրինակ, եթե այն ծածկագրված է որպես 0 և 1, ապա «1» մակարդակն ամփոփվում է: 3+ կարգի փոփոխականի համար ամփոփվում են բոլոր մակարդակները: Խնդրում ենք նկատի ունենալ, որ տոկոսները հաշվարկվում են բացակայող արժեքները բացառելուց հետո:

Showingուցադրելով բոլոր մակարդակները կատեգորիկ փոփոխականների համար

Եթե ​​ցանկանում եք ցույց տալ բոլոր մակարդակները, կարող եք օգտագործել showAllLevels փաստարկը տպել () մեթոդի վրա:

Մանրամասն տեղեկություններ, ներառյալ բացակայությունը

Եթե ​​Ձեզ անհրաժեշտ է ավելի մանրամասն տեղեկատվություն ՝ ներառյալ բացակայող թիվը / համամասնությունը: Օգտագործեք ամփոփ () մեթոդը արդյունքի օբյեկտի վրա: Սկզբում ցուցադրվում են շարունակական փոփոխականները, իսկ երկրորդում ՝ կատեգորիկ փոփոխականները:

Ամփոփելով ոչ նորմալ փոփոխականները

Կարծես շարունակական փոփոխականների մեծ մասը շեղված է, բացառությամբ ժամանակի, տարիքի, ալբումինի և թրոմբոցիտների (բիոմարկետները սովորաբար բաշխվում են ուժեղ դրական թեքություններով): Դրանք որպես այդպիսին ամփոփելը կարող է գոհացնել ձեր ապագա գնահատող (ներ) ին: Եկեք դա անենք print () մեթոդի ոչ նորմալ փաստարկով: Տեսնո՞ւմ եք տարբերությունը: Եթե ​​դուք պարզապես ասում եք ոչ նորմալ = TRՇՄԱՐՏՈՒԹՅՈՒՆ, բոլոր փոփոխականներն ամփոփվում են «ոչ նորմալ» եղանակով:

Նուրբ կարգավորում

Եթե ​​ցանկանում եք աղյուսակը ավելի լավ կարգավորել, ստուգեք print.TableOne- ը ՝ ընտրանքների ամբողջական ցանկի համար:


8.4. Median և IQR

Հինգ համարի ամփոփումը տվյալների բաշխումն ամփոփելու մեթոդ է: Հինգ թվերը նվազագույնն են, առաջին քառորդի (Q1) արժեքը, միջինը, երրորդ քառորդը (Q3) արժեքը և առավելագույնը:

Տվեք հինգ թվերի ամփոփագիրը հետևյալ տվյալների հավաքածուի համար.

1, 2, 2, 2, 3, 3, 4, 5, 5, 5, 6, 6, 6, 6, 7, 8, 8, 9, 27

Առաջին բանը, որ կարող եք նկատել այս տվյալների հավաքածուի վերաբերյալ, 27 համարն է: Սա շատ տարբեր է մնացած տվյալների հետ: Այն դուրս է մնում և պետք է հեռացվի: Երբ խոսքը վերաբերում է ծայրամասերին, մենք հեռացնում ենք այն ամենը, ինչը չի գտնվում ցածր ցանկապատի և վերին ցանկապատի միջև.

Այստեղ մենք նախ գտնում ենք Առաջին եռամսյակի (Q1) և Երրորդ եռամսյակի (Q3) արժեքները: Դրանից հետո մենք օգտագործում ենք այդ երկու արժեքները ՝ Interquartile Range (IQR) գտնելու համար: Վերջապես, մենք կարող ենք օգտագործել այդ արժեքները `գտնելու ստորին և վերին ցանկապատերը: Միացնելով արժեքները, մենք գտնում ենք -3 ցածր պարիսպ և 13-ի վերին ցանկապատ: Մենք այժմ 27-ը հանում ենք տվյալների սկզբնական հավաքածուից, քանի որ այն ընկնում է այս միջակայքից դուրս: Մեր նոր տվյալների հավաքածուն է.


Միջքաղաքային, կիսամյակային և միջին չորրորդային միջակայքեր

Տվյալների հավաքածուում քառորդները այն արժեքներն են, որոնք բաժանվում են տվյալները չորս հավասար մասերի: Տվյալների բազմության միջինը բաժինը բաժանում է կեսի:

Տվյալների հավաքածուի ստորին կեսի միջինը ստորին քառորդն է (L Q) կամ Q 1:

Տվյալների ամբողջության վերին կեսի միջինը վերին քառորդն է (U Q) կամ Q 3:

Վերին և ստորին քառորդները կարող են օգտագործվել տատանման մեկ այլ չափանիշ գտնելու համար `կոչելով միջքարտային տիրույթը:

Ի միջքարտային տիրույթ կամ IQR- ը տվյալների հավաքածուի միջին կեսի միջակայքն է: Դա վերին և ստորին քառորդների տարբերությունն է:

Interquartile միջակայքը = Q 3 & մինուս Q 1

Վերոնշյալ օրինակում ստորին քառորդը 52 է, իսկ վերին քառորդը ՝ 58:

Միջքարտերի միջակայքը 58 է և մինուս 52 կամ 6:

Տվյալները, որոնք ավելի քան 1,5 անգամ ավելի են, քան քառորդներից այն կողմ միջքարտային տիրույթի արժեքը, կոչվում են օտարերկրյա:

Վիճակագիրները երբեմն օգտագործում են նաև տերմինները կիսամյակային միջսեռային տիրույթ և միջին եռամսյակային տիրույթ .

Կիսամիջքարտիլային տիրույթը մեկ և կես տարբերությունն է առաջին և երրորդ քառորդների միջև: Դա կես միավորն անցնելու համար անհրաժեշտ հեռավորության կեսն է: Կիսամիջմորտալային տիրույթը շատ քիչ է ազդում ծայրահեղ միավորների վրա: Սա այն դարձնում է տարածման լավ միջոց շեղված բաշխումների համար: Այն ձեռք է բերվում գնահատելով Q 3 & մինուս Q 1 2:

Քառորդի միջին միջակայքը թվային արժեքն է առաջին և երրորդ քառորդների միջև: Դա առաջին և երրորդ քառորդների գումարների կեսն է: Այն ստացվում է Q 3 + Q 1 2 գնահատելով:

(Միջինը, միջնաժամկետը և միջին չորրորդը միշտ չէ, որ նույն արժեքն են, չնայած կարող են լինել):


Հավելված

Emory COVID-19 Որակի և կլինիկական հետազոտությունների համատեղ անդամներ (այբբենական կարգով). Մաքս Վ. Ադելման, Սքոթ Առնո, Սառա Ս. Ալդ, Թերեզա Բարնս, Ուիլյամ Բենդեր, M.եյմս Մ. Բլում, Գաուրավ Բուդարանի, Ստեֆանի Բասբի, Լորենս Բուս, Մարկ Քարիդի-Շեյբլ, Դեյվիդ Քարփնտեր, Նիկուլկումար Չաուդարի, Քրեյգ Մ. Կուպերսմիթ, Լիզա Դանիելս, Janeեյն Ֆազիո, Բաբար Ֆիզա, Էլիանա Գոնսալես, Ռիա Գրիպալդո, Չարլզ Գրոցին, Ռոբերտ Գրոֆ, Ալֆոնսո Ս. Հերնանդես-Ռոմիե, Մաքս Հոկշտեյն, Դեն Հանթ, Քրեյգ S. Jabaley, Jesse T. Jacob, Colleen Kraft, Greg S. Martin, Samer Melham, Nirja Mehta, Chelsea Modlin, David J. Murphy, Mia Park, Deepa Patel, Cindy Powell, Amit Prabhaker, Jeeyon Rim, Ramzy Rimawi, Chad Robichaux, Nicholas Scanlon, Milad Sharifpour, Bashar Staitieh, Michael Sterling, Jonathan Suarez, Colin Swenson, Nancy Thakkar, Alexander Truong, Hima Veeramachaneni, Alvaro Velasquez, Michael Waldmann, Max Weinmann, Thanushi Wynn, and Joel Zivot.


Դիտեք տեսանյութը: Մեր դրամաները Ծաղկաձորում (Դեկտեմբեր 2021).