תוכן עניינים:
כדי לעשות הערכות לגבי אוכלוסייה, סטטיסטיקאים להשתמש נציג מדגם אקראי של האוכלוסייה. לדוגמה, אם אתה שוקל 50 נשים אמריקאיות אקראיות, אתה יכול להעריך את המשקל של כל הנשים האמריקאיות על פי המשקל הממוצע שלהם. שגיאת דגימה מתרחשת כאשר תוצאות הדגימה שלך חורגות מערך האוכלוסייה האמיתי. כלומר, אם 50 הנשים שלך הניבו משקל ממוצע של 135 פאונד כאשר הממוצע האמיתי היה 150 פאונד, אז טעות הדגימה שלך הוא 15 (שנצפתה מינוס בפועל), כלומר אתה לזלזל הערך האמיתי של 15 נקודות. מאחר שהערך האמיתי ידוע רק לעתים רחוקות, סטטיסטיקאים משתמשים באומדנים אחרים כגון טעות סטנדרטית ומרווחי ביטחון כדי לאמוד את טעות הדגימה.
שלב
חישוב אחוז אתה מודד. לדוגמה, אם אתה רוצה לדעת איזה אחוז של תלמידים בבית ספר נתון מעשן סיגריות, אז לקחת מדגם אקראי (נניח n, גודל המדגם שלנו, שווה 30), יש להם למלא סקר אנונימי לחשב את אחוז סטודנטים שאומרים שהם מעשנים. לשם ההמחשה, נניח שש תלמידים אמרו שהם מעשנים. אז אחוז המעשנים = (# מעשנים) / (סה"כ # תלמידים שנמדדו) x 100% = 6/30 x 100% = 20%.
שלב
חישוב השגיאה הרגילה. מכיוון שאיננו יודעים מהו אחוז התלמידים המעשנים בפועל, אנו יכולים רק לשער את שגיאת הדגימה על ידי חישוב השגיאה הסטנדרטית. בסטטיסטיקה, אנו משתמשים בפרופורציה, p, במקום באחוזים לחישובים, אז בואו להמיר 20% לפרופורציה. חלוקת 20% ב 100%, אתה מקבל p = 0.20. שגיאת תקן (SE) עבור גודל מדגם גדול = sqrt p x (1 - p) / n, כאשר sqrt x פירושו לקחת את השורש הריבועי של x. בדוגמה זו, אנו מקבלים SE = sqrt 0.2 x (0.8) / 30 = sqrt 0.00533 …? 0.073.
שלב
צור רווח ביטחון. גבול תחתון: שיעור משוער - 1.96 x SE = 0.2 - 1.96 (0.073) = 0.0569 גובה עליון: יחס משוער + 1.96 x SE = 0.2 + 1.96 (0.073) = 0.343 אז היינו אומרים שאנחנו בטוחים 95% את חלקם האמיתי של המעשנים הוא בין 0.0569 לבין 0.343, או כאחוז, 5.69% או 34.3% מהתלמידים מעשנים. זו התפשטות רחבה מציין את האפשרות של טעות דגימה גדולה למדי.
שלב
למדוד את כולם כדי לחשב את שגיאת הדגימה המדויקת. הפוך את כל התלמידים בבית הספר להשלים את הסקר האנונימי ולחשב את אחוז התלמידים שאמרו כי הם מעשנים. נניח שזה היה 120 מתוך 800 תלמידים שאמרו שהם מעושנים, אז אחוז שלנו הוא 120/800 x 100% = 15%. לכן, "טעות הדגימה שלנו" = (משוער) - (בפועל) = 20 - 15 = 5. קרוב יותר לאפס, כך ההערכה שלנו טובה יותר וטעינת הדגימה שלנו קטנה יותר. במצב אמיתי בעולם, עם זאת, אתה לא צפוי לדעת את הערך בפועל יהיה להסתמך על SE ואת מרווח ביטחון עבור פרשנות.