מבוא

אנחנו מתחילים היום את החומר שממש לשמו התכנסנו כאן - הנושא של הסקה סטטיסטית. בפרט, אנחנו נתחיל בנושא של אומדן (Estimation).

״אומדן״ הוא תהליך של אומדן פרמטר, או ניסיון לנחש ערך של פרמטר כלשהו. ״אומדן ממוצע מדגם״ יהיה הדוגמה שתוביל אותנו - ננסה לנחש ערך של פרמטר תוחלת באוכלוסייה באמצעות התצפיות, למשל, באמצעות ממוצע מדגם ועוד סטטיסטיים אחרים של המדגם.

מטרת ההסקה הסטטיסטית

אפשר לומר שכל העולם של הסקה סטטיסטית מתחלק לשניים:

אומדן (Estimation)

בתהליך של אומדן אנחנו מעריכים גודל של פרמטר של האוכלוסייה, למשל, גודל תוחלת האוכלוסייה.

בדיקת השערות (Hypothesis Testing)

בדיקת השערות היא דרך לשאול שאלה בינארית:

  • האם ממוצע אוכלוסייה מסוים גדול מממוצע אוכלוסייה אחר?
  • האם תרופה מאריכה חיים באופן מובהק או לא?

אנחנו נבחן האם לאוכלוסייה מסוימת (למשל אנשים שקיבלו את התרופה), יש תכונה מסוימת (למשל זמן החיים שלהם יותר ארוך מזמן החיים של אוכלוסייה אחרת).

הקשר בין אומדן לבדיקת השערות

יש קשר הדוק בין שתי השאלות: הרעיון הוא שבתהליך של אומדן, אנחנו מקבלים טווח כלשהו של פרמטרים שהגיוניים עבורנו. התהליך של בדיקת השערות מתקשר לתהליך של אומדן במובן של האם המספר שרלוונטי לנו נמצא בתוך הטווח.

דוגמה מעשית

נניח שאנחנו רוצים להעריך את גובה הסטודנטים שהגיעו ביום חמישי בבוקר, ביחס לאוכלוסיית שאר הסטודנטים בקורס (אלה שלא הגיעו בבוקר).

נמדוד את הגובה של מי שהגיעו, נקבל ממוצע כלשהו, ונחשב את הגובה של שאר האוכלוסייה (ניקח לצורך העניין את כל שאר הסטודנטים ונמדוד להם את הגובה).

הגובה של מי שהגיעו הוא מספר, אבל נחשוב על מי שהגיע בתור מדגם אקראי מתוך האוכלוסייה. אז לא נטען שהגובה של מי שהגיע יש לו פרמטר אחד ויחיד, אלא, הוא תלוי במדגם של הסטודנטים שהגיעו, ולכן ניתן טווח.

אם בתוך הטווח הזה נמצא הגובה של כל אוכלוסיית הסטודנטים, אז נוכל להגיד שלא קיבלנו עדות מספקת לכך שהגובה של מי שהגיעו הרבה יותר גדול או יותר קטן מהגובה של שאר האוכלוסייה. נטען שהגובה של מי שהגיעו זהה מבחינה סטטיסטית לשאר האוכלוסייה - שלא קיבלנו עדות מספקת.

לעומת זאת, אם טווח הגובה של הסטודנטים שהגיעו הוא בין 2 מטר ל-2.5 מטר, והגובה של האוכלוסייה הוא 1.70 מטר, אז נוכל להגיד ברמה גבוהה של ודאות שמי שהגיעו יותר גבוהים משאר האוכלוסייה.

זה הקשר בין בדיקת השערות (שואלים שאלה בינארית - תשובה של כן ולא) לבין אומדן (שבה מעריכים גודל של פרמטר ונותנים לו טווח).

הגדרות בסיסיות באמידה

אוכלוסייה (Population)

אוכלוסייה היא אוסף הפרטים או היחידות (קוראים להם בשפה הסטטיסטית) שעליהם אנחנו מעוניינים להסיק. למשל:

  • סטודנטים לרפואה בישראל
  • סטודנטים לרפואה בצפת
  • סטודנטים לרפואה שמגיעים לשיעורים
  • סטודנטים לרפואה שלא מגיעים לשיעורים

מדגם (Sample)

מדגם זו קבוצה חלקית מתוך האוכלוסייה. אתם מדגם אקראי - סטודנטים שהגיעו לשיעור הם מדגם אקראי, לאו דווקא מייצג.

מאפייני המדגם

בדרך כלל אנחנו נניח שהמדגם שלנו הוא אקראי:

  • בוחרים $n$ פרטים בלי החזרה מתוך האוכלוסייה
  • לא נוכל לבחור את אותו אדם פעמיים
  • בכל אחד משלבי הבחירה, לכל פרט יש סיכוי שווה להיבחר
  • בוחרים ללא החזרה באופן טבעי, כי לא נוכל לקבל את אותו נבדק בניסוי פעמיים

ההסתברות להיבחר לא תהיה קבועה לכל אורך המדגם, כי היא ללא החזרה. נתעלם מהבעיה הזאת ונדמיין שיש אוכלוסייה גדולה, שהפרטים באוכלוסייה הם יחסית הומוגניים. זה שנדגום פרט אחד מאוכלוסייה, לא ישנה כל כך את ההתפלגות של האוכלוסייה.

אני מדגים בלי החזרה, אבל מדמיין שזה עם החזרה, או שהאוכלוסייה אינסופית. אנחנו נדמיין שהדגימות הן בלתי תלויות - זאת אומרת, זה שבחרתי אדם מסוים, לא אומר שאני אבחר או לא אבחר אדם אחר.

תכונה (Variable/Characteristic)

תכונה היא מאפיין כלשהו של האוכלוסייה, למשל:

  • גובה
  • אורך חיים
  • כמה זמן הישרדות במחלקה שלכם
  • צריכת פחמימות
  • רמת אינסולין בדם

זה מאפיין כלשהו של האוכלוסייה שנדמיין או נחשוב עליו כמשתנה מקרי, ונניח שלאותו משתנה מקרי יש התפלגות מסוימת.

פרמטר (Parameter)

פרמטר הוא מספר שמאפיין את ההתפלגות של התכונה באוכלוסייה. להתפלגויות יכולים להיות כמה פרמטרים.

למשל, מעוניינים לאמוד:

  • רמות האינסולין בדם בקרב חולי סוכרת
  • רמות האינסולין בדם בקרב האוכלוסייה הכללית
  • צריכת הפחמימות של חולי סוכרת לעומת צריכת פחמימות של אוכלוסייה כללית

סימונים נפוצים לפרמטרים

  • פרמטר כללי: $\theta$ (תטה)
  • תוחלת באוכלוסייה: $\mu$ (מיו)
  • סטיית תקן: $\sigma$ (סיגמה)
  • שונות: $\sigma^2$ (סיגמה בריבוע)

חשוב לזכור: הפרמטר קבוע! בפורמליזם הזה, בעולם שלנו, הפרמטר ידוע וקבוע. אנחנו לא יודעים אותו, אבל הוא קבוע - שום דבר לא משנה אותו. הוא נמצא איפה שהוא מאחורי הלוח. אנחנו לא יודע מה הוא, אבל הוא קבוע, הוא לא משתנה עם התצפיות, הוא לא עושה שום דבר. הוא קיים בעולם שאולי אף פעם לא נדע מה הוא, אבל הוא קבוע.

נתוני המדגם (Sample Data)

מדגם זה הערכים של התכונה עבור $n$ פרטים: $x_1, x_2, \ldots, x_n$.

הערה (דור): לא היה לי ברור ההבדל בין הגדרת המדגם כקבוצה חלקית, לבין ההגדרה שלו כהשמה של הערכים - במצגות שתי ההגדרות הופיעו באותו שם (״מדגם״). הוספתי כאן ״נתוני מדגם״ להבהרת המשמעות, להבנתי.

סטטיסטי (Statistic)

סטטיסטי זו פונקציה של התצפיות. סטטיסטי מסומן בדרך כלל באות $T$ כפונקציה של $x_1, x_2, \ldots, x_n$.

דוגמאות לסטטיסטיים

ממוצע המדגם: \(\bar{x} = \frac{1}{n}\sum_{i=1}^{n} x_i = \frac{x_1 + x_2 + \cdots + x_n}{n}\)

שונות המדגם: \(s^2 = \frac{1}{n-1}\sum_{i=1}^{n}(x_i - \bar{x})^2\)

למה מחלקים ב-$n-1$? לזה נגיע בהמשך.

ערך מקסימלי במדגם: \(\max\{x_1, x_2, \ldots, x_n\}\)

גם מקדם המתאם יכול להיות סטטיסטי, מקדם הרגרסיה, השיפוע ברגרסיה - כל דבר שניתן להוציא מהמדגם שהוא פונקציה של המדגם.

אומדן ואומד

אנחנו בדרך כלל אומדים את הערך של הפרמטר באמצעות הסטטיסטי, אז הרבה פעמים הסטטיסטי אמור להיות קירוב כלשהו של אותו פרמטר שמעניין אותנו.

  • אומד (Estimate): הערך המספרי של האומדן
  • אומדן (Estimator): הסטטיסטי (המשערך או האומדן)

הערך של הסטטיסטי ישתנה בין מדגמים. אם נחזור על הבדיקה לגבי הסטודנטים שהגיעו ביום אחר, הסטטיסטי יהיה שונה גם בגלל שהסטודנטים משתנים וגם בגלל שאולי חלקם לא יגיעו.

התפלגות הדגימה (Sampling Distribution)

התפלגות: הערכים האפשריים וההסתברויות שלהם.

התפלגות הדגימה: ההתפלגות של הסטטיסטי תחת הדגימה.

תכונות של אומדנים: הטיה ושונות

שימושיות של אומד מופיינת על ידי שני גדלים:

הטיה (Bias)

\[\text{Bias}(\hat{\theta}) = \mathbb{E}[\hat{\theta}] - \theta\]

הטיה של האומד היא ההפרש בין התוחלת של האומד לפרמטר האמיתי.

המדגם הוא משתנה מקרי, האומד הוא פונקציה של המדגם - גם משתנה מקרי. לאומד יש תוחלת.

אנחנו לא נדע את ההטיה אף פעם (אנחנו לא יודעים את הפרמטר אף פעם), אבל נגדיר את הגודל הזה כדי להבין מה בכלל יכול לקרות.

הטיה בודקת האם ההתפלגות מרוכזת סביב הערך האמיתי של הפרמטר.

שונות (Variance)

\[\text{Var}(\hat{\theta}) = \mathbb{E}[(\hat{\theta} - \mathbb{E}[\hat{\theta}])^2]\]

השונות היא מדד לפיזור של ערכי האומד - השונות של אותו סטטיסטי, של אותו מספר תחת ההתפלגות של המשתנה המקרי שרלוונטי לו.

אנלוגיה: זריקת חיצים למטרה

תדמיינו שזורקים חיצים למטרה:

  1. הטיה נמוכה + שונות נמוכה: כל הנקודות מרוכזות על המטרה (מצב אידיאלי)

  2. הטיה נמוכה + שונות גבוהה: הנקודות מפוזרות סביב המטרה, אבל בממוצע פוגעות במרכז

  3. הטיה גבוהה + שונות נמוכה: כל הנקודות מרוכזות, אבל רחוק מהמטרה (סטייה שיטתית)

  4. הטיה גבוהה + שונות גבוהה: הנקודות מפוזרות ורחוקות מהמטרה

Top Left (Green dots): Low bias + Low variance - All arrows clustered tightly on the bullseye (ideal scenario). Top Right (Blue dots): Low bias + High variance - Arrows scattered around the target but centered on average. Bottom Left (Orange dots): High bias + Low variance - Arrows clustered together but systematically offset from the center. Bottom Right (Purple dots): High bias + High variance - Arrows both scattered and far from the target

מה האומד הטוב ביותר?

אנחנו רוצים הטיה נמוכה ושונות נמוכה - להיות במצב הראשון.

למה זה חשוב?

הבנת הקונספטים האלה עוזרת לנו להבין מאיפה תכונות מגיעות. למשל:

  • בעולם של השונות, נראה שהשערוך של השונות כשאנחנו מחלקים ב-$n-1$ נותן לנו אומד חסר הטיה
  • לעומת זאת, אם נחלק את השונות את הסטיות הריבועיות ב-$n$ (כמו שהיינו מצפים לעשות אינטואיטיבית), נקבל אומד מוטה
  • לכן נומר: “בואו נדאג שהאומד יהיה חסר הטיה”

אנחנו גם נלמד איך אנחנו יכולים להוריד את השונות של המשערך שלנו.

אומדן התוחלת

הגדרה

תוחלת מסומנת ב-$\mu$ - היא פרמטר לא ידוע.

איך משערכים אותה? זה די סטנדרטי:

  1. בוחרים מדגם בגודל $n$
  2. דוגמים $n$ סטודנטים מאוכלוסיית הסטודנטים
  3. מסמנים את צריכת הפחמימות שלהם ב-$x_1, x_2, \ldots, x_n$ (לצורך העניין $x_{20}$)

הסטטיסטי הוא ממוצע מדגם:

\[\bar{X} = \frac{1}{n}\sum_{i=1}^{n} X_i\]

זאת אומרת, לוקחים את צריכת הפחמימות היומית (לצורך העניין) של כל אחד מהסטודנטים שהגיעו, סוכמים ומחלקים בגודל המדגם.

הסטטיסטי הזה הוא האומד שלנו עבור הפרמטר הלא ידוע $\mu$.

בדיקת איכות האומד

נרצה לבדוק אם האומד הזה טוב לתוחלת של האוכלוסייה. נבדוק תוחלת ושונות.

חישוב התוחלת (בדיקת הטיה)

המדגם הוא משתנה מקרי, הסטטיסטי הוא משתנה מקרי, ממוצע המדגם הוא משתנה מקרי.

\[\mathbb{E}[\bar{X}] = \mathbb{E}\left[\frac{1}{n}\sum_{i=1}^{n} X_i\right]\]

בתוחלת הכל עובד כמו שאנחנו רוצים:

  • אם כופלים משהו ב-$a$, $a$ פשוט יוצא החוצה
  • אם כופלים בקבוע, קבוע יוצא החוצה
\[\mathbb{E}[\bar{X}] = \frac{1}{n} \mathbb{E}\left[\sum_{i=1}^{n} X_i\right]\]

נזכור גם שתמיד בתוחלת: תוחלת של סכום היא סכום התוחלות

\[\mathbb{E}[\bar{X}] = \frac{1}{n} \sum_{i=1}^{n} \mathbb{E}[X_i]\]

באופן טבעי, נצפה שהתוחלת של צריכת הפחמימות של אדם שנבחר באקראי תהיה תוחלת האוכלוסייה. זה הגיוני.

\[\forall i,\quad \mathbb{E}[X_i] = \mu\]

ולכן:

\[\begin{aligned} \mathbb{E}[\bar{X}] &= \frac{1}{n} \sum_{i=1}^{n} \mu \\ &= \frac{1}{n} \cdot n\mu \\ &= \mu \end{aligned}\]

כלומר, האומד חסר הטיה!

זה הגיוני ואינטואיטיבי.

הבהרה: ההבדל בין ממוצע לתוחלת

  • תוחלת זה פרמטר של האוכלוסייה - הוא נמצא איפשהו, אנחנו לא יודעים אותו
  • ממוצע זה הדרך שלנו להתקרב אליו, הדרך שלנו לאמוד את התוחלת

דוגמה: הנסיעה של המרצה לצפת

המרצה גר במרחק שבעים קילומטר מצפת (בערך, אולי שבעים וחמישה).

התוחלת של הנסיעה שלו לצפת היא נגיד יכולה להיות שבעים קילומטר, חמש מאות מטר, שלושים וארבעה מטר - נגיד. אננו לא יודעים בדיוק מה, אין לנו מושג.

נדמיין שאם המרצה יסע מיליון פעמים, עשרה מיליון, מיליארד פעמים לצפת, בממוצע הוא יסע שבעים קילומטר וחמש מאות מטר ושלושים וארבעה מטר. זה התוחלת של האוכלוסייה - אנחנו לא יודעים אותה.

התוחלת והממוצע - הבהרה נוספת

התוחלת $\mu$ היא פרמטר של האוכלוסייה - היא נמצאת איפה שהיא, אני לא יודע אותה, גם אתם לא יודעים אותה. היא קיימת בעולם שאולי אני אף פעם לא יודע מה היא, אבל היא קבועה.

בכל פעם שאני נוסע לצפת (שלוש פעמים, ארבע פעמים, חמש פעמים בשבוע), אני מקבל דגימה בעולם הזה. $X_1$ - מקבל משתנה מקרי, דוגמה מתוך האוכלוסייה הזאת. נסעתי לצפת, אני עובד פה כבר כמה? קרוב לשנתיים. אז דגמתי, לא יודע מה, חמש מאות נסיעות כאלה. מתוך אלה אני יכול לקבל ממוצע מדגם.

ההבדל החשוב: הממוצע הוא חסר הטיה, אבל יש לו שונות. זאת אומרת, אם נמדוד את צריכת הפחמימות של המדגם הזה, נקבל אולי חמש פיתות ביום. אבל מחר אם נדגום את האוכלוסייה, נקבל אולי שש פיתות ביום.

ממוצע המדגם מאפשר לנו לקרב, ללמוד משהו על התוחלת באוכלוסייה, אבל זה לא אותו דבר. זה לא שאנחנו מודדים את הסטודנטים ואומרים “אוקיי, צריכת הפיתות היא חמש פיתות ביום”.

התוחלת של הממוצע המדגם היא התוחלת באוכלוסייה - זה אומר שממוצע המדגם מסתובב סביב הדבר הנכון. זה לא אומר שכל פעם הוא בדבר הנכון.

חישוב השונות של ממוצע המדגם

השונות של ממוצע המדגם $\bar{X}$ ניתנת לחישוב בצורה די דומה:

\[\text{Var}(\bar{X}) = \text{Var}\left(\frac{1}{n}\sum_{i=1}^{n} X_i\right)\]

ממוצע המדגם מוגדר כ: \(\bar{X} = \frac{1}{n}(X_1 + X_2 + X_3 + \cdots + X_n)\)

זו ההגדרה - אין לי פה מה להסתבך.

השונות של ממוצע המדגם היא השונות של הדבר הזה. מכאן יש רק אלגברה והחוקים שאנחנו מכירים:

על פי החוקים של השונות, אנחנו זוכרים שאם אני כופל ב-$a$, $a^2$ יוצא החוצה:

\[\text{Var}(\bar{X}) = \text{Var}\left(\frac{1}{n}\sum_{i=1}^{n} X_i\right) = \frac{1}{n^2} \text{Var}\left(\sum_{i=1}^{n} X_i\right)\]

אם היחידות של $X$ הן פיתות ליום, אז היחידות של השונות יהיו פיתות בריבוע ליום (לא יודע מה זה אומר פיתות בריבוע ליום, אבל אחד חלקי $n$ בריבוע זה המקדם שיוצא החוצה).

שונות של סכום היא סכום השונויות (למשתנים מקריים בלתי תלויים):

\[\text{Var}(\bar{X}) = \frac{1}{n^2}[\text{Var}(X_1) + \text{Var}(X_2) + \cdots + \text{Var}(X_n)]\]

השונות של $X_1$ היא $\sigma^2$, בצורה מאוד דומה למה שעשינו קודם:

\[\begin{aligned} \text{Var}(\bar{X}) &= \frac{1}{n^2}[\sigma^2 + \sigma^2 + \cdots + \sigma^2] \\ &= \frac{1}{n^2} \cdot n\sigma^2 \\ &= \frac{\sigma^2}{n} \end{aligned}\]

המשמעות של הנוסחה $\text{Var}(\bar{X}) = \frac{\sigma^2}{n}$

זה מעניין - $n$ קטנה! זו דרך להקטין את השונות. נרצה לדעת, לנחש את הפרמטר באוכלוסייה. יש לנו אומד כלשהו של הפרמטר הזה, $\bar{X}$. אנחנו לא מרוצים מהשונות שלו - אנחנו מגדילים את האוכלוסייה, מכריחים עוד סטודנטים לבוא ביום ראשון, עושים אולי בדיקת נוכחות, מצלמים את מי שמגיעים… יום חמישי הבא כולם מגיעים!

אנחנו מניחים את הפיתות של הסטודנטים שהגיעו בדיוק. אז נגדיל את $n$ ונקטין את השונות.

מספר הדגימות והשפעתו על סטיית התקן

סטיית התקן של ממוצע המדגם היא:

\[\text{SD}(\bar{X}) = \frac{\sigma}{\sqrt{n}}\]

זאת אומרת שאם נרצה להקטין את סטיית התקן פי 10, נצטרך להגדיל את המדגם פי 100. $\sqrt{100} = 10$.

סטיית התקן של ממוצע המדגם נקראת שגיאת תקן (Standard Error), או Standard Error of the Mean.

הדמיה ויזואלית של הקטנת השונות

יש לנו תכונה באוכלוסייה - צריכת הפיתות (אם אנחנו רצים עם הדוגמה הזו), אינסולין בדם שלכם, צריכת הפיתות ליום בקרב אוכלוסיית הסטודנטים בקורס.

לתכונה הזו יש שונות, יש לה סטיית תקן - זאת אומרת יש לה סרגל, יש לה טווח השתנות אופייני: $\sigma$.

אם ניקח מדגם ונחשב את הממוצע, ההתפלגות של ממוצע המדגם נהיית צרה יותר - ב-$\sqrt{n}$. זה המשמעות של הקטנת סטיית התקן.

עכשיו סטייה ימינה ושמאלה היא $\frac{\sigma}{\sqrt{n}}$ - זאת אומרת שאני הרבה יותר מקובץ, ממורכז סביב התוחלת האמיתית. עדיין יכולים לצאת לכאן או לכאן - זה יכול להיות ערך לגיטימי של ממוצע המדגם, אבל ההסתברות להגיע לשם היא כבר זניחה. אז המצב יותר מקובץ.

זה יותר משקף את המציאות - לא זה ששינינו את העולם או את ההתפלגות - זו לא אותה התפלגות, אבל לשתי ההתפלגויות האלה יש את אותה תוחלת. ואנחנו רוצים לאמוד את התוחלת. אם רוצים לאמוד את התוחלת, טוב להיות כמה שיותר ממורכזים סביבה - כמה שפחות אי-ודאות סביב התוחלת.

alt text

דוגמה מעשית: אומדן גובה באוכלוסייה

רוצים ללמוד ממוצע גובה באוכלוסייה מסוימת. סטיית התקן היא שבעה סנטימטר. בוחרים מדגם של מאה אנשים, מודדים את גובהם, ומחשבים את ממוצע המדגם.

סטיית התקן של ממוצע המדגם תהיה:

\[\begin{aligned} \text{SE} &= \frac{7}{\sqrt{100}} \\ &= \frac{7}{10} \\ &= 0.7 \text{ centimeters} \end{aligned}\]

שגיאת התקן של ממוצע המדגם היא 0.7 סנטימטר.

זאת אומרת, זה שדגמנו מאה אנשים נותן לנו לשערך, לאמוד את הפרמטר - את ממוצע הגובה באוכלוסייה - בצורה הרבה יותר טובה. הגדלנו את המדגם פי מאה, סטיית התקן ירדה פי עשר לעומת סטיית התקן הקודמת.

משפט הגבול המרכזי (Central Limit Theorem)

משפט הגבול המרכזי נחלץ לעזרתנו. המשפט אומר שאם לוקחים הרבה השפעות קטנות ומחברים אותן, לא משנה מה ההתפלגות של כל אחת מההשפעות - מקבלים בסוף משהו שנראה נורמלי.

גם אם כל ההשפעות הקטנות נראות כמו הדבר המוזר הזה, אם סוכמים אותן מספיק, מקבלים משהו שהוא בקירוב (ולצרכינו יותר מבקירוב) שווה להתפלגות נורמלית.

יישום על ממוצע המדגם

ההתפלגות של המשתנה המקרי $\bar{X}$ היא בעצם התפלגות של:

\[\frac{X_1}{n} + \frac{X_2}{n} + \frac{X_3}{n} + \cdots + \frac{X_n}{n}\]

אלה השפעות קטנות - אם $n$ גדול, אז ההשפעה קטנה של כל $X_i$.

ההתפלגות של ממוצע המדגם שואפת להתפלגות נורמלית עם:

  • תוחלת: $\mu$ (התוחלת הנכונה)
  • שונות: $\frac{\sigma^2}{n}$ (שונות קטנה פי $n$ מהשונות באוכלוסייה)
\[\bar{X} \sim \mathcal{N}\left(\mu, \frac{\sigma^2}{n}\right)\]

זה לא משנה איך נראית ההתפלגות הראשונית!

קירוב נורמלי - כמה דגימות נדרשות?

מקובל לקבוע ערך סף של $n \geq 30$. זה שרירותי, אבל אנחנו נשתמש בזה כי זה מקובל בסטטיסטיקה.

אבל נדרשת קצת חשיבה ביקורתית:

  • התפלגות הכנסה של עובדי בנק - מאוד לא סימטרית, כי המנכ”ל וההנהלה הבכירה מרוויחים הרבה יותר מהטלרים והמנקים. בשביל לקבל התפלגות נורמלית ממשהו כזה, אני צריך מספר דגימות גדול יותר.
  • גבהים בקרב סטודנטים - התפלגות יחסית סימטרית. אתם לא תראו סטודנט שהגובה שלו עשרים מטר, ואתם לא תראו סטודנט שהגובה שלו עשרים סנטימטר. בשביל שהקירוב הנורמלי יהיה תקף, אני צריך פחות דגימות.

דוגמאות מעשיות

דוגמה 1: צריכת פרצטמול במחלקה

נניח שצריכת פרצטמול יומית עבור חולה במחלקה היא 200 מיליגרם ליום, סטיית התקן היא 50 מיליגרם.

רוצים לדעת מה תהיה התפלגות ממוצע צריכת הפרצטמול במחלקה של 100 מאושפזים - אולי בשביל לתכנן את מלאי הפרצטמול במחלקה.

התשובה:

\[\bar{X} \sim \mathcal{N}\left(200, \frac{50^2}{100}\right) = \mathcal{N}(200, 25)\]

ממוצע המדגם יתפלג נורמלית עם תוחלת 200 מיליגרם וסטיית תקן של 25 מיליגרם.

דוגמה 2: משקל לידה בבית חולים

משקל לידה בבית חולים מתפלג נורמלית:

  • תוחלת: 3,000 גרם
  • סטיית תקן: 500 גרם

שאלה א’: תינוקת בודדת

מה ההסתברות שתינוקת אחת תיוולד במשקל גדול מ-3,150 גרם?

עבור תינוקת אחת, ההתפלגות היא ההתפלגות באוכלוסייה:

תקנון:

\[Z = \frac{3150 - 3000}{500} = \frac{150}{500} = 0.3\] \[\begin{aligned} P(X > 3150) &= P(Z > 0.3) \\ &= 1 - \Phi(0.3) \approx 0.38 \end{aligned}\]

שאלה ב’: ממוצע 25 תינוקות

מה ההסתברות שמשקל הלידה הממוצע של 25 תינוקות במחלקה יעלה על 3,150 גרם?

המדגם קטן יחסית (25), אבל ההתפלגות באוכלוסייה נורמלית, ולכן לממוצע המדגם תהיה גם התפלגות נורמלית.

פרמטרים של ממוצע המדגם:

  • תוחלת: $\mu = 3000$ גרם
  • סטיית תקן: $\frac{\sigma}{\sqrt{n}} = \frac{500}{\sqrt{25}} = \frac{500}{5} = 100$ גרם

תקנון:

\[Z = \frac{3150 - 3000}{100} = \frac{150}{100} = 1.5\] \[P(\bar{X} > 3150) = P(Z > 1.5) \approx 0.07\]

השוואה: הסיכוי ירד מ-0.38 ל-0.07 - הרבה יותר קטן! זה הכוח של ממוצע המדגם - הממוצע מתמרכז סביב התוחלת באוכלוסייה.

סיכום ביניים

ההבדל הנוסף בין האוכלוסייה למדגם: לתכונה יש התפלגות כלשהי באוכלוסייה, אבל אם המדגם מספיק גדול, ההתפלגות של ממוצע המדגם תהיה נורמלית בקירוב.

אם ההתפלגות נורמלית באוכלוסייה, זה כבר סכום של נורמליים - זה עדיין נורמלי.

זה סוס העבודה שלנו בקורס הזה, כי אני לא יודע התפלגות באוכלוסייה הרבה פעמים, והרבה פעמים אני אגיד “אוקיי, זה בקירוב נורמלי בגלל שיש לי מדגם מספיק גדול”.

במציאות כנראה לא נשתמש בכל הקירובים הנורמליים הללו, נגיד אולי זה לא באמת נורמלי, ונשתמש במבחנים אחרים. אבל בשביל להבין את המהות של הסטטיסטיקה, מאוד קל להשתמש במשפט הגבול המרכזי ולעשות חישובים בידיים.


מבוא לרווחי סמך

רווח סמך הוא נושא הסטטיסטיקה הראשון שיש לו ערך מעשי ממש. במאמרים מדעיים רפואיים תמיד נראה רווחי סמך. אף אחד לא יגיד “התרופה הזו נותנת עוד שלוש שנים לחיים”. יגידו: “היא נותנת בממוצע שלוש שנים לחיים, בטווח של רווח סמך $95\%$, עוד שנתיים וחצי עד שלוש וחצי שנים”.

אין כזה דבר בעולם המדעי, בעולם הרפואי - מספר מדויק. אנחנו לא יודעים. בשביל מספרים לא מדויקים, בשביל להעריך, יש לנו את רווח הסמך.

רווח הסמך הראשון שנלמד הוא רווח סמך לתוחלת.

הערה (דור): השם של רווח סמך באנגלית, Confidence interval, לדעתי משקף את המשמעות טוב יותר. הייתי מתרגם את המושג בתור ״מרווח ביטחון״, אולי השם ״רווח סמך״ מגיע מ״מרווח״ שניתן ״לסמוך״ עליו.

הגדרת רווח סמך

עבור כל מדגם, יש ערך כלשהו של האומד, הוא נקרא אומדן נקודתי (Point Estimate) - מספר נקודה על הישר הממשי.

אבל התועלת של הערך הזה מוטלת בספק, כי אנחנו לא יודעים את הערך של הפרמטר האמיתי.

לפיכך, נרצה למצוא תחום ערכים (וזה נורא חשוב) - תחום ערכים בו הפרמטר האמיתי יימצא בהסתברות של $95\%$.

שימו לב: הפרמטר האמיתי לא ידוע, אבל נרצה למצוא תחום, להגדיר פרוצדורה שמכסה את הפרמטר האמיתי הלא ידוע בהסתברות של $95\%$.

אם מאחורי הלוח נמצא הפרמטר האמיתי, ואני זורק את התחום על הלוח, אני רוצה שבכל פעם שאני זורק תחום אחר, הוא יכסה את הפרמטר האמיתי הלא ידוע, הקבוע, בהסתברות של $95\%$.

התחום הזה נקרא רווח סמך, או לפעמים רווח בר סמך, במקרה הזה של $95\%$.

הנחות לחישוב רווח סמך

  1. רוצים ללמוד את התוחלת של תכונה כלשהי באוכלוסייה - לגיטימי
  2. המדגם מספיק גדול, כך שמשפט הגבול המרכזי יתקיים - לגיטימי
  3. השונות $\sigma^2$ של האוכלוסייה ידועה - אנחנו אף פעם כנראה לא נדע את השונות באוכלוסייה, אבל בשביל להבין מה קורה, באופן מתודי ודידקטי, נניח שהשונות $\sigma^2$ ידועה

זה לא יקרה במציאות, אבל בשביל להבין זה יעזור לנו. זה כמו פיגומים לבניין.

הנוסחה לרווח סמך

נרצה למצוא סטטיסטיים, פונקציות של המדגם, כך שבהסתברות של $95\%$ התוחלת תימצא ביניהם.

נרצה לחשב, למצוא דרך לחשב ערך $L_1$ מתוך המדגם ו-$L_2$ מתוך המדגם, כך שבהסתברות של 0.95 התוחלת תהיה בפנים:

\[P(L_1 \leq \mu \leq L_2) = 0.95\]

תחום מוצע:

\[\begin{aligned} \text{95\% CI} &= \left[ \bar{X} - 1.96 \cdot \text{SE},\; \bar{X} + 1.96 \cdot \text{SE} \right] \end{aligned}\]

כאשר $\text{SE} = \frac{\sigma}{\sqrt{n}}$ היא שגיאת התקן של ממוצע המדגם.

מאיפה מגיע 1.96?

1.96 זה ה-$5\%$! בעולם הנורמלי, $\pm 1.96\sigma$ מכסה $95\%$ מהמסה, או משאיר בחוץ $2.5\%$ פה ו-$2.5\%$ פה.

מכאן מגיע 1.96 - זאת אומרת צעדים בגודל של שגיאת התקן של ממוצע המדגם, מסביב לממוצע המדגם.

רווח הסמך:

\[\bar{X} \pm 1.96 \cdot \frac{\sigma}{\sqrt{n}}\]

זאת אומרת, מסביב לממוצע המדגם, לוקחים שתי שגיאות תקן לכאן ושתי שגיאות תקן לכאן.

דוגמה: יעילות תרופה בהורדת לחץ דם

רוצים לאמוד יעילות של תרופה בהורדת לחץ דם. נתון שסטיית התקן של שינוי לחץ דם היא $16$ מילימטר כספית.

מדגם של $64$ מטופלים - קיבלנו שממוצע הירידה בלחץ דם היה $5$ מילימטר כספית.

אם מישהו תמים, הוא אולי היה אומר: “ממוצע הירידה בלחץ הדם 5 מילימטר כספית, זאת אומרת שהתרופה מועילה, התרופה מורידה את לחץ הדם.”

אנחנו לכאורה לא תמימים. נחשב רווח סמך:

\[\text{SE} = \frac{\sigma}{\sqrt{n}} = \frac{16}{\sqrt{64}} = \frac{16}{8} = 2\] \[\text{Confidence interval: } -5 \pm 2 \times 2 = -5 \pm 4\]

רווח הסמך להורדת לחץ דם הוא: $-9$ עד $-1$ מילימטר כספית.

פירוש התוצאה

האם התרופה מועילה? האם התרופה בכלל מורידה לחץ דם?

התשובה היא: כנראה שכן! למה? כי רווח הסמך לא כולל את האפס. אם הירידה בלחץ דם הייתה אפס (כלומר אין השפעה), זה לא נמצא בטווח הסביר שלנו.

זאת אומרת שיש עדות חזקה לכך שהתרופה אכן מורידה את לחץ הדם.

השפעת גודל המדגם על רווח הסמך

עכשיו נניח שגודל המדגם היה 256 מטופלים (פי 4 מטופלים):

\[\text{SE} = \frac{16}{\sqrt{256}} = \frac{16}{16} = 1 \text{ mm Hg}\] \[\text{Confidence interval: } -5 \pm 2 \times 1 = -5 \pm 2\]

רווח הסמך החדש: $-7$ עד $-3$ מילימטר כספית.

קיבלנו רווח סמך הרבה יותר צר - זאת אומרת שאנחנו יכולים להעריך, לשערך, לאמוד את התועלת שבתרופה בדיוק הרבה יותר גבוה.

עכשיו אפשר לשאול את אותה השאלה: האם התרופה מורידה לחץ דם? ובהסתברות של $95\%$, רווח הסמך מכיל את הפרמטר האמיתי. ברמת סמך כזו, התרופה כן מורידה לחץ דם, כי אנחנו די משוכנעים שהפרמטר של הורדת לחץ דם הוא שלילי.

גזירת נוסחת רווח הסמך

נוכיח שהפרמטר האמיתי נמצא בין המספרים האלה בהסתברות של 0.95.

שלב 1: התפלגות ממוצע המדגם

על פי משפט הגבול המרכזי, $\bar{X}$ (ממוצע המדגם) הוא משתנה מקרי נורמלי:

\[\bar{X} \sim \mathcal{N}\left(\mu, \frac{\sigma^2}{n}\right)\]

שלב 2: תקנון

המשתנה המקרי המתוקנן הוא:

\[Z = \frac{\bar{X} - \mu}{\sigma/\sqrt{n}}\]

$Z$ הוא נורמלי סטנדרטי: $Z \sim N(0,1)$

שלב 3: שימוש בערכים קריטיים

נזכור שהסיכוי למשתנה מקרי נורמלי סטנדרטי:

  • להיות גדול מ-1.96:

    \[P(Z > 1.96) = 0.025\]
  • להיות קטן מ-(-1.96):

    \[P(Z < -1.96) = 0.025\]

זאת אומרת: $P(-1.96 < Z < 1.96) = 0.95$

שלב 4: אלגברה

\[P\left(-1.96 < \frac{\bar{X} - \mu}{\sigma/\sqrt{n}} < 1.96\right) = 0.95\]

נכפול בשגיאת התקן:

\[P\left(-1.96 \cdot \frac{\sigma}{\sqrt{n}} < \bar{X} - \mu < 1.96 \cdot \frac{\sigma}{\sqrt{n}}\right) = 0.95\]

נעביר את $\bar{X}$ ונכפיל ב-$(-1)$:

\[P\left(\bar{X} - 1.96 \cdot \frac{\sigma}{\sqrt{n}} < \mu < \bar{X} + 1.96 \cdot \frac{\sigma}{\sqrt{n}}\right) = 0.95\]

זהו! מכאן מגיעה הנוסחה של רווח סמך.

הראנו שהסיכוי ש-$\mu$ (התוחלת האמיתית) תימצא בטווח:

\[\left[\bar{X} - 1.96 \cdot \frac{\sigma}{\sqrt{n}}, \bar{X} + 1.96 \cdot \frac{\sigma}{\sqrt{n}}\right]\]

הוא $95\%$.

תכונות של רווח סמך

מה משפיע על רוחב רווח הסמך?

שונות ממוצע המדגם היא: $\frac{\sigma^2}{n}$

אם יש:

  • מדגם גדול או שונות קטנה באוכלוסייה ← ההתפלגות הדגימה צרה ← רווח הסמך שלי יהיה צר ← החיים שלי יהיו טובים

אם:

  • המדגם קטן או שונות גדולה באוכלוסייה ← השונות של ממוצע המדגם תהיה יותר גדולה ← רווח הסמך שלי יהיה יותר רחב

איך מקטינים את רווח הסמך?

אני לא יכול לשלוט באוכלוסייה - אני לא יכול להגיד לכולם “תאכלו את אותה כמות של פיתות ביום”, אני לא יכול להכריח את כולם להיות עם אותה רמת אינסולין.

אני כן יכול להגדיל את המדגם. בשביל לצמצם את רווח הסמך:

  • $\sigma$ קבוע
  • $\sqrt{n}$ יכול לגדול, כתלות במשאבים שלי
  • כמה סבלנות, כמה כסף וכמה זמן יש לדגום עוד ועוד אנשים

דוגמה מעולה: סקרי חיסון קורונה 2021-2020

זו דוגמה נהדרת שמראה בצורה מעשית את ההשפעה של גודל המדגם על רווח הסמך.

בשנת 2021-2020 (זוכרים קורונה?), שלושה גורמים ביצעו סקרים להערכת אחוז האוכלוסייה המחוסנת נגד וירוס הקורונה בארצות הברית:

הסקרים השונים

  1. דלפי (Carnegie Mellon University) - באמצעות פייסבוק:
    • גודל מדגם: 250,000 איש
    • השתמשו במידע מפייסבוק, ניחשו עם בן אדם מחוסן או לא
  2. Census (ממשלת ארצות הברית):
    • גודל מדגם: 75,000 איש
  3. Axios-Ipsos:
    • גודל מדגם: 1,000 איש
    • זה כלום לעומת 250,000!

התוצאות והשלכותיהן

למזלנו, הכמות העצומה של נשאלים בסקר של פייסבוק ובסקר של Census גרמה לכך שהם היו מאוד בטוחים בתוצאות שלהם.

נסתכל על התוצאות:

  • Axios-Ipsos: היו להם רווחי סמך יחסית גדולים, כי היו להם אלף נדגמים. הם לא היו כל כך בטוחים בתוצאות שלהם.

  • פייסבוק: חישבו את רווח הסמך שלהם לפי הנוסחה עם $\sqrt{n}$. $\sqrt{250,000}$ זה מספר עצום! אז רווח הסמך שלהם כל כך קטן עד שלא רואים אותו בגרף.

  • Census: גם להם יש רווח סמך מאוד קטן, אם כי קצת יותר גדול משל פייסבוק.

השוואה למציאות

מספר המחוסנים בארצות הברית מדווח בפועל על ידי ה-CDC (Center for Disease Control) - הארגון שאחראי על מחלות מדבקות בארצות הברית. מהגרפים אפשר לראות שהסקרים עם המדגמים הגדולים (פייסבוק ו-Census) היו קרובים יותר לנתונים האמיתיים של ה-CDC.

זו דוגמה מעולה לכך שגודל מדגם גדול יותר נותן לנו:

  1. רווח סמך צר יותר (דיוק גבוה יותר)
  2. אומדנים טובים יותר של הפרמטר האמיתי

הלקח מדוגמת סקרי קורונה

עידן מעיר שהפינג פונג הראה שלמרות שהסקר של פייסבוק היה עם 250,000 איש, הוא היה פחות מדויק מהסקר של Axios-Ipsos עם 1,000 איש בלבד.

הלקח החשוב: תיזהרו עם ההנחות שלכם!

אנחנו מחלקים פה ב-$\sqrt{n}$ עם הנחה שהדגימות בלתי תלויות. ברור, באופן מובהק, ההנחה הזו לא תופסת במדגם של דלפי-פייסבוק. לא תופסת. ותופסת במדגם הרבה יותר קטן של Axios-Ipsos.

למה זה קרה?

  • משתמשי פייסבוק יש להם אולי נטייה לשקר
  • האוכלוסייה של הפייסבוקאים שונה מהאוכלוסייה הכללית
    • בומרים כמוני למשל לא בטיק טוק או בטוויטר
    • הסקר של Axios-Ipsos שתוכנן להיות מדגם מייצג של האוכלוסייה היה הדגם הקרוב ביותר לנתונים האמיתיים של ה-CDC

המסקנה המפתיעה: הסקר של דלפי-פייסבוק, 250 אלף איש, שווה ערך לרמת דיוק של בערך עשרה נדגמים שנדגמו באמת באקראי מהאוכלוסייה.

זה בגלל שהאוכלוסייה של פייסבוק - צרכני הפייסבוק - זה באמת יותר מבוגרים, פחות פוחדים מחיסונים אולי, יותר סאחים מהאוכלוסייה הכללית.

רווחי סמך עם רמות ביטחון שונות

מה קורה אם רוצים רווח סמך שונה?

נגיד אני רוצה רווח סמך של 90 אחוז. אז אני כותב את רווח הסמך כך:

\[\bar{X} \pm C \cdot \frac{\sigma}{\sqrt{n}}\]

אני בוחר $C$ שאינני יודע מה הוא. ב-95 אחוז $C$ היה 1.96 (שתי סטיות תקן). עכשיו אני רוצה לבחור מספר אחר של סטיות תקן.

מה הערך של $C$ צריך לקיים? ערך של $C$ צריך לקיים ש:

\[P\left(\bar{X} - C \cdot \frac{\sigma}{\sqrt{n}} < \mu < \bar{X} + C \cdot \frac{\sigma}{\sqrt{n}}\right) = 0.90\]

איך אני בוחר את התנאי הזה? התנאי הזה מתקיים אם במקום להשאיר כאן 2.5 אחוז, אני אשאיר כאן 5 אחוז.

במקום להשאיר בכל קצה 2.5 אחוז (0.025), אני אשאיר בכל קצה 0.05, או 5 אחוזים. ואז יישאר לי באמצע, בפנים, 90 אחוז.

חישוב הערך הקריטי

אני רק צריך למצוא ערך $C$ כך שהסיכוי למשתנה מקרי נורמלי מתוקנן $Z$ להיות גדול ממנו הוא 0.05.

את הערך הזה אני מחשב באמצעות ה-Inverse Survival Function:

\[C = \text{InverseSurvival}(0.05) = 1.64\]

רווח סמך של 90 אחוז יהיה: \(\bar{X} \pm 1.64 \cdot \frac{\sigma}{\sqrt{n}}\)

רווחי סמך ברמות ביטחון שונות

בצורה דומה:

  • רווח סמך של 99 אחוז יצריך אותי לקחת עוד צעדים
  • אני אצטרך להשאיר כאן, במקום 5 אחוז, אני אצטרך עכשיו להשאיר כאן 0.5 אחוז
  • $C = \text{InverseSurvival}(0.005) = 2.58$

מה קורה עם רווח סמך של 100 אחוז?

רוני שואלת: מה אם אני רוצה לתפוס את התוחלת ב-100 אחוז? אני רוצה להיות ודאי ב-100 אחוז שלא משנה מה, רמת הסמך שלי תופס את התוחלת.

היא חושבת בצורה שיטתית ואומרת: אני רוצה לחשב Inverse Survival Function של 0.

מהו ערך שהסתברות להיות גדול ממנו היא 0?

הערך הזה הוא אינסוף! אין כזה דבר. אין כזה דבר רווח סמך של 100 אחוז. אין ודאות בעולם שלנו.

אנחנו בעולם מקולקל שאין בו ודאות. העולם המתמטי - החיים נפלאים. העולם הסטטיסטי - החיים קשים. אין 100 אחוז.

הפשרה בין דיוק לביטחון

כל החיים האלה הם פשרה. יש לי פשרה בין מידת הביטחון (אחוז הכיסוי) לבין השימושיות (הרוחב).

  • אם אני רוצה מידת ביטחון מאוד גבוהה ← הרוחב שלי יהיה מאוד גדול ← השימושיות של רווח הסמך לא תהיה כל כך גדולה
  • הסטנדרט הוא $95\%$ - זה הטרייד-אוף המקובל, וכנראה שבמאמרים שאתם תקראו זה יהיה הסטנדרט

עכשיו אם אני מגדיל את המדגם, כמובן שאני מקטין את כל העסק הזה - אני לא משלם באחוז כיסוי ובכל זאת מקטין את רווח הסמך.

דוגמה: משקל עובר

נגיד שאני אומד משקל עובר. המדגם שלי הוא של 100 תינוקות, סטיית תקן 500 (כמו מקודם), וממוצע המדגם היה 3,200.

איך אני מקבל רווח סמך?

שלב 1: חישוב שגיאת התקן

\[\begin{aligned} \text{SE} &= \frac{\sigma}{\sqrt{n}} \\ &= \frac{500}{\sqrt{100}} \\ &= \frac{500}{10} \\ &= 50 \text{ grams} \end{aligned}\]

זה גודל הצעד.

שלב 2: רווחי סמך ברמות ביטחון שונות

רווח סמך של 90 אחוז:

  • אני לוקח $1.64 \times 50 = 82$ גרם לכאן ו-82 גרם לכאן
  • רוחב הרווח: $2 \times 82 = 164$ גרם

רווח סמך של 95 אחוז:

  • אני לוקח $1.96 \times 50 = 98$ גרם לכל כיוון
  • רוחב הרווח: $2 \times 98 = 196$ גרם

רווח סמך של 99 אחוז:

  • אני לוקח $2.58 \times 50 = 129$ גרם לכל כיוון
  • רוחב הרווח: $2 \times 129 = 258$ גרם

סימונים פורמליים לערכים קריטיים

קצת מבלבל, אבל הסימונים האלה יעזרו לנו המון כשנגיע להתפלגויות t.

הגדרת Inverse Survival Function

אני מגדיר את ה-Inverse Survival Function ב-$\alpha$:

$Z_\alpha$ נקרא ערך קריטי.

$Z_\alpha$ מקיים שהסיכוי שמשתנה מקרי נורמלי סטנדרטי להיות גדול מ-$Z_\alpha$ הוא $\alpha$:

\[P(Z > Z_\alpha) = \alpha\]

ערכים נפוצים

  • $Z_{0.025} = 1.96$ (עבור 2.5 אחוז)
  • $Z_{0.05} = 1.64$ (עבור 5 אחוז)

תזכרו שתמיד יש את הדואליות הזו: אני צריך לפעמים לחלק ב-2. בשביל לקבל 5 אחוז מכאן ומכאן, אני צריך 0.025 ו-0.025.

נוסחה כללית לרווח סמך

רווח סמך עם כיסוי של $1-\alpha$ (למשל $\alpha = 0.05$, רווח סמך עם כיסוי של 0.95):

\[\bar{X} \pm Z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}\]

במקרה כללי, אני שם את המספר הרלוונטי $Z_{\alpha/2}$. אני רוצה להשאיר $\alpha/2$ משמאל ו-$\alpha/2$ מימין, וזה ייתן לי כיסוי של $1-\alpha$.

דוגמה: חישוב גודל מדגם נדרש

איך אני מחשב את גודל המדגם שאני צריך?

שאלה: אני רוצה לאמוד את משקל לידה ולקבל רווח סמך של $95\%$ שאינו גדול מ-100 גרם. אני רוצה לדעת כמה תינוקות אני צריך לבדוק כדי להיות בטוח.

סטיית התקן באוכלוסייה ידועה (500 גרם). אני רוצה לדעת מה גודל המדגם הנחוץ.

פתרון

אני מתחיל מהסוף. רוחב רווח סמך יהיה:

\[\begin{aligned} \text{Width} &= 2 \times 1.96 \times \frac{\sigma}{\sqrt{n}} \\ &= 2 \times 1.96 \times \frac{500}{\sqrt{n}} \\ &= \frac{1960}{\sqrt{n}} \end{aligned}\]

למה זה רוחב רווח הסמך? כי אני לוקח צעד של $1.96 \times \text{SE}$ שמאלה וצעד כזה ימינה.

אני רוצה שהביטוי הזה יהיה קטן מ-100:

\[\frac{1960}{\sqrt{n}} < 100\]

מכאן (אלגברה פשוטה): \(\sqrt{n} > 19.6\) \(n > (19.6)^2 = 384.16\)

מסקנה: אני צריך לפחות 385 תינוקות כדי להשיג רווח סמך של ±50 גרם (רוחב של 100 גרם) ברמת ביטחון של $95\%$.

סיכום לרווחי סמך

נקודות שחשוב לזכור:

  1. הפרמטר הוא ערך קבוע - הוא לא משתנה מקרי. הוא נמצא כאן איפשהו מאחורי הלוח. אני לא יודע מי הוא ומה הוא, אין לי אותו.

  2. ברגע שדיווחתי על רווח סמך מסוים - או שהפרמטר בתוכו או שהוא לא. למרות שיכול להיות שימושי לחשוב שהפרמטר נמצא שם בהסתברות הסמך.

  3. עבור רווח סמך מסוים אני לא יכול לדעת אם הוא מכיל את הפרמטר - תמיד יש כל מיני מקרים, תמיד דברים יכולים להידפק. אני לא יכול לדעת.

  4. השיטה שבה אני חושב את רווח הסמך יש להחליט מראש - אני לא מודד ואז מחליט מה אני עושה בשביל שזה יסתדר לי עם הנתונים.

  5. ההסתברות היא רמת הסמך - ההסתברות של $95\%$ או הסתברות רמת הסמך $1-\alpha$ שבחרנו, היא שכאשר אבחר את המדגם ואחשב את רווח הסמך כפי שתכננתי מראש, אז ב-$95\%$ מהמקרים רווח הסמך יכיל את הפרמטר האמיתי.


תודה רבה לכם על שיעור מעולה! סופ”ש מצוין!

דור פסקל

חזרה לעמוד הראשי