הקדמה ותזכורת

  • עברו כחודשיים מהמפגש הקודם בגלל מורכבות המערכת
  • תזכורת: אפידמיולוגיה תיאורית, מדידות עם מונה ומכנה, incidence, prevalence, risks, rates
  • המטרה: לדעת אם המדידה האפידמיולוגית משקפת מציאות או נגרמת ממשהו אחר
  • שלושה גורמים שיכולים לגרום לממצאים מלבד ממצאים אמיתיים:
    1. מקריות (Chance)
    2. הטיה (Bias)
    3. ערפול (Confounding)

דוגמה מרכזית: סמארטפונים ומחלות לב

מחקר דמיוני: האם שימוש בסמארטפונים גורם למחלות לב?

  • קבוצה 1: משתמשי סמארטפון - 2 מתוך 7 עם מחלת לב (28%)
  • קבוצה 2: לא משתמשים - 1 מתוך 7 עם מחלת לב (14%)
  • מסקנה מתמטית: משתמשי סמארטפון בסיכון כפול למחלות לב
  • אבל: צריך להיות סקפטיים! באפידמיולוגיה עובדים בשיטת אלימינציה

1. מקריות (Chance) - טעות אקראית

הסבר

  • באפידמיולוגיה לעיתים רחוקות בודקים אוכלוסיות שלמות
  • משתמשים במדגמים כדי להסיק על האוכלוסייה
  • בדיוק כמו סקרי בחירות - לא שואלים כל אדם במדינה

דוגמה מספרית

  • אוכלוסייה: 1,000 אנשים, 10 עם מחלת לב (שכיחות אמיתית 1%)
  • מדגם: 14 אנשים, במקרה 3 עם מחלת לב (שכיחות במדגם 22%)
  • כמו הטלת מטבע - בממוצע 50/50, אבל לפעמים 3-4 פעמים אותו צד

רווחי בר סמך (Confidence Intervals)

  • מודדים כמה אנחנו בטוחים שהערך במדגם מייצג את האוכלוסייה
  • לרוב משתמשים ב-95% CI
  • דוגמה: 22% עם CI של 0.3%-43%
  • פירוש: 95% בטוחים שהערך האמיתי באוכלוסייה בין 0.3% ל-43%
  • ככל שהמדגם גדול יותר, רווח הסמך צר יותר
  • עם מדגם של 500 במקום 14: 0.8% עם CI של 0.2%-1.3%

P-value

  • ההסתברות לקבל את התוצאה שקיבלנו אם במציאות אין הבדל בין הקבוצות
  • תלוי ב:
    1. גודל המדגם (גדול יותר = p-value קטן יותר)
    2. גודל האפקט (חזק יותר = p-value קטן יותר)
  • נורמה: p<0.05 (פחות מ-5% סיכוי שהתוצאה נובעת ממקריות)
  • אזהרה: p-value מדבר רק על מקריות, לא על סיבתיות או על הטיה!
  • אין קסם במספר 0.05 - זה cutoff מלאכותי

דוגמה מהמחקר

  • P-value = 0.25 בהשוואת סמארטפונים ומחלות לב
  • פירוש: 25% סיכוי שההבדל נובע ממקריות בלבד
  • מסקנה: לא מספיק חזק סטטיסטית

2. הטיה (Bias) - טעות שיטתית

הגדרה

מגמה באיסוף, ניתוח, פרשנות, פרסום או סקירת נתונים שיכולה להוביל למסקנות שונות שיטתית מהאמת.

ההבדל בין מקריות להטיה

  • מקריות: כמו יורה עם כוונת תקינה אבל פיזור סביב המטרה
  • הטיה: כמו יורה עם כוונת לא מכוילת - מדויק אבל לא במטרה
  • חשוב: הגדלת המדגם מקטינה טעות אקראית אבל לא משפיעה על הטיה!

דוגמת המאזניים

  • רוצים למדוד משקל ממוצע בכיתה
  • אם המאזניים מוסיפים 2 ק”ג לכולם - לא משנה כמה אנשים נשקול, התוצאה תהיה שגויה
  • הבעיה: ברגע שיש הטיה בנתונים, קשה מאוד לתקן
  • הפתרון: למנוע הטיה מראש

סוגי הטיה

1. הטיית בחירה (Selection Bias)

טעות שיטתית בדרך בה בוחרים אנשים למחקר.

דוגמאות:

  • מדידת שכיחות מחלות לב בבית חולים כדי להסיק על הקהילה
  • השוואת אוכלוסייה חרדית בצפת לחילונית בנתניה במחקר סמארטפונים
  • בבית חולים: אנשים חולים, מבוגרים, עניים יותר, מיעוטים - לא מייצג

2. הטיית מידע (Information Bias)

טעות שיטתית באופן איסוף המידע.

שלושה מקורות:

  1. הטיית צופה (Observer): החוקר מסווג לא נכון (“הוא מעשן רק קצת אז נרשום לא מעשן”)
  2. הטיית משיב (Responder): המרואיין משקר (אישה מעשנת בסתר עם בעלה בחדר)
  3. הטיית כלי (Instrument): בעיה בקוד/מכשיר

סיווג שגוי (Misclassification)

סיווג שגוי אקראי (Random)

  • דוגמה: עישון וסרטן ריאות
  • מציאות: מעשנים בסיכון פי 3
  • עם סיווג שגוי אקראי: אנשים עוברים בטעות בין קבוצות בשני הכיוונים
  • תוצאה: האפקט נמחק או נחלש (“bias towards the null”)
  • בעיה: עלולים לפספס אסוציאציה אמיתית

סיווג שגוי לא-אקראי (Non-random)

  • דוגמה: חיסון MMR ואוטיזם
  • הורים לילדים אוטיסטים זוכרים חיסונים טוב יותר (anchoring effect)
  • הורים לילדים בריאים טועים יותר
  • תוצאה: נוצר אפקט מזויף שלא קיים במציאות
  • יותר מסוכן - יוצר “הזיות” של קשרים לא קיימים

Recall Bias

  • אנשים עם מחלה מחפשים בזיכרון ביסודיות רבה יותר
  • דוגמה: “מה אכלת לפני שבועיים?” לעומת “מה אכלת לפני הרעלת מזון?”

3. ערפול (Confounding)

הגדרה: הסבר חלופי נסתר לקשר בין חשיפה לתוצאה.

דוגמה: אלכוהול וסרטן ריאות

  • ממצא: שותי אלכוהול בסיכון פי 3 לסרטן ריאות
  • הסבר: שותים כבדים מעשנים יותר
  • עישון הוא הגורם האמיתי לסרטן ריאות
  • אלכוהול הוא רק proxy לעישון

תנאים למשתנה מערפל

  1. קשור לחשיפה (שותי אלכוהול מעשנים יותר)
  2. גורם סיכון לתוצאה (עישון גורם לסרטן ריאות)
  3. לא על המסלול הסיבתי בין החשיפה לתוצאה

דרכי התמודדות עם ערפול

לפני המחקר

  1. הגבלה (Restriction): לגייס רק לא-מעשנים
  2. אקראיות (Randomization): חלוקה אקראית לקבוצות
  3. התאמה (Matching): לכל שותה מעשן, לגייס לא-שותה מעשן

בניתוח

  1. ריבוד (Stratification): ניתוח נפרד למעשנים ולא-מעשנים
  2. תקנון (Standardization)
  3. ניתוחים מורכבים יותר

דוגמת ריבוד מפורטת

נתונים גולמיים:

  • שותים: 20% סרטן ריאות
  • לא שותים: 2% סרטן ריאות
  • סיכון יחסי: 10

לאחר ריבוד למעשנים:

  • שותים מעשנים: 24% סרטן
  • לא שותים מעשנים: 24% סרטן
  • סיכון יחסי: 1.0 (אין הבדל!)

לאחר ריבוד ללא-מעשנים:

  • שותים לא-מעשנים: 0.1% סרטן
  • לא שותים לא-מעשנים: 0.1% סרטן
  • סיכון יחסי: 1.0 (אין הבדל!)

מסקנה: הקשר בין אלכוהול לסרטן ריאות נגרם כולו מעישון

סיבתיות (Causality)

אחרי שהוצאנו chance, bias, confounding

עכשיו אפשר לחשוב על סיבתיות - האם החשיפה גורמת לתוצאה?

מהי סיבה?

אירוע, מצב או מאפיין שמשחק תפקיד בייצור המחלה. באפידמיולוגיה מודרנית חושבים על “סיבות” ולא “הסיבה”.

דוגמת הנורה

מה גורם לנורה להידלק?

  • לחיצה על המתג
  • כבל מהמתג לנורה
  • חיבור לחשמל
  • תחנת כוח

תשובה: כולם! זו שרשרת סיבתית

סיבות הכרחיות ומספיקות

סיבה הכרחית (Necessary Cause)

  • חייבת להיות נוכחת לפני המחלה
  • דוגמאות: טפיל מלריה למלריה, HIV לאיידס
  • בלעדיה אין מחלה

Necessary cause: a “risk” factor that MUST be present before a disease occurs, ie no “risk” factor no disease

eg plasmodium and malaria; poliovirus & polio; HIV & AIDS; alcohol & FASD; Trisomy 21 & “Down’s disease”

סיבה מספיקה (Sufficient Cause)

  • שילוב גורמי סיכון שביחד גורמים למחלה
  • לרוב שילוב של גורמים, לא גורם בודד

Sufficient cause: a combination of “risk” factors or component causes that together will produce disease

eg smoking, genetic susceptibility & other factors together cause lung cancer

דוגמה: סרטן צוואר הרחם

  • מטופלת 1: HPV + גן A + עישון ← סרטן
  • מטופלת 2: HPV + גן C + HIV + דלקת ← סרטן

Hypothetical example with 3 different ways to develop cervical cancer

  • HPV הכרחי (בשתי המטופלות)
  • אף גורם אחר לא הכרחי
  • כל שילוב הוא מספיק

קריטריונים של Bradford-Hill לסיבתיות (1965)

  1. Temporality
  2. Strength of association
  3. Biological plausibility
  4. Dose-response
  5. Replication of findings (“consistency”)
  6. Consideration of alternate explanations
  7. Cessation of exposure
  8. Coherence with established facts
  9. Specificity of association

1. זמניות (Temporality)

  • החשיפה חייבת לבוא לפני המחלה
  • הקריטריון החזק ביותר
  • דוגמה: עישון לפני סרטן ריאות
  • בעיה: לפעמים פער של 20-30 שנה (הפטיטיס B ומחלת כבד)

2. עוצמת הקשר (Strength of Association)

  • ככל שהקשר חזק יותר, סביר יותר שהוא סיבתי
    • Very high or very low relative risk (relative terms, magnitudes above 2-3)
  • סיכון יחסי של 50 לעומת 1.1
  • פחות סביר שקשר חזק יוסבר על ידי confounding או bias
    • Less likely to be entirely the result of confounding or bias
      • RR=1.2 (1.1-1.3) vs. RR=4.0 (3.8-4.2)
  • אם אין קשר חזק, זה לא אומר שאין סיבתיות

3. סבירות ביולוגית (Biological Plausibility)

  • האם יש הסבר ביולוגי איך החשיפה גורמת לתוצאה?
  • עישון: כימיקלים מסרטנים נכנסים לריאות
  • בעיה: לפעמים המדע עוד לא מתקדם מספיק (Previously unexplored possibilities)
  • דוגמה היסטורית: Semmelweis ורחיצת ידיים - נשמע מטורף לפני גילוי חיידקים

4. קשר מינון-תגובה (Dose-Response Relationship)

  • עלייה בחשיפה = עלייה בסיכון
  • דוגמה: 5 סיגריות < 10 סיגריות < 20 סיגריות ביום
  • מחקר על עישון פסיבי: חיים עם לא-מעשן < עם מעשן לשעבר < מעשן קל < מעשן כבד Second-hand smoke and Lung cancer
  • חריגים: עקומת J (אלכוהול ומחלות לב), threshold effect J shaped relationship: alcohol and mortality

5. שכפול הממצאים (Replication)

  • מחקרים רבים באוכלוסיות שונות מראים אותה תוצאה
  • פחות סביר שלכולם אותה הטיה
  • בסיס למטא-אנליזות
  • חריג: אוכלוסיות עם מוטציות גנטיות ייחודיות

6. שלילת הסברים חלופיים (Alternative Explanations)

  • הוכחה ששללת chance, bias, confounding
  • חשוב בקריאה ביקורתית של מאמרים

7. הפסקת החשיפה (Cessation of Exposure)

  • הסיכון יורד כשמפסיקים את החשיפה
  • דוגמה: הפסקת עישון - הסיכון מפסיק לעלות
  • לא תמיד אפשרי (HIV - ברגע שנדבקת אי אפשר “להוריד”)

8. קוהרנטיות (Coherence)

  • התאמה לידע הקיים בביולוגיה ואפידמיולוגיה
  • דומה לסבירות ביולוגית אבל רחב יותר
  • בעיה: מה אם אתה מגלה משהו חדש לגמרי?

9. ספציפיות (Specificity) - מיושן

  • רעיון ישן: חשיפה אחת ← תוצאה אחת
  • כיום יודעים שחשיפות גורמות למחלות רבות
  • Bradford-Hill: “לא להתייחס יותר מדי”

Arises from old Henle-Koch postulates for causation

המסר המרכזי של Bradford-Hill

“אף קריטריון לא מביא הוכחה בלתי מעורערת בעד או נגד השערת סיבה ותוצאה”

  • אין קריטריון שהוא sine qua non (הכרחי)
  • זהו תהליך אינטלקטואלי, לא מבחן סטטיסטי
  • צריך לחשוב על כל הקריטריונים ביחד

סיכום התהליך

  1. ביצעת מחקר
  2. וידאת שלא chance (מדגם גדול מספיק)
  3. זהירות מפני bias (גיוס נכון, מדידה נכונה)
  4. טיפלת ב-confounding
  5. עכשיו בוחנים את הקריטריונים של Bradford-Hill
  6. מסיקים האם סביר שיש סיבתיות

התפתחויות מודרניות (15 השנים האחרונות)

  • מודלים מתמטיים מורכבים
  • דיאגרמות סיבתיות
  • רשתות אינטראקציות
  • Judea Pearl - “אבי ההסקה הסיבתית”
  • עדיין לא 100% הוכחה, אבל עוזר להחליט

מסר אחרון

“תמיד נשארת אי-ודאות במחקרים אפידמיולוגיים. לא ניתן להוכיח 100% ש-X גורם ל-Y”

דור פסקל