הקדמה ותזכורת
- עברו כחודשיים מהמפגש הקודם בגלל מורכבות המערכת
- תזכורת: אפידמיולוגיה תיאורית, מדידות עם מונה ומכנה, incidence, prevalence, risks, rates
- המטרה: לדעת אם המדידה האפידמיולוגית משקפת מציאות או נגרמת ממשהו אחר
- שלושה גורמים שיכולים לגרום לממצאים מלבד ממצאים אמיתיים:
- מקריות (Chance)
- הטיה (Bias)
- ערפול (Confounding)
דוגמה מרכזית: סמארטפונים ומחלות לב
מחקר דמיוני: האם שימוש בסמארטפונים גורם למחלות לב?
- קבוצה 1: משתמשי סמארטפון - 2 מתוך 7 עם מחלת לב (28%)
- קבוצה 2: לא משתמשים - 1 מתוך 7 עם מחלת לב (14%)
- מסקנה מתמטית: משתמשי סמארטפון בסיכון כפול למחלות לב
- אבל: צריך להיות סקפטיים! באפידמיולוגיה עובדים בשיטת אלימינציה
1. מקריות (Chance) - טעות אקראית
הסבר
- באפידמיולוגיה לעיתים רחוקות בודקים אוכלוסיות שלמות
- משתמשים במדגמים כדי להסיק על האוכלוסייה
- בדיוק כמו סקרי בחירות - לא שואלים כל אדם במדינה
דוגמה מספרית
- אוכלוסייה: 1,000 אנשים, 10 עם מחלת לב (שכיחות אמיתית 1%)
- מדגם: 14 אנשים, במקרה 3 עם מחלת לב (שכיחות במדגם 22%)
- כמו הטלת מטבע - בממוצע 50/50, אבל לפעמים 3-4 פעמים אותו צד
רווחי בר סמך (Confidence Intervals)
- מודדים כמה אנחנו בטוחים שהערך במדגם מייצג את האוכלוסייה
- לרוב משתמשים ב-95% CI
- דוגמה: 22% עם CI של 0.3%-43%
- פירוש: 95% בטוחים שהערך האמיתי באוכלוסייה בין 0.3% ל-43%
- ככל שהמדגם גדול יותר, רווח הסמך צר יותר
- עם מדגם של 500 במקום 14: 0.8% עם CI של 0.2%-1.3%
P-value
- ההסתברות לקבל את התוצאה שקיבלנו אם במציאות אין הבדל בין הקבוצות
- תלוי ב:
- גודל המדגם (גדול יותר = p-value קטן יותר)
- גודל האפקט (חזק יותר = p-value קטן יותר)
- נורמה: p<0.05 (פחות מ-5% סיכוי שהתוצאה נובעת ממקריות)
- אזהרה: p-value מדבר רק על מקריות, לא על סיבתיות או על הטיה!
- אין קסם במספר 0.05 - זה cutoff מלאכותי
דוגמה מהמחקר
- P-value = 0.25 בהשוואת סמארטפונים ומחלות לב
- פירוש: 25% סיכוי שההבדל נובע ממקריות בלבד
- מסקנה: לא מספיק חזק סטטיסטית
2. הטיה (Bias) - טעות שיטתית
הגדרה
מגמה באיסוף, ניתוח, פרשנות, פרסום או סקירת נתונים שיכולה להוביל למסקנות שונות שיטתית מהאמת.
ההבדל בין מקריות להטיה
- מקריות: כמו יורה עם כוונת תקינה אבל פיזור סביב המטרה
- הטיה: כמו יורה עם כוונת לא מכוילת - מדויק אבל לא במטרה
- חשוב: הגדלת המדגם מקטינה טעות אקראית אבל לא משפיעה על הטיה!
דוגמת המאזניים
- רוצים למדוד משקל ממוצע בכיתה
- אם המאזניים מוסיפים 2 ק”ג לכולם - לא משנה כמה אנשים נשקול, התוצאה תהיה שגויה
- הבעיה: ברגע שיש הטיה בנתונים, קשה מאוד לתקן
- הפתרון: למנוע הטיה מראש
סוגי הטיה
1. הטיית בחירה (Selection Bias)
טעות שיטתית בדרך בה בוחרים אנשים למחקר.
דוגמאות:
- מדידת שכיחות מחלות לב בבית חולים כדי להסיק על הקהילה
- השוואת אוכלוסייה חרדית בצפת לחילונית בנתניה במחקר סמארטפונים
- בבית חולים: אנשים חולים, מבוגרים, עניים יותר, מיעוטים - לא מייצג
2. הטיית מידע (Information Bias)
טעות שיטתית באופן איסוף המידע.
שלושה מקורות:
- הטיית צופה (Observer): החוקר מסווג לא נכון (“הוא מעשן רק קצת אז נרשום לא מעשן”)
- הטיית משיב (Responder): המרואיין משקר (אישה מעשנת בסתר עם בעלה בחדר)
- הטיית כלי (Instrument): בעיה בקוד/מכשיר
סיווג שגוי (Misclassification)
סיווג שגוי אקראי (Random)
- דוגמה: עישון וסרטן ריאות
- מציאות: מעשנים בסיכון פי 3
- עם סיווג שגוי אקראי: אנשים עוברים בטעות בין קבוצות בשני הכיוונים
- תוצאה: האפקט נמחק או נחלש (“bias towards the null”)
- בעיה: עלולים לפספס אסוציאציה אמיתית
סיווג שגוי לא-אקראי (Non-random)
- דוגמה: חיסון MMR ואוטיזם
- הורים לילדים אוטיסטים זוכרים חיסונים טוב יותר (anchoring effect)
- הורים לילדים בריאים טועים יותר
- תוצאה: נוצר אפקט מזויף שלא קיים במציאות
- יותר מסוכן - יוצר “הזיות” של קשרים לא קיימים
Recall Bias
- אנשים עם מחלה מחפשים בזיכרון ביסודיות רבה יותר
- דוגמה: “מה אכלת לפני שבועיים?” לעומת “מה אכלת לפני הרעלת מזון?”
3. ערפול (Confounding)
הגדרה: הסבר חלופי נסתר לקשר בין חשיפה לתוצאה.
דוגמה: אלכוהול וסרטן ריאות
- ממצא: שותי אלכוהול בסיכון פי 3 לסרטן ריאות
- הסבר: שותים כבדים מעשנים יותר
- עישון הוא הגורם האמיתי לסרטן ריאות
- אלכוהול הוא רק proxy לעישון
תנאים למשתנה מערפל
- קשור לחשיפה (שותי אלכוהול מעשנים יותר)
- גורם סיכון לתוצאה (עישון גורם לסרטן ריאות)
- לא על המסלול הסיבתי בין החשיפה לתוצאה
דרכי התמודדות עם ערפול
לפני המחקר
- הגבלה (Restriction): לגייס רק לא-מעשנים
- אקראיות (Randomization): חלוקה אקראית לקבוצות
- התאמה (Matching): לכל שותה מעשן, לגייס לא-שותה מעשן
בניתוח
- ריבוד (Stratification): ניתוח נפרד למעשנים ולא-מעשנים
- תקנון (Standardization)
- ניתוחים מורכבים יותר
דוגמת ריבוד מפורטת
נתונים גולמיים:
- שותים: 20% סרטן ריאות
- לא שותים: 2% סרטן ריאות
- סיכון יחסי: 10
לאחר ריבוד למעשנים:
- שותים מעשנים: 24% סרטן
- לא שותים מעשנים: 24% סרטן
- סיכון יחסי: 1.0 (אין הבדל!)
לאחר ריבוד ללא-מעשנים:
- שותים לא-מעשנים: 0.1% סרטן
- לא שותים לא-מעשנים: 0.1% סרטן
- סיכון יחסי: 1.0 (אין הבדל!)
מסקנה: הקשר בין אלכוהול לסרטן ריאות נגרם כולו מעישון
סיבתיות (Causality)
אחרי שהוצאנו chance, bias, confounding
עכשיו אפשר לחשוב על סיבתיות - האם החשיפה גורמת לתוצאה?
מהי סיבה?
אירוע, מצב או מאפיין שמשחק תפקיד בייצור המחלה. באפידמיולוגיה מודרנית חושבים על “סיבות” ולא “הסיבה”.
דוגמת הנורה
מה גורם לנורה להידלק?
- לחיצה על המתג
- כבל מהמתג לנורה
- חיבור לחשמל
- תחנת כוח
תשובה: כולם! זו שרשרת סיבתית
סיבות הכרחיות ומספיקות
סיבה הכרחית (Necessary Cause)
- חייבת להיות נוכחת לפני המחלה
- דוגמאות: טפיל מלריה למלריה, HIV לאיידס
- בלעדיה אין מחלה
Necessary cause: a “risk” factor that MUST be present before a disease occurs, ie no “risk” factor no disease
eg plasmodium and malaria; poliovirus & polio; HIV & AIDS; alcohol & FASD; Trisomy 21 & “Down’s disease”
סיבה מספיקה (Sufficient Cause)
- שילוב גורמי סיכון שביחד גורמים למחלה
- לרוב שילוב של גורמים, לא גורם בודד
Sufficient cause: a combination of “risk” factors or component causes that together will produce disease
eg smoking, genetic susceptibility & other factors together cause lung cancer
דוגמה: סרטן צוואר הרחם
- מטופלת 1: HPV + גן A + עישון ← סרטן
- מטופלת 2: HPV + גן C + HIV + דלקת ← סרטן
- HPV הכרחי (בשתי המטופלות)
- אף גורם אחר לא הכרחי
- כל שילוב הוא מספיק
קריטריונים של Bradford-Hill לסיבתיות (1965)
- Temporality
- Strength of association
- Biological plausibility
- Dose-response
- Replication of findings (“consistency”)
- Consideration of alternate explanations
- Cessation of exposure
- Coherence with established facts
- Specificity of association
1. זמניות (Temporality)
- החשיפה חייבת לבוא לפני המחלה
- הקריטריון החזק ביותר
- דוגמה: עישון לפני סרטן ריאות
- בעיה: לפעמים פער של 20-30 שנה (הפטיטיס B ומחלת כבד)
2. עוצמת הקשר (Strength of Association)
- ככל שהקשר חזק יותר, סביר יותר שהוא סיבתי
- Very high or very low relative risk (relative terms, magnitudes above 2-3)
- סיכון יחסי של 50 לעומת 1.1
- פחות סביר שקשר חזק יוסבר על ידי confounding או bias
- Less likely to be entirely the result of confounding or bias
- RR=1.2 (1.1-1.3) vs. RR=4.0 (3.8-4.2)
- Less likely to be entirely the result of confounding or bias
- אם אין קשר חזק, זה לא אומר שאין סיבתיות
3. סבירות ביולוגית (Biological Plausibility)
- האם יש הסבר ביולוגי איך החשיפה גורמת לתוצאה?
- עישון: כימיקלים מסרטנים נכנסים לריאות
- בעיה: לפעמים המדע עוד לא מתקדם מספיק (Previously unexplored possibilities)
- דוגמה היסטורית: Semmelweis ורחיצת ידיים - נשמע מטורף לפני גילוי חיידקים
4. קשר מינון-תגובה (Dose-Response Relationship)
- עלייה בחשיפה = עלייה בסיכון
- דוגמה: 5 סיגריות < 10 סיגריות < 20 סיגריות ביום
- מחקר על עישון פסיבי: חיים עם לא-מעשן < עם מעשן לשעבר < מעשן קל < מעשן כבד
- חריגים: עקומת J (אלכוהול ומחלות לב), threshold effect
5. שכפול הממצאים (Replication)
- מחקרים רבים באוכלוסיות שונות מראים אותה תוצאה
- פחות סביר שלכולם אותה הטיה
- בסיס למטא-אנליזות
- חריג: אוכלוסיות עם מוטציות גנטיות ייחודיות
6. שלילת הסברים חלופיים (Alternative Explanations)
- הוכחה ששללת chance, bias, confounding
- חשוב בקריאה ביקורתית של מאמרים
7. הפסקת החשיפה (Cessation of Exposure)
- הסיכון יורד כשמפסיקים את החשיפה
- דוגמה: הפסקת עישון - הסיכון מפסיק לעלות
- לא תמיד אפשרי (HIV - ברגע שנדבקת אי אפשר “להוריד”)
8. קוהרנטיות (Coherence)
- התאמה לידע הקיים בביולוגיה ואפידמיולוגיה
- דומה לסבירות ביולוגית אבל רחב יותר
- בעיה: מה אם אתה מגלה משהו חדש לגמרי?
9. ספציפיות (Specificity) - מיושן
- רעיון ישן: חשיפה אחת ← תוצאה אחת
- כיום יודעים שחשיפות גורמות למחלות רבות
- Bradford-Hill: “לא להתייחס יותר מדי”
Arises from old Henle-Koch postulates for causation
המסר המרכזי של Bradford-Hill
“אף קריטריון לא מביא הוכחה בלתי מעורערת בעד או נגד השערת סיבה ותוצאה”
- אין קריטריון שהוא sine qua non (הכרחי)
- זהו תהליך אינטלקטואלי, לא מבחן סטטיסטי
- צריך לחשוב על כל הקריטריונים ביחד
סיכום התהליך
- ביצעת מחקר
- וידאת שלא chance (מדגם גדול מספיק)
- זהירות מפני bias (גיוס נכון, מדידה נכונה)
- טיפלת ב-confounding
- עכשיו בוחנים את הקריטריונים של Bradford-Hill
- מסיקים האם סביר שיש סיבתיות
התפתחויות מודרניות (15 השנים האחרונות)
- מודלים מתמטיים מורכבים
- דיאגרמות סיבתיות
- רשתות אינטראקציות
- Judea Pearl - “אבי ההסקה הסיבתית”
- עדיין לא 100% הוכחה, אבל עוזר להחליט
מסר אחרון
“תמיד נשארת אי-ודאות במחקרים אפידמיולוגיים. לא ניתן להוכיח 100% ש-X גורם ל-Y”
דור פסקל