פינת העורכת
דבר היו"רית
משוב אנושי או AI?
הערכת חוסן תעסוקתי
בינה מלאכותית והערכה
מיומנויות חברתיות-רגשיות
ללמוד בעולם וירטואלי
מידעונט אפי
גיליון 10
הערכת מיומנויות חברתיות-רגשיות: אתגרי המדידה של המאה ה-21
המחר של המח"ר*: סיכום סקירה של ה-OECD
*מח"ר: מיומנויות חברתיות-רגשיות
ד"ר עינת נוטע-קורן
Einat.notea@gmail.com
Linzarini, A. and D. Catarino da Silva (2024), “Innovative tools for the direct assessment of social and emotional skills”, OECD Education Working Papers, No. 316, OECD Publishing, Paris, https://doi.org/10.1787/eed9bb04-en
בשנים האחרונות מערכות חינוך בעולם מדגישות את החשיבות של הקניית מיומנויות חברתיות-רגשיות (מח"ר) לתלמידים במערכת החינוך. מגמה זו משקפת את ההכרה בחשיבות מיומנויות אלו להצלחה אקדמית, בריאות נפשית, ביצועים תעסוקתיים ומעורבות אזרחית.
שיטות ההערכה הקיימות מבוססות בעיקר על דיווח עצמי או על דווחי מורים/הורים, והן חשופות להטיות שונות. לכן, יש העדפה לכלי הערכה ישירה של התנהגות בפועל, שהם אובייקטיביים יותר ותקפים יותר. כלים כאלו יכולים להתאים יותר להשוואות בין תרבותיות ולהערכה של אפקטיביות של תוכניות.
לאחרונה פרסם ה-OECD סקירה מקיפה שבוחנת 60 כלי הערכה ישירה של מיומנויות חברתיות רגשיות (מח"ר). מטרת הסקירה הייתה לבחון את הכלים הקיימים בשוק ואת התאמתם להערכות רחבות היקף. זהו אוסף מכובד שכולל תיאור המשימות ומאפייניהם וכן קישורים למקורות מידע ולמאמרים. אף שהסקירה לא הצליחה לזהות כלי העונה במלואו על הצרכים, היא חושפת מגוון פיתוחים מעניינים ומרשימים, שכדאי להכיר.
הכלים בסקירה סווגו לשתי קטגוריות עיקריות: כלים מבוססי התנהגות (משימות ומשחקים דיגיטליים) וגישות טכנולוגיות חדשות (מדדים ביו-פיזיולוגים, מציאות מדומה או רבודה, בינה מלאכותית, טביעות רגל דיגיטליות). המסמך מתייחס למאפיינים פסיכומטריים, להוגנות, לישימות בקנה מידה גדול, לתוקף אקולוגי, לעלויות פיתוח וכו'. להלן פירוט קצר על כל קטגוריה:
כלים מבוססי התנהגות
משימות
מטלות אלו מציגות למשתתפים הוראות ישירות ומצבים מובנים, ומודדות מח"ר באמצעות נתונים כמותיים ואיכותניים על בחירות שנעשו, תגובות וזמני תגובה. שתי דוגמאות למטלות כאלה הן:
-
Emotional Stroop Task: מטלה זו בוחנת שליטה עצמית רגשית על ידי השוואת זמני התגובה למילים טעונות רגשית לעומת מילים ניטרליות. המשתתפים נדרשים לזהות את צבע הכתיבה של מילים, כאשר חלק מהמילים הן בעלות תוכן רגשי. ההנחה היא שזמן התגובה יהיה ארוך יותר למילים טעונות רגשית, ומידת ההבדל מעידה על יכולת השליטה העצמית הרגשית.
-
PERC (Persistence, Effort, Resilience, and Challenge-Seeking) Task: מטלה זו מעריכה התמדה, מאמץ, חוסן ונטייה לחיפוש אתגרים. המשתתפים מתמודדים עם סדרות של פאזלים ברמות קושי שונות, ונמדדים על בחירותיהם (למשל, האם הם בוחרים באתגרים קשים יותר) ועל התמדתם בפתרון בעיות מאתגרות.
היתרונות העיקריים של מטלות אלו הם פשטותן היחסית, יעילותן מבחינת זמן, והיכולת לבודד ולמדוד מרכיבים ספציפיים של מח"ר. מנגד, אלו משימות שמזכירות ניסויים במעבדה הקוגניטיבית, והחיסרון המרכזי שלהן הוא מידת התוקף האקולוגי המוגבל שלהן. כלומר עד כמה הן משקפות התנהגות במצבי חיים אמיתיים.
משחקים דיגיטליים
משחקים דיגיטליים, לעומת זאת, מספקים סביבות אינטראקטיביות, מרהיבות ביופיין ואותנטיות יותר, המדמות תרחישים חברתיים מורכבים. שתי דוגמאות למשחקים כאלה הן:
-
ZooU: משחק זה מציב את השחקנים בסביבת בית ספר וירטואלית ומעריך מיומנויות אמפתיה, שיתוף פעולה ושליטה עצמית. השחקנים מתקשרים עם דמויות במשחק, מקבלים החלטות ומבצעים משימות, כאשר התנהגותם והחלטותיהם משמשות להערכת הכישורים השונים.
-
VESIP (Virtual Environment for Social Information Processing): משחק זה מעריך יכולות של עיבוד מידע חברתי ופתרון בעיות חברתיות. השחקנים נחשפים למצבים חברתיים מאתגרים בסביבה וירטואלית תלת-ממדית, ונדרשים לפרש כוונות, לבחור תגובות ולהעריך את יעילותן.
היתרון הבולט של משחקים אלו הוא התוקף האקולוגי הגבוה יותר והיכולת לבצע 'הערכה סמויה' (stealth assessment) המפחיתה הטיות. החסרונות כוללים את הזמן הרב הנדרש לפיתוח, העלויות הגבוהות, העובדה שרבים מהם טרם נבדקו מספיק מבחינה פסיכומטרית, והמורכבות והעומס הקוגניטיבי שעלולים ליצור 'רעש' בנתונים וקושי לבודד את המיומנות הנבדקת.
כלים העושים שימוש בטכנולוגיות חדשות
מדדים ביופיזיולוגיים: שימוש במדידה ישירה של תגובות פיזיולוגיות, כמו קצב פעימות לב, רמת קורטיזול, מעקב אחר תנועות עיניים, כאינדיקציה למח"ר. לדוגמה, משחק כמו Nevermind מאפשר הערכה בזמן אמת של תגובות רגשיות ויכולת ויסות, באמצעות מדידת השתנות קצב פעימות לב. היתרון בגישה זו הוא היכולת לקבל מידע אובייקטיבי על מצבים פנימיים, שאינם נתונים לשליטה מודעת של הנבדק. עם זאת, כלים אלו נמצאים בעיקר בשימוש במעבדה ופחות מתאימים להערכה בבית הספר. בהקשר זה עולה גם סוגיה אתית שקשורה באיסוף מידע רפואי/פרטי.
מציאות מדומה (VR) ומציאות רבודה (AR)
סביבות אלו מאפשרות חוויות מציאותיות ועשירות יותר מאשר משחקים דיגיטליים רגילים. לדוגמה, כלי VR כמו Athenea מדמה סביבת חללית עתידנית, שבה המשתתפים מתקשרים עם דמויות וירטואליות ומתמודדים עם אתגרים חברתיים, המאפשרים הערכה של מיומנויות כמו הערכה עצמית ותחושת מסוגלות. היתרון הבולט של טכנולוגיות אלו הוא רמת המעורבות והתחושה החזקה של "נוכחות" שהן מספקות, מה שעשוי להוביל להתנהגויות אותנטיות יותר. עם זאת, החסרונות כוללים עלויות ציוד גבוהות, אתגרים טכניים כמו מחלת סייבר (cybersickness), והעדר הוכחות ברורות ליתרונות משמעותיים על פני חוויות מסך דו-ממדיות בהקשר של הערכת מח"ר. בנוסף, המחקר עדיין לא מספק ונדרש תיקוף נוסף לפני יישום בקנה מידה רחב.
יישומי בינה מלאכותית (AI)
בינה מלאכותית מציעה פוטנציאל משמעותי לשיפור הערכת מח"ר באמצעות ניתוח מתקדם של נתונים מורכבים ויצירת כלי הערכה חדשניים. יישומי AI כוללים ניתוח של כמויות גדולות של נתונים ממקורות שונים (כולל טקסט, מבט עיניים, הבעות פנים ודיבור) ועל בסיסם להסיק מסקנות על מח"ר. בינה מלאכותית יוצרת (generative AI) מאפשרת ליצור תוכן כמו טקסט, אודיו, תמונות ואפילו וידאו, ליצירת תרחישים ומטלות אינטראקטיביות ואימרסיביות. היתרונות כוללים יכולת עיבוד מהירה ומדויקת של נתונים מורכבים, זיהוי דפוסים שקשה לאדם לזהות, ויכולת ליצור כמות גדולה של תוכן מגוון במהירות ובעלות נמוכה יחסית. למרות הפוטנציאל הרב, יש גם אתגרים רבים ובעיקר דאגה אתית לגבי פרטיות ואבטחת מידע, הטיות אלגוריתמיות, קושי בהסבר החלטות AI מורכבות, והצורך בפיקוח ובדיקה אנושית על התוכן המיוצר על ידי AI. כמו כן, רוב היישומים עדיין בשלבי פיתוח ומחקר, ונדרשים מחקרי תיקוף נרחבים לפני יישום בקנה מידה רחב.
טביעות רגל דיגיטליות ומדדים התנהגותיים ממשחקי וידאו: גישה זו מנצלת נתונים קיימים מאינטראקציות דיגיטליות ומשחקי וידאו מסחריים להערכת מח"ר. לדוגמה, ניתוח התנהגות שחקנים במשחק Minecraft יכול לספק תובנות על יצירתיות ופתרון בעיות. היתרון המרכזי הוא היכולת לאסוף מידע על התנהגויות אותנטיות בסביבות דיגיטליות טבעיות, ללא צורך בפיתוח כלי הערכה ייעודיים. עם זאת, האתגרים כוללים קשיים בפרשנות הנתונים, שכן ההתנהגות במשחקים לא תוכננה במקור למטרות הערכה, וסוגיות אתיות הנוגעות לפרטיות ולשימוש בנתונים שנאספו למטרות אחרות. בנוסף, יש צורך במחקר נוסף כדי לבסס את הקשר בין התנהגויות במשחקים לבין מח"ר בעולם האמיתי.
סיכום
סקירה זו חשפה התקדמות משמעותית בפיתוח כלים חדשניים להערכה ישירה של מח"ר. אמנם עדיין לא נמצא כלי המתאים כיום להערכה רחבה, אך נראה שישנם כלים שיכולים לתת השראה להמשך פיתוח. יתרונותיהם של כלים אלה הם בתוקף אקולוגי משופר, אובייקטיביות, ויכולת להעריך התנהגויות ומיומנויות בפועל. לצד היתרונות, זוהו מספר אתגרים הכרוכים ביישום כלים אלה, כגון: עלויות פיתוח גבוהות, סוגיות אתיות כבדות משקל ומורכבות טכנית. לבסוף, בסקירה הועלה הצורך בשילוב בין הערכות ישירות ועקיפות כדי לקבל תמונה מקיפה יותר של מח"ר, והצורך במחקר ופיתוח נוספים. גישה זו צפויה לקדם את הבנתנו ואת יכולת ההערכה שלנו בתחום המיומנויות החברתיות-רגשיות.