
מידעונט אפי
גיליון 7
דבר העורכת
שלום לכל הקוראים והקוראות של מידעונט אפי,
שמחה לשתף אתכם בגיליון החורף של המידעונט. המידעונט משמש פלטפורמה לשיתוף העשייה המקצועית המגוונת בנושאים הקשורים בפסיכומטריקה, מדידה והערכה. אנו מכוונים לקהלי יעד רחבים מתחומי ההערכה והמיון, הפסיכולוגיה, החינוך, החברה, משאבי האנוש ועוד.
אני מבקשת להודות ולהביע את הערכתי לכל הכותבים שטרחו, השקיעו וחלקו איתנו את פועלם. בזכותם נולד גיליון מעשיר ומעניין זה.
מה בגיליון?
-
שני מאמרים מרתקים שממחישים את התנופה שבה נמצא עולם הפסיכומטריקה עם ההתקדמות המואצת בתחומי הבינה המלאכותית. המאמרים עוסקים במפגש שבין הבינה המלאכותית והפסיכומטריקה בהקשר של פיתוח משימות מבחן (טקסטים ושאלות) ובהקשר של הערכת איכות תשובות פתוחות בביולוגיה ומתן משוב מילולי לתלמידים. תודה לד"ר יואל רפ מהמרכז הארצי לבחינות והערכה ותודה לצוות המוכשר ממכון ויצמן: טניה נזרצקי, ד״ר מוריה אריאלי וד"ר גיורא אלכסנדרון.
-
בפינת "נעים להכיר", ד"ר מיכל קרן לוי חושפת אותנו לתוכנית לתואר שני בסמינר הקיבוצים, שהיא עומדת בראשה. תוכנית זו מכשירה אנשי חינוך לעסוק במדידה והערכה חינוכית בהיבטים שונים הרלוונטיים לשילוב ההוראה, הלמידה והערכה.
-
ד"ר צור קרליץ מעדכן אותנו על התפתחות חשובה בדיון באפי על הזהות המקצועית של העוסקים בפסיכומטריקה. מי עוסק בתחום והאם הם בהכרח אוחזים בזהות של מקצוע ה"פסיכומטריקאי"? קראו וגלו בעצמכם.
-
מדידת יצירתיות הוא נושא שעולה בו צורך הולך וגובר מזה שנים. האתגרים נובעים מגורמים כמו הקושי להגדיר את המבנה התיאורטי "יצירתיות", הציפייה מנבחנים בתוך קונטקסט מבחני לגלות יצירתיות, וכמובן מהיבט המדידה עצמה, המהימנות והתוקף שלה. בגיליון 6, בפינה "חם מן התנור", הצגתי מאמר סקירה שמתאר את מורכבות המדידה והשימוש הבעייתי במדדי יצירתיות בתחום המחקר. ארגון הפיזה "הרים את הכפפה" וכלל במחקר הפיזה 2022 מדידת יצירתיות של נערים ונערות בני 15. ד"ר נעה שחורי איל מראמ"ה תספר לנו על מסגרת המבחן.
-
בפינת "חם מן התנור" ד"ר מירב חמי וד"ר רונן קספרסקי יציגו עבודה שלהם שפורסמה לאחרונה בכתב העת: Personality and Individual Differences. העבודה עוסקת בפיתוח כלי רב-ממדי למדידת מיומנויות חבריות-רגשיות של עובדי הוראה.
-
בפינת האקטואליה אשתף בפרסום רחב בעיתונות האמריקאית שעסק בדעיכה בהישגים במבחן ה-ACT והקשר של זה למערכת החינוך (האם היא אחראית?).
-
נסיים את הגיליון בעדכון על כנסים מקצועיים בחו"ל.
הזמנה להבעת דעה ולשיח
אני מזמינה אתכם להגיב לכתבות, להתייחס לתגובות של אחרים, להביע עמדה ולשתף במידע נוסף וברעיונות. כתבו לי.
קריאה מהנה,
עינת נוטע-קורן
עורכת המידעונט והיו"ר הנבחר לאפי
einat.notea@gmail.com
"מבזקים"
קיץ 2023 מעבר לים
Association of Test Publishers (ATP)
תאריכים: 12–15 במרץ 2023, דאלאס, טקסס
הנושא: Better Together. Learning. Assessments. Outcomes
National Council on Measurement in Education (NCME)
תאריכים: 12–15 באפריל 2023, שיקגו, אילינוי
Society for Industrial and Organizational Psychology (SIOP)
תאריכים: 19–22 באפריל 2023, בוסטון
International Association for the Evaluation of Educational Achievement (IEA)
תאריכים: 28–30 ביוני 2023, דבלין, אירלנד
Psychometric Society (IMPS)
תאריכים: יולי 2023, אוניברסיטת מרילנד. תאריכים מדויקים יפורסמו במהלך החורף.
הכנס יהיה במתכונת של פגישות אישיות.
International Association for Educational Assessment (IAEA)
תאריכים: 24–29 בספטמבר 2023, קינגסטון, ג'מייקה
Association for Educational Assessment – Europe
תאריכים: 1–4 בנובמבר 2023, מלטה
כשבינה מלאכותית פוגשת את הפסיכומטריקה
השילוב בין פסיכומטריקה לבינה מלאכותית (AI) ולמידת מכונה (ML) – איך עומדת להיראות המהפכה החדשה בתחום הפסיכומטריקה והמבחנים?
מאת: ד"ר יואל רפ, מנהל מדור בחינות ממוחשבות, המרכז הארצי לבחינות ולהערכה
פרטי קשר להתייחסות: yoel@nite.org.il
* תודה לד"ר יגאל אטאלי על הערותיו המועילות
בשנים האחרונות מושקעים מאות מליוני דולרים בטכנולוגיות של בינה מלאכותית (Artificial Intelligence - AI) ועיבוד שפה טבעית (NLP - Natural Language Processing) על ידי חברות מערביות. דומה שהמערכות הללו נמצאות כבר בכל תחום בחיינו, החל מנהיגה בכבישים, סייעות כמו סירי בטלפון הנייד, בוטים ברשתות החברתיות וכד'. לאחרונה החלו הטכנולוגיות הללו משתלבות באופן משמעותי יותר גם בתחום המבחנים והפסיכומטריקה.
השילוב בין אוטומציה של תהליכים שנעשים על ידי גורמי אנוש לבין מבחנים ופסיכומטריקה אינו חדש לגמרי. רעיונות ומערכות ראשונות החלו מופיעות לפני למעלה משני עשורים. בהתחלה היו אלו מערכות שפיתחו פריטים באופן אוטומטי (Automatic Item Generation) בכפוף לכך שאפשר היה למדל את הפריטים ולקבוע מה הם ה"איברים" המשתנים שבהם. פיתוח מערכות כאלו דרש שיתוף פעולה בין אנשי מחשבים, פסיכולוגים קוגניטיביים ופסיכומטריקאים. בערך באותן שנים הופיעו מערכות לבדיקה אוטומטית של חיבורים ושל תשובות תלמידים לשאלות פתוחות.
שינוי גדול נוסף שהורגש בכמעט כל מוסד לימודים התחולל בתקופת משבר הקורונה, שבה מיליונים נאלצו להיבחן מהבית במבחנים נעדרי סיכון ועתירי סיכון כאחד, כאשר ההשגחה על טוהר הבחינות נעשית מרחוק (e-proctoring). לצד משגיחים אנושיים, חברות רבות של השגחה ואדמיניסטרציה של מבחנים ממוחשבים השתמשו במערכות ממוחשבות המתריעות בכל פעם שהן מזהות התנהגות חריגה וחשודה בפגיעה בטוהר הבחינות על ידי הנבחנים.
נראה שעתה אנו עומדים שוב בפתחה של מהפכה משמעותית בתחום המבחנים. עם ההתקדמות האדירה בתחום ה-AI ובתת התחום שלה, NLP, מערכות ממוחשבות יודעות כיום לחבר שאלות מבחן פתוחות או סגורות (למשל שאלות רב ברירה) על כל המשתמע מכך: גזע השאלה, התשובה הנכונה והמסיחים ללא מודל מובנה מסוים. יתירה מכך, המערכות יודעות לחבר טקסטים, בין אם טקסט קצר המהווה את גזע השאלה ובין אם טקסט ארוך המשמש גריין המלווה במספר שאלות הבנה אודות הטקסט (בעיקר במבחני הבנת הנקרא). לא, אין הכוונה לכך שהמערכות סוקרות את כלל המידע הנמצא באתרים באינטרנט ובוחרות משם טקסטים מתאימים למבחן, אלא במערכות שמייצרות בעצמן את הטקסטים יש מאין. נשמע מדע בדיוני? לא עוד.
לאחרונה השיקה חברת Duolingo בענף מבחן האנגלית שלה, מבחן מקוון אדפטיבי שבוחן שליטה בשפה האנגלית ברחבי העולם. פיתוח הטקסטים למבחן נעשה בידי מכונה. כמו כן, חברת Finetune, שנרכשה לאחרונה על ידי חברת המבחנים Prometrics, העמידה את הידע שצברה בפיתוח מערכות AI לטובת פיתוח טקסטים המתאימים לפיתוח מבחני הישגים. לפי דברי החברה, לא רק שהמערכות שלה יודעות לפתח טקסטים לבדיקת הבנת הנקרא, אלא שהן גם יכולות לפתח טקסטים בתחומי לימוד שונים, לפתח שאלות מבחן שבודקות רמות חשיבה על פי הטקסונומיה של בלום, לקבוע לאיזה סטנדרט לימודי מתאימה כל שאלה, ולמפות את המבחן שנבנה. הן גם יודעת לעבור על ספרי לימוד, למפות אותם לפי נושאים, ולקבוע לגבי כל נושא את מידת ההתאמה שלו לסטנדרטים. כך, המערכות יכולות לתמוך בעבודה הסיזיפית של פיתוח מבחני הישגים ומיפוי התוכן שלהם, מיפוי ספרי לימוד, סימון החלקים החשובים ועוד.
אז איך זה עובד? בעיקרון, כבר כיום ישנן מערכות כמו מערכות GPT3 אשר "מבינות" את המבנה הלשוני של השפה הטבעית על כל היבטיה. הן מסוגלות ללמוד ולחקות את הפורמט, הסגנון, הסוגה והרמה הלשונית של טקסטים על פי מספר דוגמאות שמסופקות להן. ככל הנראה אפשר להסתפק בפחות מ-10 דוגמאות של הטקסטים הנדרשים כדי שהמערכת תייצר טקסטים חדשים באותו סגנון ללא מגע יד אדם. הטקסטים הללו הם קוהרנטיים, בעלי משמעות ורוב האנשים לא מסוגלים להבחין בינם לבין טקסטים שפותחו על ידי בני אנוש. מערכות כמו GPT3 מציבות הזדמנות למפתחי מבחנים ופריטים מסוגים שונים. נעשו גם ניסיונות מוצלחים לפתח מבחני אישיות עם היגדים שיוצרו על ידי מערכות כאלו.
ניסיון העבר שלי בפיתוח מבחני המיצ"ב לימדני כי אחת מאבני הנגף המעכבים ביותר פיתוח מבחנים בשפות ובמקצועות אוריינים הכוללים טקסטים, היא איתור טקסטים שישמשו כגריינים. למשימה זו היו מוקדשות עשרות שעות עבודה של מומחים ואין סוף ויכוחים על טיבם של הטקסטים ומידת התאמתם למבחן. אמנם הטקסטים שמפותחים כיום על ידי המכונה עדיין מחייבים בחינה של עין אנושית והגהות, וסביר שחלק גדול מהם אף יפסלו (לפי Attali et. al. 2022, כ-50%), אך אין ספק שיש כאן פריצת דרך, וכי ככל שהמערכות יתקדמו וישתפרו, יהיה אפשר לקבל טקסטים ושאלות מבחן איכותיים באופן מידי וללא מגבלה.
לדברי אנשי Duolingo הם כבר פיצחו גם את שאלת רמת הקושי של הפריטים והצליחו ללמד את המכונה לפתח פריטים ברמת קושי מסוימת (Alina von-Davier, 13.10.2022). אם כך, ייחסך הצורך לפתח בנק פריטים גדול מראש ולהעבירו למאות נבחנים על מנת לעמוד על הפרמטרים של הפריטים, והדבר יאפשר יצירת מבחן אדפטיבי "און-דה-פליי". כך גם תיפתר בעיית ההדלפה של שאלות וטקסטים בין נבחנים במבחנים ממוחשבים אדפטיביים או לינאריים, שכבר כיום ניתן להיבחן בהם במועדים אישיים (כלומר, לא במועד מסוים ולא באופן סימולטני עם עוד אלפי נבחנים). מאחר שישנן מערכות מבוססות AI שגם יודעות להעריך שאלות פתוחות יהיה אפשר לוותר על המגבלה של משך זמן מינימלי בין מבחן למבחן, ונבחן יוכל להיבחן בבחינה חוזרת כמה דקות לאחר שסיים את הבחינה הקודמת.
מהם הסיכונים והבעיות של פיתוח כזה? מעבר לקושי הפסיכולוגי שברעיון שנבחנים יבחנו ושגורלות אדם יקבעו על ידי מבחנים שפותחו על ידי מחשבים, הקושי העיקרי שאורב בפיתוח כזה הוא שהמחשב בסופו של דבר יבנה מבחנים מוטים ומפלים בדיוק כמו בדוגמאות שהוצגו לו ושפותחו על ידי אנשים. אם הטקסטים והשאלות של מבחן מוטים לרעת קבוצת מיעוט מסוימת או לרעת נשים, רוב הסיכויים שהמכונה שתפתח טקסטים ושאלות על בסיס אותן דוגמאות יהיו מוטים אף הן. כלומר, המבחנים שיפותחו על ידי מערכות ה-AI עלולים לשמר את העיוותים וחוסר ההוגנות שבמבחנים הקיימים.
כדי להתגבר על כך יש צורך "להזין" את המכונה בדוגמאות של מבחנים הוגנים. כאמור, כיום ה-AI תומך בתהליכי פיתוח ועדיין נדרשת מעורבות אנושית לא מבוטלת, אולם יש לקוות שבעתיד, כשאפשר יהיה לפתח מבחנים עם פחות התערבות אנושית, לא תהיה מגמה של התנערות מאחריות של החברות והגופים שיפתחו מבחנים. מומחים טוענים כי יהיה צורך להסדיר את התחום ולקבוע סטנדרטים ודרכי רגולציה כדי להבטיח אתיקה ושימוש הולם והוגן.
מתי בישראל? בינתיים המערכות הללו קיימות, למיטב ידיעתנו, רק בשפה האנגלית, אך העקרונות הוצבו והתובנות קיימות. על פי המומחים, בטווח של 5–10 שנים הן תהיינה קיימות גם בשפות אחרות (תקשורת אישית, Sara Vispoel, Alina von-Davier, 13.10.2022, Simmy Ziv-el). לצורך פיתוח מערכות כאלו יש צורך בשיתוף פעולה בין אנשי AI ו-NLP של שפה ספציפית ובין פסיכומטריקאים, והדבר כרוך בהשקעת משאבים רבה ובהבשלה של שנים.
לצד זאת, הולכות ומשתפרות המערכות שיודעות לתרגם בין שפות. לכן, יש סיכוי די גדול שבטווח של כעשר שנים, גם בארץ עבודת הפיתוח של מבחנים תתבסס בעיקרה על מערכות AI ותהיה יעילה וזולה יותר מהיום. אם איננו רוצים להיות במאסף של התהליכים הללו ועל מנת להקטין את התלות שלנו בחברות העשירות האמריקאיות שכרגע מובילות את התחום ובהמשך ישלטו בו, כדאי לנו לנסות ולפתח מערכות כאלו בעברית ובערבית ולהתחיל לחפש דרכים לפתח לעצמנו יכולות בינה מלאכותית לפיתוח מבחנים כבר כיום.
לקריאה ועיון נוספים:
-
פיתוח מבחן האנגלית של Duolingo:
Attali Y, Runge A, LaFlair GT, Yancey K, Goodwin S, Park Y, von Davier AA. The interactive reading task: Transformer-based automatic item generation. Front Artif Intell. 2022 Jul 22;5:903077. doi: 10.3389/frai.2022.903077. PMID: 35937141; PMCID: PMC9354894.
-
מידע על מערכת GPT-3:
https://gpt3demo.com/apps/openai-gpt-3-playground
https://en.wikipedia.org/wiki/GPT-3
"נעים להכיר"
אנשים, ארגונים, מיזמים ותוכניות שעוסקים במבחנים, מדידה והערכה
התוכנית לתואר שני בהערכה בחינוך בסמינר הקיבוצים
מאת: ד"ר מיכל לוי קרן, ראש התוכנית
פרטי קשר להתייחסות: michal.keren@smkb.ac.il
התוכנית 'הערכה בחינוך' במכללת סמינר הקיבוצים היא היחידה כיום בישראל אשר מוקדשת כולה להערכה על היבטיה המגוונים, למשמעותה ולתפקידה כחלק מתהליך ההוראה הבית-ספרית. התוכנית נועדה להכשיר אנשי חינוך: מורים, גננות, מנהלים ובעלי תפקידים במערכת החינוך הפורמלית והלא פורמלית להיות אנשי הערכה מקצועיים הבקיאים בידע התאורטי והיישומי המגוּון בתחום.
המטרות המרכזיות של התוכנית:
-
לעזור ללומדים בגיבוש זהות מקצועית של אנשי הערכה, הרואים את חשיבותה ותרומתה של ההערכה למעשה החינוכי.
-
להרחיב את הידע, המיומנויות והתפיסות של אנשי החינוך בנושא הערכה ולהציב את ההערכה כאמצעי רב-עוצמה ללמידה וצמיחה של בית הספר או הארגון החינוכי ולא כמטרה או כאמצעי לפיקוח, בקרה ושליטה.
-
לתת לסטודנטים ידע וכלים שיאפשרו להם להטמיע הערכה מורכבת בשדות החינוכיים בהם הם עובדים ולהשפיע על השיח החינוכי הכולל בנושא הערכה.
-
להטמיע גישה חינוכית-ערכית של פרסונליזציה בהערכה. על-פי גישה זו יש להתאים את אופני ההערכה באופן אישי לכל תלמיד/ה על פי צרכיו/ה הייחודיים, כפי שאלה עולים מתוצאותיו של תהליך אבחון, הערכה ומדידה מתמשך.
-
להטמיע את התפיסה של למידה לאורך החיים (Lifelong Learning) כתפיסה הרואה את הלמידה כתהליך מתפתח לאורך כל שנות החיים, במסגרתו נרכשים ידע, מיומנויות חדשות, וכלים לפיתוח אישי ומקצועי. למידה זו נשענת על פיתוח יכולות שונות, הנחוצות כיום לצורך התמודדות עם מציאות מורכבת ומשתנה ללא הרף, וביניהן יכולת הערכה.
מה לומדים בתוכנית?
כלל הקורסים בתוכנית מבקשים לתת מענה לשלושת גופי ידע הנדרשים לאיש הערכה: ידע תיאורטי וערכי, ידע מתודולוגי ופסיכומטרי וידע מעשי.
1. ידע תיאורטי וערכי
הקניית ידע רחב הכולל את ההיסטוריה של ההערכה, שפת ההערכה, מודלים וגישות של הערכה, וסוגים שונים של הערכה המשרתים מטרות שונות (למשל: הערכה מסורתית לעומת חלופית; הערכה פנימית לעומת חיצונית; הערכת לומדים לעומת הערכת בית הספר כמכלול, הערכת תוכניות, פרויקטים ומיזמים), אתגרים בהערכה, סוגיות אתיות, רקע פילוסופי וחברתי של התחום.
2. ידע מתודולוגי ופסיכומטרי
היכרות עם גישות שונות ושיטות שונות, בסיסיות ומתקדמות, לעיבוד נתונים (כמותיים, איכותניים ומעורבים); פיתוח כלי מדידה והערכה כמו מבחנים ושאלונים, הכולל פיתוח מפרט מבחן, כתיבת פריטים ומטלות, שיפור הכלים על ידי בדיקות תוקף ומהימנות, ניתוח פריטים, ניתוח גורמים, ציינון, סילום ועוד; ידע בניתוח ועיבוד נתונים בעזרת תוכנות סטטיסטיות, פירוש התוצאות והצגתם. במסגרת הקורסים המתודולוגיים מודגשת חשיבות התאמתם של הכלים לקבוצות תרבות שונות (התאמה תרבותית) ולאנשים עם מוגבלויות (התאמה של תוכן ותנאי הבחינה).
3. ידע מעשי
טכנולוגי: הלמידה בתוכנית משלבת מדיה דיגיטלית וכלים טכנולוגיים ומראה כיצד ניתן לעשות בהם שימוש מושכל גם לצורכי הערכה.
מתודולוגי: הסטודנטים בתוכנית לומדים להגדיר צרכים, לקבוע מטרות, לנסח שאלות הערכה, לפתח כלי הערכה כמו שאלונים, משימות חקר, תלקיט, ומבחני הישגים, לבנות מחוונים ועוד.
אישי-חברתי-רגשי: ההיבטים החברתיים-רגשיים בתוכנית באים לידי ביטוי בדרכים הבאות:
-
כמושא להערכה: כתיבת עבודות גמר ותזה הממוקדות בהערכה של היבטים שונים של למידה רגשית חברתית (Social Emotional Learning, SEL) במערכת החינוך, בליווי מקצועי של המרכז לקידום למידה חברתית-רגשית (SEL.IL), אוניברסיטת רייכמן. בנוסף, קיימת שותפות עם SEL.IL בפרויקט ארצי של בניית מאגר כלי מחקר, המשמש את הסטודנטים בכתיבת עבודות הגמר/התזות שלהם.
-
כאמצעי להערכה: התייחסות לצדדים הרגשיים בתהליך ההערכה הנחוצים לשם יצירת יחסי אמון ופתיחות, וזאת באמצעות מספר קורסים העוסקים בתקשורת בין-אישית ותוך אישית.
מה מקבלים בוגרי התוכנית?
-
תעודת מוסמך בהערכה בחינוך (M.Ed)
-
תעודת רכז הערכה: במסגרת הלימודים בתוכנית הסטודנטים מקבלים הכשרה לתפקיד רכז הערכה בית ספרי, המוכרת על ידי הרשות הארצית למדידה והערכה בחינוך (ראמ"ה). תפקיד זה מקנה גמול תפקיד בסך 6% מן השכר המשולב.
-
תעודת "ניהול פרויקטים והערכתם": החל מתשפ"ב נפתחו בתוכנית לימודי מגמה ב"ניהול פרויקטים והערכתם" בשיתוף עם מינהל החינוך בחולון. מהלך זה נועד ליצור התאמה מרבית בין התכנים האקדמיים הנלמדים במסגרת לימודי התואר לבין ההקשר האישי, הבית ספרי והעירוני איתם באים הסטודנטים. במסגרת הלימודים הסטודנטים מפתחים ומעריכים יוזמה רלבנטית ומשמעותית עבורם, במטרה למנף אותה ולהוביל אותה במוסד בו הם עובדים ומחוצה לו.
-
אפשרות ללמוד במסלול עם תזה: הלימודים בתוכנית כוללים מסלול עם תזה המיועד לסטודנטים מצטיינים. הלימודים במסלול זה מקנים ידע תיאורטי ומיומנויות מקצועיות לצד פיתוח אקדמי ומחקרי. בוגרי מסלול זה יוכלו להמשיך ללימודי דוקטורט ולהשתלב במשרות מחקר והוראה במוסדות אקדמיים.
סגל התוכנית מורכב מאנשי הערכה מובילים בתחום בארץ אשר רואים חשיבות לקידום הנושא במגוון מסגרות חינוכיות ופועלים באופנים שונים כדי להשפיע על שינוי מדיניות והטמעת הערכה באופן מיטבי במערכות החינוכיות בארץ.
כשבינה מלאכותית ופסיכומטריקה נפגשות בלמידה בכיתה
בינה מלאכותית בשירות המורה: משוב מעצב אוטומטי עבור תשובות לשאלות פתוחות בביולוגיה
מאת: טניה נזרצקי, ד״ר מוריה אריאלי, ד"ר גיורא אלכסנדרון, המחלקה להוראת המדעים, מכון ויצמן
פרטי קשר להתייחסות: tanya.nazaretsky@weizmann.ac.il
לעיתים נדמה שפרסונליזציה או התאמה אישית הפכה להיות ה-buzzword הנפוץ היום בתחום החינוך. אולם התאמה אישית היא הרבה יותר מבאז. בשנת 1984 פרסם הפסיכולוג החינוכי המפורסם בנג׳מין בלום (Benjamin Bloom) את מאמרו המכונן: "בעיית ה-2 סיגמא: חיפוש שיטות הוראה יעילות לקבוצות". בלום טען שהוראה פרטנית היא אפקטיבית עד כדי כך שהיא יכולה להעלות את ביצועי הכיתה בשתי סטיות תקן (מכאן השם ״2 סיגמא״), משמע, 98% מהלומדים בכיתה המקבלת הוראה פרטנית יתעלו על התלמיד הממוצע בכיתה הרגילה.
כמובן, הוראה פרטנית דורשת משאבי הוראה רבים ובלום במאמרו סוקר שיטות הוראה חילופיות המאפשרות לגשר על הפער בתוצאות התלמידים. בין השאר הוא מייחד מקום מרכזי לשיטת הוראה המדגישה מתן משוב מותאם-אישית. משוב כזה מאפשר לתלמידים להעריך את ביצועיהם ביחס לקריטריון הרצוי, לעדכן את הידע שלהם, ולשפר את תשובותיהם. אנו קוראים לסוג כזה של משוב ״משוב מעצב״. ואכן, מחקרים מודרניים בתחום החינוך וההוראה מדגימים את תרומתו של המשוב המעצב האישי לשיפור הישגיהם של הלומדים.
נשמע מבטיח, נכון?
עם זאת המציאות בבתי הספר שלנו – כיתות שסובלות מריבוי תלמידים – מקשה על המורים, וכתוצאה מכך תהליך הוראה מותאם-אישית המבוסס על מתן משוב מעצב קורה לעתים רחוקות בכיתות מדעים בתיכון (ובכלל).
גם המערכות המקוונות, הנפוצות בזמננו, בדרך כלל אינן נותנות מענה הולם. מערכות אלה מתמודדות בצורה טובה עם סוגי שאלות שבהן התלמיד מתבקש לבחור מבין מספר תשובות נתונות (שאלות רב-ברירה), אך אינן תומכות בהערכת תשובות לשאלות פתוחות. חוסר היכולת של המערכות המקוונות להתמודד עם שאלות פתוחות נובע מהמורכבות של המשימה: המערכת הממוחשבת צריכה לנתח טקסטים שנכתבו בשפה טבעית שבה תשובות נכונות עשויות להיות מנוסחות באופנים שונים למדי, לפעמים אפילו ללא מילה אחת משותפת. במקרה של שאלות פתוחות במדעים, המערכת צריכה להפריד בין איכות ה״צורה״ לאיכות ה״תוכן״ ולהעריך את איכות הטיעון מבחינה מדעית ולוגית תוך התעלמות (בדרך כלל) משגיאות כתיב ובעיות ניסוח. על כן, בדרך כלל, במערכות מקוונות קיימות, התשובות לשאלות פתוחות ממתינות לבדיקה של מורים אנושיים.
כדי לבחון דרכים לפתור בעיה זו, שאלנו את עצמינו את השאלה הבאה: האם בינה מלאכותית מסוגלת ללמוד ממומחים אנושיים להעריך תשובות לשאלות הפתוחות ולייצר משוב מעצב אוטומטי ומותאם-אישית לכל תלמיד?
בז'רגון המקצועי, התהליך של למידת מכונה ממומחים אנושיים נקרא Supervised Learning או למידה מפוקחת. בשיטה זו המכונה אמורה ללמוד ממספר של הדוגמאות אשר נבדקו קודם על ידי מומחים אנושיים בתהליך למידה שנקרא ״אימון״. בסופו של האימון מצפים שהמערכת תוכל לדמות את ההתנהגות האנושית ולהעריך תשובות חדשות, בדומה למומחים אנושיים.
במחקר שלנו, השתמשנו בשיטה של למידה מפוקחת הנקראת למידה עמוקה, המבוססת על רשתות נוירונים מלאכותיות. בשלב הראשון אספנו תשובות לשלוש שאלות פתוחות בביולוגיה מ-670 תלמידי מגמת ביולוגיה בתיכון מכל רחבי הארץ ומומחים אנושיים העריכו אותן ידנית בהתאם למחוון מפורט המתאר את כל המרכיבים המשמעותיים שחייבים להופיע בתשובה הנכונה. בשלב השני אימנו את רשתות הנוירונים בעזרת הציונים האנושיים והמערכת למדה לזהות האם כל מרכיב של המחוון מתואר באופן נכון בתשובת התלמיד או לא נמצא בה או מתואר באופן שגוי. חשוב לציין כי בהתבסס על המרכיבים החסרים אפשר לייצר משוב מעצב אוטומטי שיפרט לתלמיד מה נדרש בתשובתו כדי לשפר את תשובתו.
כדי לבדוק את איכות הציונים האוטומטיים פרי בדיקתה של המערכת, ביקשנו מ-30 תלמידים נוספים לענות על אותן שלוש השאלות הפתוחות. חמישה מורים לביולוגיה מבתי ספר תיכוניים שונים העריכו את התשובות באופן ידני לפי המחוון. במקביל, הפעלנו את המערכת אוטומטית עבור אותן התשובות.
כפי שאפשר לנחש, המורים האנושיים לא תמיד מסכימים אחד עם האחר ב-100% על הציונים שהם נותנים לאותן תשובות. למעשה, ההסכמה הממוצעת בין שני מורים אנושיים שונים, במקרה שלנו, עמדה על 85%. בשלב הבא, השווינו את ההסכמה הממוצעת בין חמשת המורים לבין התוצאות שהתקבלו מרשת הנוירונים. באופן מפתיע, התוצאה הייתה זהה - 85% הסכמה. כלומר, אלגוריתם הבינה המלאכותית למד לייצר ציונים הדומים מאוד לאלו של מורים אנושיים, אשר לא חרגו מהבדלים רגילים בין שני מורים אנושיים שונים.
לסיכום, השיטה והטכנולוגיה שפיתחנו יכולות לסייע לתלמידים לשפר את כישוריהם לטעון טענות מדעיות על ידי מתן משוב מעצב מהיר עבור תשובות לשאלות פתוחות. אב טיפוס של המערכת שולב בסביבת למידה דיגיטלית קיימת בשם PeTeL, שפותחה על ידי המחלקה להוראת המדעים במכון ויצמן למדע. השנה אנחנו ממשיכים את תהליך ההטמעה של המערכת בקרב המורים.
מאחר ו-PeTeL כבר נמצאת בשימוש של מאות מורים למדעים בישראל, הרי שיש פה הזדמנות משמעותית לשפר את תהליך הלמידה במאות כיתות, דבר, שבתקווה, יוביל לשיפור ביכולתם של התלמידים לטעון טענות מדעיות.
על זהות מקצועית ופסיכומטריקה
מיהם העוסקים בפסיכומטריקה בישראל?
עדכון על מסמך האפיון מטעם האגודה הישראלית לפסיכומטריקה
מאת: ד"ר צור קרליץ, המרכז הארצי לבחינות ולהערכה
פרטי קשר להתייחסות: tzur@nite.org.il
בשלוש השנים האחרונות עוסקת ועדה מטעם מועצת אפי בפיתוח מסמך הגדרות לעיסוקים השונים בתחום הפסיכומטריקה בישראל. הוועדה כוללת את ד"ר ריטה סבר, ד"ר רוני ברצלבסקי, נועה גזית וד"ר צור קרליץ. יוזמה זו היא תולדה של שולחנות עגולים שנערכו בכנסים קודמים של אפי בהן התעוררה סוגייה הנוגעת לאופן בו מוגדרת הזהות העוסקים בפסיכומטריקה בישראל.
בהעדר הסמכה רשמית או מבחן רישוי הנדרש על מנת לעסוק בתחום ובהיעדר הגדרה ברורה של התחום והעיסוקים הקשורים אליו, קיימת עמימות הפוגעת בזהות המקצועית של העוסקים בתחום. בדיונים במסגרת השולחנות העגולים עלתה התחושה שהעמימות סביב הזהות המקצועית של פסיכומטריקאים משליכה גם על הזהות של אפי כארגון המאגד את אנשי המקצוע בתחום.
בעקבות זאת הוקמה הוועדה שמטרתה הייתה לפתח מסמך ובו יגובשו הגדרות מוסכמות לעיסוקים השונים בתחום הפסיכומטריקה. עבודת הוועדה החלה בסקירת ספרות ובניסוח קווים כלליים להגדרות העיסוקים. באוקטובר 2020 הועבר סקר בנושא לתפוצת חברי אפי בעבר ובהווה. מטרת הסקר הייתה למפות את תחומי העיסוק של חברי האגודה, את ההכשרות שעברו, את מקומות העבודה שלהם ואת הגדרות התפקיד הרשמיות שלהם.
מהסקר עלה, בין השאר, שכ-40% מחברי האגודה אינם מגדירים עצמם כפסיכומטריקאים. עם זאת, כאשר התבקשו לפרט על עיסוקיהם, חלק ניכר ציינו שהם עוסקים בפסיכומטריקה כחלק מהעיסוק המרכזי שלהם (לרוב מחקר). מידע מפורט על תוצאות הסקר הוצג בכנס אפי 2021 (ראו מצגת כאן).
בספטמבר 2022 הוועדה סיימה להכין טיוטה ראשונה של מסמך ההגדרות ושלחה אותו לקבלת משוב מחברי האגודה בעבר ובהווה. מרבית המגיבים שיבחו את המסמך, וחלקם העלו נקודות לשיפור והצעות לשינוי. בעקבות המשוב, הוועדה הגיעה למספר תובנות שישתקפו במסמך המעודכן.
כאמור, מטרת הוועדה היא ליצור מסמך שיעזור בחיזוק הזהות המקצועית של האגודה וחבריה. אחת התובנות שעלו מהמשוב היא שהניסיון לתת הגדרה למקצוע הפסיכומטריקאי לא בהכרח יעזור בחיזוק הזהות המקצועית ועשוי אפילו לפגוע בה. אנו סבורים שעלינו להימנע מלהגדיר את הזהות המקצועית של "פסיכומטריקאים", מכיוון שהגדרה כזו תהיה צרה מלהכיל את מגוון העיסוקים בתחום.
יתרה מכך, כפי שעלה מהסקר, בתחום הפסיכומטריקה עוסקים לא רק מי שמגדירים עצמם כפסיכומטריקאים, אלא רבים אחרים, אשר הזהות המקצועית שלהם היא אחרת, אך במסגרת תפקידם הם זקוקים לידע ולכישורים פסיכומטריים הנדרשים מכל העוסקים בתחום. אם המטרה שלנו היא לחזק את הזהות המקצועית של חברי האגודה, עלינו למפות את מרחב העיסוקים בתחום הפסיכומטריקה ולהימנע מהגדרת המקצוע "פסיכומטריקאי".
על כן הוחלט לנקוט גישה אחרת. במסמך המעודכן התחלנו מהגדרת עבודה של תחום הפסיכומטריקה. הגדרת העבודה היא רחבה ועל כן מאפשרת לאפיין את המשותף לכל העוסקים בתחום, או במילים אחרות, למצוא את הקו המקשר בין חברי האגודה. הגדרת העבודה שנבחרה היא: פסיכומטריקה היא תחום העוסק בהיבטים תאורטיים ופרקטיים של מדידה והערכה במדעי החברה.
תחת ההגדרה הזאת סווגו העוסקים בתחום לחמישה סוגים של עיסוקים:
-
מחקר – תכנון, ביצוע ופרסום של מחקרים תיאורטיים ויישומיים בנושאי מדידה והערכה
-
פיתוח כלים – תכנון, פיתוח ושיפור של כלי מדידה מסוגים שונים (כולל פיתוח כלים דיגיטליים והתאמת כלים)
-
ניתוח נתונים – תכנון, עיבוד וניתוח של תוצרי מדידה והערכה
-
שימוש בכלים – אבחון או הערכה המתבססת על כלי מדידה לצרכים יישומים או מחקריים
-
ניהול מערכות מדידה – תכנון, ארגון ותפעול שוטף של מערכות בחינה והערכה
המסמך המעודכן כולל תיאור מפורט של מאפייני העיסוקים השונים ושל הידע והכישורים הנדרשים בכל עיסוק. בכנס אפי הקרוב נקיים שולחן עגול נוסף ובו נדון בסוגיות שעלו במהלך העבודה על המסמך, ובשימוש הצפוי במסמך זה בעתיד. לאחר הכנס, נשלח את המסמך המעודכן לעיון חברי האגודה.
פינת היו"רית
שלום רב לכל חברות וחברי אפי!
ברצוני לשתף אתכם בכמה התפתחויות שהיו באפי מאז קבלתם את הגיליון הקודם (מס' 6) של המידעונט.
הבחירות באפי
על פי התקנון של אפי חייבת האגודה לקיים בחירות למועצה ולוועדת הביקורת שלה כל שלוש שנים.
לאחר הכנס הקרוב תסתיים כהונתם של חברי המועצה הנוכחית של אפי ושל אחת משני חברי ועדת הביקורת. לפיכך ערכנו לאחרונה בחירות למועצה ולוועדת הביקורת, ותודה לאבי אללוף שהוביל את מהלכי הבחירות לסיומם המוצלח אשר הניב את התוצאות הבאות:
אלה שמות הנבחרים והנבחרות, אשר ייכנסו לתפקידם לאחר הכנס הקרוב, בכפוף לאישור תוצאות הבחירות על-ידי האסיפה הכללית.
למועצה:
-
חגית גליקמן – מנכ"לית ראמ"ה לשעבר
-
הלנה קימרון – מנהלת ההערכה במכון "אבני ראשה"
-
רון ברסלבסקי – מחברת איירון סורס
-
אלירן שתיוי – מהמרכז הארצי לבחינות והערכה (מאל"ו)
לוועדת הביקורת:
-
אנדריאה אברמסון – ממאל"ו
גזבר חדש לאגודה
לצד המועצה פועלים כיום באפי שלושה בעלי תפקידים: מזכירה, יועץ משפטי, וגזברית.
הגזברית הנוכחית – נועה גזית – תסיים אחרי הכנס הקרוב כהונה של 3 שנים, ובמקומה יתמנה אלירן שתיוי.
הכנס השנתי
ההכנות לכנס השנתי ה-19 של אפי, שיתקיים ב-14.2.23, בעיצומן; ותודה לספי פומפיאן ויובל בן דב שהתנדבו להוביל אותן.
הכנס הזה מתוכנן להתקיים במלון יערים שבמעלה החמישה, בו נוכל להיפגש פנים אל פנים כמו שנהגנו לעשות לפני פרוץ הקורונה.
התוכנית צפויה להיות עשירה ומגוונת: התקבלו לכנס הצעות מסוגים שונים (כגון עבודות מחקר, רעיונות בפיתוח ושולחן עגול), בנושאים מעניינים, שיוצגו ע"י מרצים מגופים וארגונים שונים – מהאקדמיה, ממאל"ו ומאחרים.
ההרשמה לכנס תיפתח בקרוב, וכולכם מוזמנים להירשם בעצמכם ולעודד אחרים להירשם.
החברות באפי
כפי שכתבתי לכם במידעונט הקודם, אני רואה חשיבות בהגדלת מספר חברי אפי ומעורבותם באגודה, וכן בהרחבת המודעות לידע הקיים והמצטבר בתחום הפסיכומטריקה בקרב אוכלוסיות רחבות של אנשי מקצוע, במיוחד במדעי החברה.
בעת כתיבת השורות האלה רשומים בקבוצת הפייסבוק של אפי 371 חברים וחברות, וחברים נוספים מבקשים להצטרף אליה באופן שוטף. רשימת חברי אפי (האגודה) קצרה בהרבה, ואפילו קצרה מכפי שהייתה בשנים קודמות, לפני פרוץ הקורונה.
לקראת הבחירות השנה גילינו שהיו אנשים שנשמטו – רובם בהיסח הדעת – מרשימת חברי אפי: הם לא נרשמו לכנס/ים האחרון/ים שהתקיים/ו בתקופת הקורונה ולא שמו לב שחברותם באפי איננה נשמרת אם לא יבחרו לשלם את דמי החבר השנתיים.
לתשומת לבכם ולבכן:
-
אפשר לשמר את החברות באגודה בפנייה ישירה לאפי, או באמצעות הסעיף הייעודי שקיים בטופס ההרשמה לכנס ומאפשר תשלום דמי חבר בלי להירשם לכנס עצמו.
-
בצד האפשרות להיות חבר/ה מן המניין באפי, קיימת גם האפשרות (למשל, לסטודנט/ית שטרם סיימו את התואר הראשון) להשתייך אליה כעמית/ה. גם אלה וגם אלה חייבים לשלם דמי חבר כל שנה, ונכללים ברשימת חברי אפי ( במעמד "עמית") – אבל הזכות להצביע, לבחור ולהיבחר למוסדות אפי נתונה רק לחברים/ות מן המניין. יתרה מכך, להגשת מועמדות למועצת אפי נדרש ותק חברות באגודה של לפחות שלוש מתוך חמש השנים האחרונות (לועדת הביקורת נדרש רק להיות חבר/ה מן המניין).
ולסיום,
זהו הגיליון השביעי של המידעונט המקוון של אפי, והוא הגיליון השני בעריכתה המוצלחת-מאד של עינת נוטע-קורן.
אני מקווה שאתם כבר מודעים לקיומו של המידעונט כבמה לחילופי מידע, ידע ודעות בין כל המתעניינים והעוסקים במדידה ובהערכה במדעי החברה.
אתם מוזמנים מאד לבקר באתר אפי (שבו מופיעים כל הגיליונות הקודמים), לתרום כתבה למידעונט ולהצטרף ולהיות פעילים הן באגודה והן בקבוצת הפייסבוק שלנו.
בברכה חמה,
ריטה סבר
יו"ר אפי, האגודה הישראלית לפסיכומטריקה
ritasever9@gmail.com
מדידת תכונות, כישורים ומיומנויות מורכבים
איך מודדים חשיבה יצירתית במחקר פיזה?
מאת: ד"ר נעה שחורי איל, מרכזת בכירה בתחום מחקרים בינלאומיים, ראמ"ה
פרטי קשר להתייחסות: noash@education.gov.il
כמה מילים על מחקר פיזה
מחקר פיזה (PISA - The Programme for International Student Assessment) הוא מחקר בין-לאומי רחב היקף שנערך מאז שנת 2000 ע"י ארגון ה-OECD. מחקר פיזה נועד לאפשר לכל מדינה לבדוק את התפוקות במערכת החינוך שלה ולהעריך את הישגי התלמידים מנקודת מבט בין-לאומית משותפת ומוסכמת. המחקר נערך במחזוריות של אחת לשלוש שנים ומשתתפים בו תלמידים בני 15 (ברוב המדינות תלמידים אלו לומדים בכיתות ט-י). פיזה הוא המחקר הבין-לאומי המקיף ביותר בתחום החינוך מבחינת מספר המדינות המשתתפות והיקף התחומים הנמדדים בו, והוא נחשב חדשני ומוביל בתחום מחקרי החינוך.
במחקר נבדקים שלושה תחומי אוריינות: מדעים, קריאה ומתמטיקה, ובכל מחזור מחקר מושם דגש על אחד מהם. נוסף על שלושה תחומים עיקריים אלו נבדקים בכל מחזור גם "תחומי אורֵח" שונים כגון מיומנויות גלובליות, פתרון בעיות, אוריינות פיננסית ועוד. במחזור המחקר האחרון (PISA 2022) היה התחום האורח חשיבה יצירתית.
הרציונל מאחורי הערכת חשיבה יצירתית במסגרת פיזה
חשיבה יצירתית היא מיומנות שמעוגנת בידע ופרקטיקה אשר מאפשרת לאנשים תוצאות טובות ויעילות יותר, גם אל מול אתגרים ומגבלות. ארגונים וחברות ברחבי העולם מסתמכים יותר ויותר על חדשנות ויצירת ידע כדי להתמודד עם אתגרים עכשוויים, והדבר מדגיש את הצורך בחשיבה יצירתית כמנוע לקידום התרבות האנושית בתחומים מגוונים.
לכל אדם יש פוטנציאל לחשוב באופן יצירתי, וחשיבה יצירתית יכולה לשפר יכולות רבות אחרות. הערכת חשיבה יצירתית במסגרת פיזה עשויה לעודד שינויים חיוביים בפדגוגיה ובמדיניות חינוכית ולספק לקובעי מדיניות כלי הערכה מהימנים ותקפים לקבל החלטות מבוססות ידע.
הגדרת חשיבה יצירתית ומרכיביה
לצורך מדידתה בפיזה 2022, חשיבה יצירתית מוגדרת כיכולת לעסוק באופן פורה ויעיל בהעלאה, בהערכה ובשיפור של רעיונות שיכולים להביא לפתרונות מקוריים ויעילים, ליצירת ידע חדש ולביטויים של דמיון המשפיעים על העולם. המחקר התמקד בתהליכי חשיבה יצירתית שאפשר לצפות להם מתלמידים בני 15. מטרתו לתאר את המידה שבה תלמידים מסוגלים לחשוב בצורה יצירתית כאשר הם מחפשים רעיונות או מביעים אותם, ולבחון כיצד היכולת לחשיבה יצירתית קשורה לגישות לימודיות, פעילויות בית-ספריות ומאפיינים אחרים של מערכות חינוך שהוערכו בשאלוני ההקשר הנלווים שאותם מילאו התלמידים ומנהלי בתי הספר.
המחקר נבנה כך שיספק מידע בין-לאומי בר-השוואה ובעל השלכות ברורות על מדיניות חינוכית ופדגוגית, ולכן נבחרו תחומי תוכן שקרובים לנושאים שנלמדים במסגרת חינוך חובה. המשימות נבנו כך שידמו לפעילויות אמיתיות שבהן עוסקים תלמידים בכיתה ומחוצה לה.
תחומי התוכן הרחבים שנמדדו הם הבעה יצירתית ויצירת ידע ופתרון בעיות יצירתי. הבעה יצירתית כוללת משימות שבהן התלמידים התבקשו להביע את עולמם הפנימי ולהציגו לאחרים, והיא נחלקה לשני תתי-תחומים: הבעה בכתב והבעה חזותית. במשימות הבעה בכתב התלמידים התבקשו לכתוב בצורה חופשית שמבוססת על דמיון; ליצור רעיונות במגוון פורמטים כתובים תוך התייחסות לגירויים שונים, כמו קריקטורות בלי כיתוב או איורים; ולשפר בצורה יצירתית רעיונות קיימים שהוצגו במשימה.
במשימות הבעה חזותית התלמידים התבקשו ליצור עיצובים חזותיים באמצעות כלי עיצוב דיגיטלי; להפיק רעיונות שמבוססים על התרחיש והגריינים ביחידת המבחן ועל הכלים שעומדים לרשותם; ולהציע שיפורים מקוריים לצורות שונות של הבעה חזותית שהוצגו להם במשימה בהתאם להוראות.
בהשוואה להבעה יצירתית, תחום הידע של יצירת ידע ופתרון בעיות יצירתי מזמן שימוש פונקציונלי יותר בחשיבה יצירתית במטרה לחקור שאלות פתוחות או להציע פתרונות לבעיות (שאינן מחייבות פתרון יחיד). בתחום זה חשיבה יצירתית היא אמצעי להשגת מטרה, ופתרונות שמושגים באמצעותה הם מקוריים, חדשניים ויעילים.
גם תחום ידע זה נחלק לשני תתי-תחומים: פתרון בעיות חברתיות ופתרון בעיות מדעיות. בפתרון בעיות חברתיות התלמידים התבקשו להציע פתרונות לבעיות פתוחות שקשורות בסוגיות חברתיות ולשפר בצורה יצירתית פתרונות קיימים שהוצגו ביחידה לבעיות מסוג זה. פתרון בעיות מדעיות מצריך מהתלמידים לפתור בעיות פתוחות בהקשר מדעי; להפיק השערות או פתרונות לבעיות מדעיות בהתבסס על התרחיש שניתן ביחידה; ולהציע שיפורים מקוריים לניסויים או לפתרונות לבעיות מדעיות שמוצגים בגריין.
מודל הכשירות של חשיבה יצירתית
מודל הכשירות של חשיבה יצירתית במחקר פיזה 2022 מחלק את חשיבה יצירתית לשלושה היבטים:
-
העלאת רעיונות מגוונים – היכולת להעלות כמה רעיונות רלוונטיים שונים זה מזה.
-
העלאת רעיונות יצירתיים – היכולת להעלות רעיונות או לנקוט גישות שלא רבים היו חושבים עליהם.
-
הערכה ושיפור של רעיונות – היכולת להעריך רעיונות נתונים ולשפר או לפתח אותם בדרכים שלא רבים היו חושבים עליהן.

המיומנויות שנדרשות בכל אחד מההיבטים מושפעות במידה מסוימת מההקשר שבו נדרשת חשיבה יצירתית. לדוגמה, אף שכתיבת שיר והעלאת השערות מדעיות תקפות שאפשר לבדוק במעבדה יכולים שניהם להיחשב כהעלאת רעיונות יצירתיים, המיומנויות הקוגניטיביות, הידע והניסיון הנדרשים כדי לחשוב בצורה יצירתית בכל אחד מההקשרים הוא שונה במקצת.
צורת ההערכה של חשיבה יצירתית בפיזה 2022
יחידות חשיבה יצירתית אורגנו כך שכל תלמיד שהוקצה אקראית להיבחן בתחום ענה על שני מקבצי שאלות במשך שעה (בשעה האחרת של ההערכה, שאורכה שעתיים, נבחן התלמיד במתמטיקה, מדעים או קריאה). כל מקבץ נבנה כך שיכלול יחידות מבחן שמתמקדות בהיבטים שונים של חשיבה יצירתית (העלאת רעיונות יצירתיים, העלאת רעיונות מגוונים, הערכה ושיפור של רעיונות); בתחומי תוכן שונים (הבעה בכתב, הבעה חזותית, פתרון בעיות חברתיות ופתרון בעיות מדעיות); ובאורך היחידה (5-15 דקות שמערכת המבחן ממליצה לתלמיד להקדיש לפתרון השאלות ביחידה).
"חם מן התנור"
המלצות לקריאה של פרסומים חדשים
הערכת מיומנות חברתית-רגשית (מח"ר) של צוותי הוראה – פיתוח ותיקוף של שאלון מח"ר
Hemi, M., E., & Kasperski, R. (2023). Development and validation of ‘EduSEL’: Educators' Socio-Emotional Learning questionnaire. Personality and Individual Differences. 201, 111926.
https://doi.org/10.1016/j.paid.2022.111926
מאת: ד"ר מירב חמי וד"ר רונן קספרסקי, מרכז הסימולציות, מכללת שאנן והאקדמית גורדון
פרטי קשר להתייחסות: merav.hemi@gmail.com
על המאמר:
במהלך השנים האחרונות השירות הפסיכולוגי-ייעוצי מטמיע תהליכי למידה חברתית-רגשית (SEL) במערכת החינוך (שדמי, 2019). המונח SEL הוטבע על ידי קבוצת Fetzer, מייסדת ארגון CASEL (כלומר Collaborative for Academic, Social, and Emotional Learning), המגדיר SEL כתהליך שבו ילדים ומבוגרים רוכשים ומיישמים ידע, מיומנויות ועמדות על מנת לפתח זהות בריאה, לנהל תהליכים רגשיים, להשיג מטרות, ליצור קשרים תומכים, לקבל החלטות באופן אחראי ואכפתי (למידע נוסף בנושא).
מיומנויות אלו נתפסות כחיוניות לבריאותו הפסיכולוגית והפיזית של הפרט, אך מחקרים מצאו כי 7-25% מהאנשים חווים קשיים בתחומים אלו (Spitzberg, 2003). מכאן, חשיבותו הגדולה של העיסוק בהטמעת הלמידה החברתית-רגשית במערכת החינוך, היא לקדם את רווחתם הנפשית של תלמידים ומחנכים.
גוף משמעותי של ראיות תומך בחשיבות ה-SEL בחינוך. בסקירה של תוכניות לטיפוח SEL שנערכה לאחרונה דווח כי שיפור במיומנויות חברתיות-רגשיות (מח"ר) הוא גורם מכריע ברווחתם הנפשית של תלמידים ובהשגת תוצאות חיוביות בבית-הספר, בעבודה ובחיים (Clarke et al., 2021). תוכניות SEL המנוהלות על ידי מחנכים מניבות תוצאות חיוביות (Durlak et al., 2011), אך איכות התוצאות תלויה בעיקר במח"ר של המחנכים (Shelemy et al., 2020). עם זאת, רוב כלי הערכת המח"ר מתמקדים בתלמידים ולא בצוותי ההוראה.
בניסיון לגשר על הפער הזה, המחקר הנוכחי ביקש לפתח כלי רב-ממדי למדידת רמת המח"ר של עובדי הוראה, באמצעות סדרת מחקרים.
מחקר 1 כלל שתי קבוצות מיקוד בלתי-תלויות שהוו בסיס ראשוני להבניה של שאלון מח"ר. השאלון כולל 28 היגדים, אותם הנבדק מדרג לגבי מידת היישום שלו את ההתנהגות מ-1 (כמעט לעולם לא) ועד 6 (רמת מומחיות). ההיגדים מחולקים ל-3 אשכולות של מיומנויות: קוגניטיביות (לדוגמה: 'מבחין/ה בין הדברים שהאדם אומר לבין מה שהוא מרגיש'), רגשיות (לדוגמה: 'מרגיש/ה חמלה כלפי מי שמתמודד עם קושי') וחברתיות (לדוגמה: 'מדגיש/ה רצון לשיתוף פעולה גם בשיחה וגם אחריה').
מחקר 2 התמקד בתיקוף ראשוני של גרסת הפיילוט של שאלון מח"ר, בהתבסס על 154 מחנכים.
מחקר 3 קבע את המבנה הלטנטי של שאלון מח"ר בהתבסס על 331 מחנכים..
במחקר 4, שאפנו לבסס את תוקף הקריטריון של הכלי בשלושה מדגמים שונים של 97 מחנכים בסך-הכל.
ניתוח גורמים מאשש סיפק התאמה טובה של המודל לנתונים. מדדי המהימנות הפנימית והמהימנות החוזרת היו גבוהים. מתאמים פנימיים הצביעו על דמיון בין תת-הסולם החברתי והרגשי, בעוד שתת-הסולם הקוגניטיבי היה מובחן יותר. ערכי עקביות חיצוניים הצביעו על התאמה טובה בין המעריכים.
לסיכום, המאפיינים הפסיכומטריים של שאלון מח"ר נמצאו מקובלים, ומעידים על כלי מדידה אמין ותקף, שיכול לשמש בכדי להוביל תהליכי התערבות לטיפוח המח"ר של צוותי הוראה.
לפירוט נוסף על הכלי ועל פיתוחו, קראו במאמר המלא.
מקורות המידע שהוזכרו בכתבה:
שדמי, ח (2019). למידה חברתית-רגשית תפיסה ופרקטיקה בעבודת השירות הפסיכולוגי ייעוצי. ביטאון מופ"ת, גיליון 68.
Collaborative for Academic, Social, and Emotional Learning (CASEL). (2020). Core SEL Competencies.
https://casel.org/fundamentals-of-sel/what-is-the-casel-framework/
Clarke, A., Sorgenfrei, M., Mulcahy, J., Davie, P., Friedrich, C., & McBride, T. (2021). Adolescent mental health.
Retrieved on 17/3/2022 from: https://www.eif.org.uk/report/adolescent-mental-health-a-systematic-review-on-the-effectiveness-of-school-based-interventions
Durlak, J. A., Weissberg, R. P., Dymnicki, A. B., Taylor, R. D., & Schellinger, K. B. (2011). The impact of enhancing students’ social and emotional learning: A meta‐analysis of school‐based universal interventions. Child development, 82(1), 405-432.
https://doi.org/10.1111/j.1467-8624.2010.01564.x
Shelemy, L., Harvey, K., & Waite, P. (2020). Meta-analysis and systematic review of teacher-delivered mental health interventions for internalizing disorders in adolescents. Mental Health & Prevention, 19, 200182.
https://doi.org/10.1016/j.mhp.2020.200182
Spitzberg, B.H. (2013). Methods of Interpersonal Skill Assessment from: Handbook of Communication and Social Interaction Skills Routledge.
פינת האקטואליה
הדור הולך ופוחת?
ציוני ה-ACT צנחו לערך הנמוך ביותר מזה 30 שנה
מאת: ד"ר עינת נוטע-קורן
שלל כותרות מודאגות נפוצו בתקשורת בחודש אוקטובר האחרון בעקבות ידיעה שפורסמה ב -ACT שבה תוארה מגמה מטרידה. הציון הכולל הממוצע של נבחני ה- ACT צנח אל מתחת ל- 20 ועומד על 19.8. זהו הציון הנמוך ביותר מאז 1991.
מהו מבחן ה-ACT? זהו מבחן כניסה לאוניברסיטאות, המשמש חלופה אפשרית בארה"ב למבחן ה-SAT. המבחן מתבסס על תוכנית הלימודים הבית-ספרית והוא בודק את השליטה בארבעה תחומים: אנגלית, מתמטיקה, קריאה וחשיבה מדעית. הציון בכל תחום ובמבחן השלם נע בין 1 ל-36.
מה עוד נמסר באותה הודעה דרמטית?
רק 22% מהנבחנים השיגו ציון העולה על סף הקבלה המינימלי הנדרש לקבלה לקולג' בארבעת תחומי המבחן ו-42% לא עמדו בציון המינימלי אף לא בתחום אחד. כישלון זה מחייב, כך נאמר, להציב במיידי בראש סדר העדיפויות הלאומי תוכנית הבראה לתלמידי התיכון.
הכותרות בעיתונות לא איחרו לבוא. חלקן ייחסו את הירידה בציון לסגירת בתי הספר בתקופת הקורונה ואחרות היו ניטרליות יותר. לפנינו כמה מן הדוגמאות:
-
"ציוני ACT הם הנמוכים ביותר מזה 30 שנה בתקופת המגפה" (AP news);
-
"ציון ה-ACT צנח לשפל מזה 30 שנה כתוצאה מהלמידה מרחוק בתקופת הקורונה" (Forbes);
-
בכותרת משנה בוול סטריט ג'ורנל צוין כי ארגון המבחנים טען כי ההידרדרות נובעת מההפרעות הלמידה בתקופת המגפה ובעיות עקביות בחינוך (קישור לכתבה).
מאמר ביקורת שפורסם אף הוא בעיתון Forbes טען כי פרסום ה-ACT מונע מאינטרסים של הארגון ואינו משקף נאמנה את מכלול התופעה. במאמר הראו כי הרכב אוכלוסיית הנבחנים השתנתה עם השנים. עד 2016 היה גידול בשיעור בוגרי התיכון שנבחנו במבחן ומאז הלך המספר ודעך.
גורמים שונים השפיעו על דעיכה זו ובין היתר מעבר של מדינות למבחן ה-SAT כמו גם האפשרות שניתנה להתקבל להרבה מוסדות גם ללא מבחן כניסה (ראו כתבה בגיליון 6 במידעונט, בפינת הפודקסאט). ניתוח שמוצג במאמר מראה כי מספר הנבחנים במדינות החלשות ירד פחות מאשר מספר הנבחנים מהמדינות החזקות ולכן הממוצע הכולל יורד באופן טבעי. מוזמנים לקרוא ולהתרשם בקישור זה מהנתונים וממידע נוסף.
יתכן אפוא שרמת המוכנות של תלמידי התיכון ללימודים אקדמיים אמנם הולכת ויורדת, אולם התמונה מורכבת כנראה בהרבה.
ומה בארץ? התשובה היא לא. אין עדות לתופעה דומה. ראו בדוח הסטטיסטי של המרכז הארצי לבחינות והערכה, 2021 (תודה לצור קרליץ על ההפניה לדוח).
אז מה המסקנה כשקוראים ידיעות בתקשורת? את זה אשאיר לכם...