מידעונט אפי
גיליון 12
פינת העורכת
עם פתיחת השנה האזרחית החדשה, ומערכות הגשמים לסירוגין, מגיעה הבשורה על גיליון החורף של מידעונט אפי לשנת 2026.
אני בטוחה שכולכם כבר שריינתם את התאריך ה־3.2.26 לכנס אפי השנתי, אבל אם אתם לא יכולים להתאפק עד אז, ואתם לא יכולים, בגיליון הזה תקראו על מחקרים ומגמות בעולם הפסיכומטריקה מנבחרת מובחרת של חוקרים ואנשי אקדמיה.
שנת 2025 כבר מאחורינו, כך גם שנת 2022, אבל האם ידעתם מה עומד מאחורי המתווה של מבחני פיז"ה בשנים האלה? צוות מומחים מכל העולם, ובהם פרופ' עדו רול, הגדירו את הנושאים המיוחדים של מבחני פיז"ה: למידה בעידן דיגיטלי (2025) וחשיבה יצירתית (2022). פרופ' עדו רול ישתף אותנו בתהליך, באתגרים ובמבט לעתיד.
וממבחני פיז"ה בגיל 15 היישר לסטודנטים במוסדות האקדמיה – האם אפשר למנוע נשירה מלימודים אקדמיים בשנה א'? אם תשאלו את פרופ' איתמר גתי וד"ר מיכל פיליפס־ברנשטיין הם יגידו לכם שכן. על שאלון הערכת המוכנות ללימודים אקדמיים ועל תרומתו באיתור מוקדם של סטודנטים בסיכון לנשירה תוכלו לקרוא בכתבה שלהם.
ובמחוזות האקדמיה נפליג למחקרה של עינת בן־אליהו מאוניברסיטת בן־גוריון. במסגרת עבודת הדוקטורט שלה בחנה עינת הבנה מושגית של עקרונות יסוד בכימיה, בדגש על אופן הייצוג של פריטי הערכה (מילולי או חזותי) ותוך התייחסות לדירוגי בהירות הפריטים. חובבי הכימיה שבכם מוזמנים לבחון את עצמם – מה יותר בהיר: מלל או איור?
ואני אתן לכותרת של הכתבה הבאה לדבר בעד עצמה: "אינטליגנציה בעידן ה־AI – משבר מושגי בלב הפסיכומטריקה". ד"ר ג'ודי קוהאן כותבת לנו על המכונה, על המחוננות, על המדידה ועל מה שביניהן, בעידן שבו הבּינה היא כבר לא רק נחלת האדם.
ואיך אפשר בלי תגלית פורצת דרך מבית היוצר של הבינה המלאכותית? מדעני AI כבר "כותבים" מאמרים מדעיים לגמרי בעצמם, והתוצר משכנע דיו כדי להתקבל לכנס מדעי. ד"ר עינת נוטע־קורן כותבת לנו על המערכת החדשנית של החברה היפנית Sakana (סכנה?), על היתרונות ועל האתגרים.
ובפינת הריאיון שלנו יש לנו הכבוד לארח את הפסיכומטריקאית ד"ר טליה חימוביץ מהדקאנט לחדשנות בהוראה ובלמידה באוניברסיטת תל אביב. תמיד מעניין לראות איך הפסיכומטריקה נקרית בדרכם של אנשים, איך הם בעצמם מגדירים את התפקיד שלהם ומה הקסם שמשך אותם לעולם הזה. אל תפספסו!
אני מודה לכל מי שלקח או לקחה חלק במידעונט הזה, היה לי העונג להכיר אתכם ואת פועלכם, ואני מזמינה את קהל הקוראים שלנו לפנות אליי או אל עינת להשתתף במידעונט הבא. כתובת המייל שלי היא: galye@taldor.co.il.
בהערכה רבה,
גל ירמיהו
עורכת מידעונט אפי
מאמר שנכתב על ידי בינה מלאכותית עבר ביקורת עמיתים והתקבל לכנס מדעי
ד"ר עינת נוטע־קורן (להלן טקסט שנכתב על ידי בת אנוש)
לפני מספר חודשים התקבל מאמר שנוצר כולו על ידי בינה מלאכותית לסדנה בכנס חשוב בתחום של למידת מכונה ומחקר של בינה מלאכותית (ICLR 2025).
במה מדובר? חברת Sakana היא חברת בינה מלאכותית יפנית שעוסקת במחקר ובפתרונות AI שונים. אחד הפרויקטים שהיא פיתחה הוא מדען בינה מלאכותית (The AI Scientist) שמדמה תהליך עבודה של חוקר: מנסח השערה, מציע ניסויים כדי לבדוק אותה, כותב קוד לביצוע הניסויים, מריץ אותו, מתקן ככל שצריך, מנתח את הנתונים, מציג אותם בתרשימים ולבסוף כותב מאמר שלם: מהכותרת ועד לרשימת המקורות, כולל האיורים והעימוד. לא רק זאת, למערכת יש גם סוכן שמבצע "הערכת עמיתים" פנימית לפני ההגשה. הוא מאתר כשלים ומציע שינויים קונקרטיים לשיפור, כמו ניסוחים חלופיים, בדיקות נוספות וחידוד של הטענות המרכזיות. כל זה מתבצע לפני ההגשה החיצונית לכנס או לכתב עת. יש לציין שהמערכת הזו לא עושה ניסויים "על רטוב" אלא מבוססת על למידת מכונה, כך שהניסויים כולם נעשים במחשב.
מה התועלת של מערכת כזו למדע? בבלוג של החברה נאמר כך: "אנחנו מאמינים שהדורות הבאים של The AI Scientist יפתחו עידן חדש במדע. העובדה שהבינה המלאכותית מסוגלת לייצר מאמר מדעי שלם שעובר ביקורת עמיתים ומתקבל לסדנה מובילה בתחום למידת המכונה היא סימן מוקדם ומבטיח להתקדמות. אבל זו רק ההתחלה. בשלב כלשהו בעתיד, סביר שהבינה המלאכותית תוכל לייצר מאמרים ברמה אנושית ואף מעבר לה, כולל ברמה הגבוהה ביותר של פרסום מדעי. בסופו של דבר, אנחנו מאמינים שהשאלה החשובה ביותר אינה כיצד לשפוט מחקר מדעי שנעשה על ידי בינה מלאכותית לעומת מחקר מדעי שנעשה על ידי בני אדם, אלא אם התגליות שיתגלו יסייעו לשגשוג האנושי, למשל בריפוי מחלות או בהרחבת הידע שלנו על חוקי היסוד שמנהלים את היקום".
המודל הראשון של המערכת פורסם כבר לפני שנה, אולם המפתחים זיהו בו הרבה מגבלות. בגרסה זו עבדה המערכת לפי תבנית של קוד מובנה של התהליך המחקרי. בדיעבד, התברר שהדבר הגביל מאוד את יצירתיות המערכת ואת החדשנות של הרעיונות שהיא העלתה. בגרסה המשופרת הם ניסו לפתור את הבעיות על ידי הפיכת התהליך לכללי יותר. במקום להסתמך על תבנית קוד ספציפית וצרה, המערכת עברה להשתמש בהבניה דומה אבל כללית יותר שאפשרה למערכת חופש פעולה גדול יותר ופחות תלות בתוכן הספציפי שהוזן לה מראש (ראו הרצאה ביוטיוב מנובמבר האחרון של אחד ממדעני החברה).
לקראת כנס ICLR באפריל 2025 החברה ערכה ניסוי ושלחה לסדנה בכנס שלושה מאמרים שהם פרי עבודתה של המערכת (בגרסה המשופרת). הניסוי נערך בתיאום עם הנהלת הכנס ומארגני הסדנה. השופטים קיבלו מראש מידע ששלושה מאמרים מבין 43 המאמרים שעליהם לשפוט, נוצרו על ידי בינה מלאכותית (להנחיות הריוויו). מבין שלושת המאמרים, אחד עבר את סף הקבלה וקיבל ציון ממוצע 6.33 על ידי שלושה שופטים. בשלב זה נעצר הניסוי בהתאם להסכמות שנקבעו מראש. ייתכן שאם המאמר היה ממשיך במסלול של כל מאמר שמוגש, הוא היה נפסל על ידי מארגני הכנס.
זהו הישג מרשים שכן מדובר במקרה ראשון שבו מאמר שנוצר על ידי בינה מלאכותית הצליח לעבור את שלב הריוויו לכנס, לפחות ברמה של סדנה (ההקפדה בסדנה על המתודולוגיה המחקרית היא פחותה ושיעור הקבלה הוא סביב 70%. לכן מראש פנו לערוץ זה).
אומנם גם לגרסה המשופרת יש עדיין מגבלות כמו המצאה של פרטים ("הזיות"), טעויות בציטוטים, התייחסות לתוצאות שלא הוצגו במאמר ועוד. חלק מהמגבלות הללו נובע ממגבלות מודלי השפה (LLMs) שעליהם המערכת נשענת. ובכל זאת, זוהי הדגמה של היכולת ההולכת וגדלה של בינה מלאכותית לייצר חשיבה מורכבת ועמוקה. האם המערכת תוכל, בגרסאות עתידיות שלה, לייצר רעיונות חדשניים, שהם בגדר של שינוי פרדיגמה? שאלה זו נותרה עדיין פתוחה.
מה שכן, המערכת יעילה. על פי דיווח החברה, המערכת פועלת במהירות הגבוהה פי 3 עד 11 ממדען אנושי. היא מסוגלת ליצור מאמר מחקרי מלא בעלות של 6 עד 15 דולר בלבד, ובממוצע נדרשות רק 3.5 שעות עבודה של בן אדם. כלומר, עם מעט משאבים אפשר יהיה לייצר ידע חדשני רב בזמן קצר (ראו במאמר הטכני).
לצד התקווה וההתרגשות, יש לא מעט חששות ואתגרים שהמפתחים עצמם מעלים. The AI Scientist עלול לשמש גם למטרות לא אתיות או למחקר לא בטוח. למשל, אם יקבל גישה ל"מעבדות ענן" המבצעות ניסויי ביולוגיה בפועל, הוא עלול בלי כוונה ליצור וירוסים או רעלים מסוכנים. כך גם בתחום התוכנה, משימה לפיתוח כלי חדש עלולה להוביל ליצירת וירוסים ותוכנות זדוניות.
כמו כן, בגלל הקלוּת לייצר מחקרים יש לשער שתהיה הצפה של מאמרים, עומס גובר על כתבי העת והכנסים, חומרים באיכות לא טובה מספיק, שנראים תקינים אבל נשענים על ממצאים חלקיים או לא מאומתים, מניפולציות וחוסר שקיפות לגבי מי ביצע את העבודה (אדם או מכונה). בטווח הארוך הדבר עלול לפגוע באמינות הידע המדעי המצטבר. נוסף על כך, הסתמכות מוגברת על כלי בינה מלאכותית עלולה לצמצם חשיבה מדעית ביקורתית ולהגדיל את שיעור התוצרים החלשים או הלא מאומתים. חלק מהתופעות קיימות כבר היום, אך הן עלולות להחריף ככל שהכלים יהיו זמינים, זולים ומהירים יותר.
כמו במערכות של בינה מלאכותית בכלל, כך גם כאן – מצד אחד, Sakana מפתחת מערכת מחקר מתוך תקווה שהיא תוביל לפריצות דרך מדעיות ולפתרונות חדשניים לבעיות מורכבות, ומצד שני, היכולות של המערכת טומנות בחובן סכנות בלתי נמנעות שיהיה קשה מאוד להתגונן מפניהן (כמו הצפה של עולם המדע בהרבה "ג'אנק").
בתחום הפסיכומטריקה אפשר שנראה תמונה דומה. מצד אחד, הזדמנות לפיתוחים חדשניים של מודלים פסיכומטריים מורכבים, ייצור מאגרי פריטים בקנה מידה גדול, כולל יצירת סימולציות ותהליכי שיפור בעקבות זאת. ובאותה הנשימה, צפויה הצפה, אפילו גדולה מהיום, של תוצרים וכלים שנראים מקצועיים אך בפועל אינם עומדים בסטנדרט פסיכומטרי מספק. כיוון שקל ומהיר לייצר גרסאות רבות, עלולים להופיע מוצרים באריזה מדעית שמסתירים שגיאות מתודולוגיות, הנחות לא בדוקות, נתונים בעייתיים או תוקף חלש. התופעה קיימת גם היום, אבל היא עלולה להתרחב להיקפים גדולים יותר.
הדיון סביב ה־The AI Scientist של Sakana, כמו דיונים רבים בנושאים של בינה מלאכותית, מחזק את ההבנה שהמומחיות של החוקרים תצטרך לעלות. ככל שכלים כאלה יפיקו יותר ניסויים, יותר תוצאות, והכול במהירות, כך יגדל הצורך בחוקרים שיודעים לשאול את השאלות הנכונות, לבנות מתודולוגיה תקפה, לבקר תוצרים ולשפוט מה בעל ערך אמיתי ומה רק נראה מדעי.
הנושאים המיוחדים של פיז״ה: למדוד למידה בעידן דיגיטלי
פרופ' עדו רול, הטכניון
למבחני פיז״ה (PISA) של ה־OECD חשיבות רבה במספר תחומים. מבחינה פוליטית, הם כלי רב עוצמה לשינוי או לשימור של מערכות חינוכיות. מבחינה ציבורית, הם משמשים מנוע שמעודד השקעה ותשומת לב. מבחינת מערכות חינוך, הם מהווים נייר לקמוס שבודק את ביצועי התלמידים, כמו גם תמריץ להגדרת תחומי הדעת הרלוונטיים. נוסף על כך, עבור אנשי הערכה, המבחנים מהווים מעבדה עולמית של מדידה, שבה נבחנים עקרונות יסוד של הערכה, גישות שונות למדידה והגדרה מושגית.
לשמחתי הייתי חלק מצוות המומחים שהגדיר את הנושאים המיוחדים במתווה של מבחני פיז״ה בשנת 2022 (חשיבה יצירתית, Creative Thinking) ובשנת 2025 (למידה בעידן הדיגיטלי, Learning in the digital age). נוסף על כך, אני חלק מצוות החדשנות והמחקר של ה־OECD בנושא פיז״ה (Research and Innovation Group). בטור זה אשתף מעט מתהליך הפיתוח של מבחנים אלו, בדגש על הנושאים המיוחדים, ובהסתמך על הניסיון שלי בשני הסבבים האלה.
פיז״ה 2025 – למידה בעידן הדיגיטלי
במובנים רבים, זהו אחד התחומים המאתגרים ביותר שנמדדו עד כה: המטרה שלנו היא לא להעריך ידע אלא להעריך למידה. כיצד ניתן למדוד יכולת למידה? התשובה שלנו הייתה לתת לנבחנים מטלות הדורשות למידה במהלך הבחינה עצמה. כמו תמיד, האתגר התחיל בשלב המסגרת התאורטית: כיצד אנחנו מגדירים למידה בעידן הדיגיטלי?
המסגרת התאורטית: פירוק אוריינות לרכיבים
העבודה על כל מחזור של פיז״ה מתחילה שנים מראש, עם גיבוש המסגרת התאורטית (framework) – מסמך המגדיר בדיוק מה ואיך מודדים. על המסגרת הזו עובדים צוותי מומחים מצומצמים (5–8 חברים), המגיעים מתחומי הפסיכומטריקה, מדעי הלמידה וטכנולוגיות למידה, תוך הקפדה על איזון מגדרי וגיוון גאוגרפי. החשיבות והיסודיות של מסמך המסגרת התאורטית הפתיעו אותי לטובה. גם אם אני שותף לחלק מהביקורת על המבחנים עצמם, אני מאוד מעריך את מסמכי הגדרת הידע של פיז״ה, בעיקר אלו שעליהם לא אני עבדתי (שפה, מתמטיקה, אנגלית). הדגש בכל המסמכים האלה הוא על אוריינות, כלומר פחות על הידע עצמו או על שאלות סינתטיות ויותר על היכולת להשתמש בידע כדי לקבל החלטות ולפתור בעיות מורכבות ואותנטיות. אנו רואים שהגדרות אלו של אוריינות משפיעות על המחקר ועל המעשה החינוכי בעולם.
במקרה של פיז״ה 2025, המסגרת ביקשה להגדיר מחדש מהי למידה בעידן הדיגיטלי. בחרנו להתמקד בתחום של חשיבה מדעית, שכן זוהי בחינה חדשנית, ולכן היה לנו חשוב להתמקד בתחום מוכר יחסית ו״פתור״. הגדרנו שורה של כישורים משמעותיים בדגש על מכוונוּת עצמית בלמידה. בעצם הבחינה שולחת מסר משמעותי: יכולת למידה היא יכולת פתרון בעיות ופיתוח ידע באופן איטרטיבי תוך שימוש בכלים. הגדרה זו קדמה לעידן הבינה המלאכותית היוצרת, ולשמחתי נותרה רלוונטית כשהייתה. תהליך למידה משמעותי הוא תהליך הנעזר בכלים. עוד על המסגרת התאורטית ניתן לקרוא במסמך הרלוונטי [1].
לצורך המבחנים עצמם פיתחנו 9 יחידות, כאשר כל נבחן מקבל 2 מתוכן. כל היחידות מדגישות שימוש בכלים כגון עזרה, התייעצות עם מומחים, הזדמנות למשוב וכן הלאה. עוד על סוגי הכלים, והאופן שבו הם משמשים להערכה, ניתן לקרוא בפרק שפרסמנו בנושא [2]. דוגמות ליחידות אלו נמצאות באתר הבחינה.
אחת ההתפתחויות המשמעותיות בפיז״ה 2025 היא השימוש המורחב באנליטיקות למידה (learning analytics). כיוון שהמבחנים ממוחשבים, ניתן לאסוף נתוני תהליך (process data). איסוף נתונים אלה אִפשר לנו שינוי מהותי בבחינה עצמה: אנחנו לא בודקים כמה אנשים לומדים, אלא איך אנשים לומדים. התהליך כולל זיהוי רצפים רלוונטיים ושיוך דפוסי התנהגות לקבוצות רלוונטיות. יתרון נוסף של הגישה הזו הוא הימנעות משיפוטיות. יש הרבה דרכים ללמוד – השימוש באנליטיקות למידה מעביר אותנו ממדידה מעריכה למדידה תיאורית (from evaluative to descriptive). עדיין נדווח על מטריקות מסורתיות, אבל נוסיף את ממד תיאור הלמידה. מבחינה מחקרית, השימוש באנליטיקות למידה מאפשר לנו להבין לא רק מי הצליח, אלא איך – מהן האסטרטגיות שהובילו להצלחה, מה מאפיין לומדים יעילים, ואיך נראית התנהגות חקרנית לעומת התנהגות אינטואיטיבית. עם זאת, זהו גם אתגר מתודולוגי: איך מפרשים נתוני תהליך באופן תקף ומהימן? מתי זמן תגובה ארוך מעיד על חשיבה מעמיקה, ומתי על בלבול? אלו שאלות שעדיין נבחנות אמפירית, והן מרחיבות את גבולות עולם המדידה המסורתי.
אחד האתגרים המשמעותיים, לדוגמה, הוא להצליח להעריך למידה מעבר למטלה ספציפית. האם התנהגות של אדם במטלה א׳ דומה להתנהגות של אותו אדם במטלה ב׳, עם אפשורים (affordances) שונים? חובה לשמור על עקביות, שכן אחרת אנחנו מעריכים הקשר ולא יכולת. תוצאות ראשוניות שהצגנו השנה ב־AI in Education מראות על כיוון חיובי [3].
אתגר משמעותי אחר שהתמודדנו איתו הוא ידע תחומי. גם בעולם רווי מידע, למידה אינה מתרחשת בוואקום. כדי להבין ולפרש מידע דיגיטלי נדרש בסיס ידע תחומי. בוודאי שהדבר נכון עבור מכוונוּת עצמית בלמידה ושימוש במקורות דיגיטליים – האופן שבו אני משתמש במקורות תלוי בידע שלי באותו תחום. לכן, אף שפיז״ה מדגיש "אוריינות" ולא "ידע", היה לנו אתגר גדול בהתמודדות עם ידע מוקדם שונה של תלמידים. בחלק מהמקרים בחרנו להמציא עולמות, בחלק הסתמכנו על ידע שיחסית נפוץ אצל רוב התרבויות, ובכל מקרה מדדנו את הידע בראשית כל יחידה.
פיז״ה 2022 – חשיבה יצירתית
פיז״ה, אולי יותר מכל הערכה אחרת, מתנהל בזירה פוליטית לא פחות ממדידה. מאחר שהמבחן משפיע על תדמית מערכות חינוך של מדינות שלמות, כמעט כל הגדרה הופכת למושא לדיון. כך למשל, בעבודה על מסגרת חשיבה יצירתית למחזור 2022, אחת המדינות המשתתפות טענה שהמבחן שלנו אינו מודד "יצירתיות", אלא "אלתור" – משום שבתרבות שלה יצירתיות נתפסת כמתוכננת, תהליך מובנה ולא ספונטני. הדוגמה הזו ממחישה עד כמה קשה לנסח מסגרת מושגית אוניברסלית. כל מונח טעון תרבותית, וכל פריט עלול לשאת משמעויות שונות בהקשרים שונים. היבט זה מחריף כאשר בוחנים משימות שמתייחסות לעולם האמיתי. בבחינה זו, לדוגמה, נכתב פריט שהתייחס להתחממות הים. אלא שבמדינות שאין להן גישה לים, הנושא היה מופשט מדי. באזורים אחרים, דוגמות על בקבוקים חד־פעמיים לא היו רלוונטיות משום שמערכות המחזור אינן קיימות כלל. גם עולם הדימויים התרבותיים – הוויזואליים והמילוליים – עלול להוביל להבדלי משמעות. למשל, ראינו הבדלים גדולים מאוד בעולם הדימויים בין בתי ספר דתיים לאלו ללא שיוך דתי במדינות שונות. סמל גרפי, צבע או מונח שפה יכולים לעורר אסוציאציות שונות בתכלית.
איך בכל זאת מוודאים שהבחינות הוגנות? אין פתרון אחד, אבל יש כמה מנגנונים שעוזרים: ייעוץ מתמשך עם מומחים מקומיים במדינות המשתתפות; משוב מנציגי המדינות בשלבי הפיתוח והפיילוט; ובדיקה סטטיסטית של התנהגות הפריטים כדי לוודא שאין דפוסים לא מוסברים בין מדינות.
בחינות החשיבה היצירתית הדגימו עבורי את הפער בין מסמך המסגרת התאורטית ובין הבחינה עצמה. בעוד שלדעתי המסמך מספק הגדרה מצוינת של התהליך היצירתי, המבחן עצמו בסיסי הרבה יותר ומפשט את התהליך יתר על המידה. הסיבה ברורה – תשומת הלב הגדולה שהמבחנים מקבלים מקשה על חדשנות. לדוגמה, היה לנו קשה לעודד בחינה שאפשר לבצע רק בצורה מקוונת, שכן היו עדיין מדינות שנבחנו בנייר. אני מודה מאוד למאל״ו על מענק מחקר שאִפשר לנו לנסות לבחון דרכים נוספות למדוד חשיבה יצירתית. עבודה זו, בשיתוף פעולה עם ד״ר צור קרליץ, אפשרה לנו ליישם עקרונות של הערכה דינמית עם מקורות גם בתחום החשיבה היצירתית [4].
מבט קדימה
פיז״ה 2022 ו־2025 הם לדעתי ציוני דרך בהתפתחות החשיבה על מדידה חינוכית. מהערכה של תוצרים, דרך ניתוח של יכולות ועד ניסיון להבין תהליכי למידה בזמן אמת – מדובר במעבר ממדידת "ידע" למדידת "למידה". בעידן שבו הבינה המלאכותית יכולה לספק תשובות נכונות כמעט לכל שאלה, השאלה החשובה באמת היא לא מה תלמידים יודעים – אלא איך הם לומדים, איך הם מעריכים מידע ואיך הם בונים הבנה משמעותית בעולם רווי נתונים.
המעבר למדידה של אוריינות עם מטלות מורכבות, לרוב מבוססות תרחיש או סיפור, מדגיש מספר דילמות שהיו קיימות עוד קודם. למשל, כיצד מתגברים על התלות הגדולה בקריאה, שנצפית בכל מחזור פיז״ה? כיצד ניתן ליישם מדידה אדפטיבית, ובהיעדרה, כיצד ניתן למדוד ביעילות קשת גדולה של יכולות? כיצד ניתן להתאים את הקריטריונים הנדרשים להערכה איכותית וסוגים שונים של תוקף לשימוש עם אנליטיקות למידה? כיצד אפשר לייצר בחינה שיכולה להראות פערים בין אנשים ועדיין שתהיה הוגנת כלפי אוכלוסיות? כיצד ניתן להשתמש במבחני פיז״ה כדי לסגור את המעגל ולתת מידע רלוונטי למורים וקובעי מדיניות? ובעיקר, מהו ידע ומהי למידה? חלק משאלות אלה נידון בספר שהוצאנו במסגרת העבודה בצוות המחקר והחדשנות של פיז״ה [5]. פיז״ה, בכל מחזור מחדש, מזכיר לי שהאתגר האמיתי של מדידה חינוכית איננו למצוא ציון מדויק, אלא לתפוס את המורכבות של החשיבה האנושית – גם כשהיא מתרחשת על מסך דיגיטלי.
על הכותב
פרופ' עדו רול – חבר סגל בפקולטה לחינוך למדע וטכנולוגיה ובפקולטה למדעי הנתונים וההחלטות בטכניון. פרופ' רול משתמש בנתונים תהליכיים מסביבות למידה דיגיטליות כדי להבין, להעריך ולתמוך בתהליכי למידה מורכבים וחשיבה מסדר גבוה. לדוגמה, הוא חוקר מוכוונוּת עצמית בלמידה, חשיבה מדעית, למידה של כלים, אוריינות בינה מלאכותית וחשיבה יצירתית. מחקרו נשען על שיטות ותאוריות מתחומי החינוך, אנליטיקות למידה, מדעי הקוגניציה, בינה מלאכותית ואינטראקציית אדם–מחשב. הוא חיבר למעלה מ־100 פרסומים שצוטטו מעל 10,000 פעמים. בעבר עמד בראש הכנסים הבינלאומיים לבינה מלאכותית בחינוך (2020) וללמידה בקנה מידה רחב (Learning at Scale, 2016), וכן כיהן כסגן נשיא בכיר לקידום ההוראה והלמידה בטכניון. פרופ' רול היה חבר במספר ועדות במסגרת קבוצות ה־PISA של ה־OECD. סקירתו על בינה מלאכותית בחינוך היא המאמר המצוטט ביותר בעשור האחרון בכתב העת International Journal of Artificial Intelligence in Education.
מקורות
[1] Organization for Economic Co-operation and Development. (2023, October). PISA 2025 learning in the digital world assessment framework (Second Draft).
[2] Roll, I., & Barhak-Rabinowitz, M. (2023). Measuring self-regulated learning using feedback and resources. Innovating assessments to measure and support complex skills. eds. N. Foster and M. Piacentini (Paris: OECD Publishing), 159-171.
[3] Drive, S., & Roll, I. (2025). Towards a Task-Agnostic Assessment of Self-regulated Learning in Modeling Activities. In International Conference on Artificial Intelligence in Education (pp. 487-500). Cham: Springer Nature Switzerland.
[4] Barhak-Rabinowitz, M., Karelitz, T. M., & Roll, I. (2026). Measuring the iterative process of creative thinking: Uncovering the interplay between divergent and convergent thinking. Learning and Individual Differences, 125, 102821.
[5] Natalie, F., & Mario, P. (Eds.). (2023). Innovating assessments to measure and support complex skills. OECD Publishing.
מניעת נשירה משנה א' בלימודים אקדמיים – כן, זה אפשרי!!
פרופ' איתמר גתי וד"ר מיכל פיליפס־ברנשטיין, האוניברסיטה העברית
תקציר
השתלבות מוצלחת בלימודים היא אינטרס משותף לסטודנטים, למוסדות ולמדינה. כדי לקדם מטרה זו פותח שאלון הערכת המוכנות ללימודים אקדמיים, הבוחן שישה משתנים פסיכו־חברתיים שנמצאו כתורמים להתמדת הסטודנטים: מסוגלות עצמית אקדמית, מחויבות ללימודים, נינוחות חברתית, מעורבות בקמפוס, משמעת עצמית וחוסן אישי. השאלון הופץ בשנים האחרונות בקרב אלפי סטודנטים שנה א' במגוון אוניברסיטאות ומכללות, כאשר כל סטודנט/ית קיבל/ה משוב אישי מיידי, ומוסד הלימודים קיבל תמונה מסכמת על מידת המוכנות של הסטודנטים הלומדים בו. ממצאים מניתוח תשובותיהם של 896 סטודנטים שהתחילו את לימודיהם בתשפ"ג באוניברסיטה העברית הצביעו על סיכויי נשירה גבוהים פי 2.5 של הסטודנטים שמוכנותם על פי השאלון הייתה נמוכה בהשוואה לסטודנטים שמוכנותם הייתה גבוהה. תוצאות אלה תומכות במחקרים קודמים על תרומת השאלון לאיתור מראש של סטודנטים בסיכון לנשירה. הן תואמות גם את הממצאים ממחקר על חמש מכללות ואוניברסיטה אחת שנערך במרכז הארצי לבחינות ולהערכה על 1,122 סטודנטים שנה א' בתשפ"ג. כלל הממצאים מחזקים את תוקף הניבוי של השאלון ומשקפים את תרומתו הן באיתור מוקדם של סטודנטים בסיכון לנשירה והן ככלי התערבות התומך בהשתלבות מוצלחת בלימודים.
מבוא
שאלון הערכת המוכנות ללימודים אקדמיים פותח באוניברסיטה העברית תוך אימוץ המודל של 'רפואה מותאמת אישית' להערכת המוכנות ללימודים אקדמיים ולמניעת נשירה של סטודנטים שנה א' (פיליפס־ברנשטיין וגתי, 2021). הערכת המוכנות מתבססת על מוכנות הסטודנט/ית בשישה משתנים פסיכו־חברתיים שנמצאו כתורמים להתמדת הסטודנטים: מסוגלות עצמית אקדמית, מחויבות ללימודים, נינוחות חברתית, מעורבות בקמפוס, משמעת עצמית וחוסן אישי. עצם המענה על השאלון והמשוב האישי עליו, הכולל גם המלצות מותאמות, נמצאו כמפחיתי נשירה באופן ניכר. כך עלה במחקר עם הקצאה מקרית לשתי קבוצות: האחת השיבה על שאלון המוכנות והשנייה על שאלון 'פלסיבו' – אוריינטציות להשכלה גבוהה (גתי ופיליפס־ברנשטיין, 2025). במחקרים קודמים על אלפי סטודנטים שנה א' שמילאו את השאלון לפני שנת הלימודים או ממש בתחילתה, נמצא כי סיכויי הנשירה של סטודנטים עם מוכנות נמוכה ללימודים אקדמיים היו גבוהים יותר באופן ניכר מסיכויי הנשירה של סטודנטים עם מוכנות גבוהה. בנוסף למשוב האישי, מוסדות הלימודים קיבלו דוחות פרטניים ואגרגטיביים. התערבות ממוקדת (קבוצתית ואישית), על ידי צוות דיקנט הסטודנטים, שמטרתה העצמת הסטודנטים שתשובותיהם שיקפו מוכנות נמוכה, תרמה לצמצום הנשירה בקרבם (גתי ופיליפס־ברנשטיין, 2025).
במסגרת מיזם משותף של המרכז הארצי לבחינות ולהערכה (מאל"ו) ויישום (החברה לפיתוח המחקר של האוניברסיטה העברית) ובתמיכת קרן אדמונד דה רוטשילד, הופץ שאלון המוכנות לסטודנטים שנה א' בתחילת שנת הלימודים תשפ"ג ותשפ"ד. הזמנה למילוי השאלון נשלחה אליהם באמצעות מייל מדיקנט הסטודנטים במוסד לימודיהם, ובו קישור לשאלון. מטרת השאלון היא לסייע באיתור מוקדם של סטודנטים בסיכון לנשירה, להתאים להם התערבויות ייעודיות ובכך לצמצם את שיעור הנשירה. מטרת מחקר המעקב (שנערך במאל"ו) הייתה לבחון את יכולת שאלון המוכנות המועבר ממש בתחילת שנה א' לנבא נשירה של הסטודנטים במהלך שנה א' או במעבר לשנה ב'. במחקר זה נבדקה יכולת השאלון לנבא מראש סיכוי לנשירה בקרב 896 סטודנטים שנה א' בתשפ"ג של האוניברסיטה העברית.
שיטה
משתתפים
995 סטודנטים שהתחילו את שנה א' בתשפ"ג באוניברסיטה העברית נענו להזמנה שקיבלו במייל מדיקן הסטודנטים למלא את שאלון המוכנות לקראת לימודים אקדמיים. במסגרת מחקר מעקב התקבל מידע מהאגף למנהל הסטודנטים באמצע שנת הלימודים תשפ"ד לגבי 896 סטודנטים אם הם המשיכו בלימודיהם באוניברסיטה או שנשרו. מסיבות טכניות לא ניתן היה לדעת לגבי 99 סטודנטים אם הסטודנט נשר או המשיך בלימודיו כיוון שלא היה ניתן לקשר בין המייל שדרכו השיב הסטודנט על שאלון המוכנות ובין הנתונים במנהל הסטודנטים.
שאלון המוכנות
מידת המוכנות ללימודים אקדמיים נמדדה באמצעות שאלון המוכנות ללימודים אקדמיים, כלי הכולל 30 היגדים המתייחסים לשישה ממדים פסיכו־חברתיים שנמצאו במחקרים קודמים כקשורים להתמדה בלימודים (פיליפס־ברנשטיין וגתי, 2021): מסוגלות עצמית אקדמית, מחויבות ללימודים, נינוחות חברתית, מעורבות בקמפוס, משמעת עצמית וחוסן אישי. כל משתתף התבקש לדרג את מידת הסכמתו עם כל היגד (בסולם של 7 דרגות) ולכל סטודנט חושב ציון בכל אחד מששת הממדים (ממוצע דירוג ההסכמה עם חמשת ההיגדים המייצגים את הממד). המהימנות הפנימית Cα של הממדים היא בין 78. ועד 39. (פיליפס־ברנשטיין וגתי, 2021;
Phillips-Berenstein et al., 2023). תוקף המבנה ותוקף הניבוי של השאלון נתמכו בסדרת מחקרים (פיליפס־ברנשטיין וגתי, 2021; Phillips-Berenstein et al., 2023).
מהלך
השאלון הופץ בתחילת שנת הלימודים תשפ"ג באמצעות הודעת דוא"ל רשמית מדיקנט הסטודנטים, שכללה קישור מקוון למילוי השאלון. מילוי השאלון היה חינם לסטודנט, כמו גם הדוח המסכם לדיקנט הסטודנטים. מייל ההזמנה הדגיש את חשיבות המענה לצורך קבלת משוב אישי והמלצות רלוונטיות, וכן מידע לגבי הענקת מלגת שכר לימוד של 10,000 ₪ לאחד מבין ממלאי השאלון (במימון קרן רוטשילד). המשוב האישי לממלאי השאלון כלל מיפוי גרפי של מידת המוכנות של הסטודנט/ית בכל אחד מששת ממדי המוכנות, הסבר לגבי משמעות ששת הממדים והמלצות אישיות לחיזוק הממדים הנמוכים של הסטודנט/ית.
כל השאלונים מולאו בשפה העברית. הסטודנטים התבקשו לאשר את הקישור בין תשובותיהם בשאלון ובין נתונים אחרים לגביהם באוניברסיטה ולקבל המלצות והצעות רלוונטיות להשתלבותם המוצלחת באוניברסיטה; 84% אישרו את הקישור בין הנתונים (בשנת הלימודים תשפ"ו, אוקטובר 2025, 95% מהסטודנטים שנה א' באוניברסיטה העברית הסכימו לקישור). כל סטודנט/ית קיבל/ה גם מייל עם העתק של המשוב האישי שקיבל מיידית בסיום המענה על השאלון. מייל תזכורת עם המשוב נשלח לכל הסטודנטים שוב אחרי שבועיים.
הגדרת רמות המוכנות
לכל סטודנט/ית חושבו שישה ציוני מוכנות – ממוצע התשובות על חמשת ההיגדים המייצגים כל ממד. רמת המוכנות של כל סטודנט/ית על פי שאלון המוכנות נקבעה ביחס להתפלגות התשובות של מעל עשרת אלפים סטודנטים בשנים 2020–2021. ששת ציוני המוכנות של כל סטודנט/ית תורגמו לציוני תקן על בסיס הנתונים משנים קודמות. רמת המוכנות בכל ממד התבססה על תרגום ציוני התקן לאחת משלוש קטגוריות: גבוהה – 0.5 סטיית תקן ויותר מעל הממוצע, כאשר מוכנות גבוהה קודדה כ־'2', בינונית – בין 0.5 סטיית תקן מעל הממוצע ל־1.5 סטיות תקן מתחת לממוצע, שקודדה כ־'1', ונמוכה –1.5 סטיות תקן ויותר מתחת לממוצע, שקודדה כ־'0'. רמת המוכנות הכללית של הסטודנט נקבעה כסך המוכנות שלו מעבר לששת הממדים, ציון שנע בין 0 לבין 12. הסטודנטים חולקו לקבוצות: בשל המספר המצומצם של סטודנטים שאובחנו כבעלי מוכנות נמוכה, אוחדו הקטגוריות של מוכנות בינונית ונמוכה וההשוואה נעשתה בין שתי קבוצות בלבד: קבוצת מוכנות גבוהה (ציון מוכנות כללי 10–12) וקבוצת מוכנות בינונית-נמוכה (ציון מוכנות כללי 9 ומטה).
המשתנה התלוי – נשירה
לצורך הניתוח, נשירה הוגדרה כמשתנה דיכוטומי: סטודנטים שהמשיכו בלימודיהם באוניברסיטה העברית (בין שבאותו מסלול ובין שבמסלול אחר שבו למדו בשנה א') הוגדרו כ"ממשיכים", ואילו אלה שהפסיקו את לימודיהם באוניברסיטה (כלומר לא היו רשומים כסטודנט פעיל בתשפ"ד) הוגדרו כ"נושרים".
שיטת הבדיקה של תוקף הניבוי
בהתאמה לשיטה של מאל"ו לבדיקת היכולת של שאלון המוכנות לנבא מראש נשירה (עזורי וגזית, 2025), ולצורך בחינת הקשר בין רמת המוכנות לנשירה, חושבו שיעורי הנשירה בכל אחת משתי קבוצות המוכנות – מוכנות גבוהה לעומת מוכנות נמוכה. בהמשך חושב יחס הסיכויים (Odds Ratio) המשווה את הסיכון לנשירה בקרב סטודנטים בעלי מוכנות נמוכה לעומת בעלי מוכנות גבוהה. ערך גבוה מ־1 מצביע על סיכון גבוה יותר לנשירה בקבוצת מוכנות נמוכה, ואילו ערך נמוך מ־1 מעיד על סיכון גבוה יותר לנשירה בקרב קבוצת מוכנות גבוהה. מדד זה שימש כבסיס לבחינת תוקף הניבוי של שאלון המוכנות.
תוצאות
לוח 1
מספר הסטודנטים בארבע קבוצות, בהתייחס למידת המוכנות (נמוכה וגבוהה) ולסטטוס הלימודים לאחר שנה (נשר או המשיך ללמוד)

כפי שניתן לראות בלוח 1, אחוז הנשירה בקבוצת מוכנות גבוהה (2.97%) היה כצפוי נמוך יותר מאשר אחוז הנשירה בקבוצת מוכנות נמוכה (6.48%); פער זה משקף יחס בין סיכויי נשירה של שתי הקבוצות ,OR=2.265 פער משמעותי מבחינה סטטיסטית, ומשקף גודל אפקט קטן, לאור מספר הנושרים הנמוך.
המסקנה
באוניברסיטה העברית שיעור הנשירה בתשפ"ג בקרב סטודנטים עם מוכנות נמוכה גבוה פי שניים ויותר לעומת סטודנטים בעלי מוכנות גבוהה. תוצאות אלה דומות לתוצאות המחקר של עזורי וגזית (2025), שנערך במרכז הארצי לבחינות ולהערכה, ושבו נמצא, בהתבסס על ניתוח נתונים של 1,122 סטודנטים משישה מוסדות להשכלה גבוהה בתשפ"ג, שאחוז הנשירה בקבוצת מוכנות נמוכה (14%) היה גבוה יותר מאשר בקבוצת מוכנות גבוהה (6%), כאשר ה־OR היה 2.47.
ממצא מעניין נוסף שמוצג בדוח של המרכז הארצי הוא שאחוז הנשירה היה גבוה יותר בקרב סטודנטים שלא נענו להזמנה ולא מילאו את שאלון המוכנות (19%) לעומת אחוז הנשירה בקרב הסטודנטים שכן השיבו על השאלון (8%); OR=2.65. ממצא זה תואם ממצאים של מחקרים קודמים כפי שדיווחו פיליפס־ברנשטיין וגתי (2021). לפער זה שני הסברים: הראשון, יש הבדל מראש בין המשיבים ללא־משיבים; ייתכן שהסטודנטים שנענו להזמנה למלא את השאלון שונים מאלו שלא נענו, בעיקר ביחסם ל"כללי המשחק" האקדמיים ולחשיבות ההיענות לפנייה רשמית ממוסד הלימודים. השני, השפעת מילוי השאלון עצמו; ייתכן שלמענה עליו הייתה תרומה להפחתת הנשירה, בזכות המשוב האישי שקיבלו הסטודנטים עם המלצות מותאמות אישית. הסבר זה נתמך במחקר השוואתי שבו נמצא ששיעור הנשירה בקרב סטודנטים שמילאו את שאלון המוכנות וקיבלו משוב אישי נמוך פי שניים בהשוואה לאלה שמילאו שאלון "פלסיבו" – שאלון האוריינטציות להשכלה גבוהה – "מה הביא אותך ללמוד באוניברסיטה?" (גתי ופיליפס־ברנשטיין, 2025). כדי להעריך את התרומה היחסית של כל אחד מהסברים אלה נדרש מחקר נוסף. לבסוף, מחקר המשך יוכל לבחון את נקודת החתך האופטימלית בכל ממד מבחינת השיוך למוכנות גבוהה, בינונית ונמוכה וגם אפשרות לשקלול דיפרנציאלי של ששת הממדים בתרומתם לניבוי הנשירה.
פיתוח שאלון המוכנות ללימודים אקדמיים זכה בפרס קיי לחדשנות בשנת 2022.
קישור לשאלון המוכנות. השאלון אנונימי; אם בחרת למלא את השאלון כדי להכיר אותו, נא לציין בגיל "77" כדי לשקף שלא מדובר בסטודנט שנה א' אלא ב"מומחה".
על הכותבים
פרופ' (אמריטוס) איתמר גתי – פרופ' אמריטוס מהמחלקה לפסיכולוגיה ובית הספר לחינוך ע"ש סימור פוקס באוניברסיטה העברית. היה יו"ר ועדת ההיגוי של תוכנית הישגים של המל"ג/הות"ת להנגשת ההשכלה הגבוהה לצעירים מהפריפריה החברתית והגאוגרפית של המדינה. במוקדי מחקריו: סיוע לצעירים בקבלת החלטות במעברים בתחום התעסוקתי, כולל בבחירת תחום לימודים ומקצוע, השתלבות מוצלחת בלימודים ובחירת מקום עבודה. שאלונים וכלים המסייעים בקבלת ההחלטות אלה משולבים באתר כיוונים לעתיד (שירות חינמי ואנונימי).
ד"ר מיכל פיליפס־ברנשטיין – מנהלת מחקר ופיתוח ולמידה בעמותת אלומה, בעלת דוקטורט ופוסט דוקטורט מבית הספר לחינוך ע"ש סימור פוקס באוניברסיטה העברית, בעלת ניסיון של מעל עשרים שנה והתמחות במערכי תמיכה וייעוץ חינוכי במוסדות להשכלה גבוהה.
מקורות
גתי, א. ופיליפס-ברנשטיין, מ. (2025). תרומת שאלון המוכנות להתמדה ולהצלחה בלימודי שנה א' במוסדות להשכלה גבוהה. האוניברסיטה העברית בירושלים.
עזורי, ד. וגזית, נ. (2025). מיזם המוכנות ללימודים אקדמיים: נתוני דוח נשירה תשפ"ג. דוח מחקר פנימי של המרכז הארצי לבחינות ולהערכה.
פיליפס-ברנשטיין, מ'. וגתי, א'. (2021). מניעה מותאמת אישית: גישה חדשנית לצמצום הנשירה מההשכלה הגבוהה. אדם ועבודה, 17, 22–34.
Phillips-Berenstein, M., Willner, T., & Gati, I. (2023). Psychosocial Readiness for College: A Multidimensional model and measure for students entering college in their twenties. Journal of Career Assessment, 32(4), 623-649.
DOI: 10.1177/10690727231186770
דבר היו"רית
הגיליון הזה של המידעונט יוצא לאור בינואר 2026, ומבחינתי זו נקודת זמן מתאימה להתבונן על השנה האחרונה באפי (האגודה הישראלית לפסיכומטריקה), מנקודת מבטי האישית.
נכנסתי לתפקיד היו"ר לאחר כנס אפי שנערך בפברואר 2025, וזאת אחרי שלוש שנים כחברת מועצה בתפקיד יו"ר נבחרת* וכעורכת המידעונט. אני מודה שחששתי מהתפקיד. הלחיץ אותי לעמוד בראש גוף כמעט נטול תקציב, שמבוסס ברובו על מתנדבים, כשהזמן של כולם מוגבל מאוד, וכך גם שלי.
קיבלתי החלטה להתמקד במה שאני אוהבת, ולהיעזר ככל האפשר באחרים. ניסיתי להשקיע בעיקר בחיזוק הקהילה של אפי:
-
חידשנו את מפגשי האפיזום שהתחלנו בהם ב־2023 ושנעצרו עקב המלחמה;
-
קיימנו שתי סדנאות מקצועיות ייעודיות לחברי אפי, בתשלום סמלי;
-
פרסמנו שני גיליונות מידעונט (זה השני), ושניהם נערכו על ידי גל ירמיהו. תודה גדולה לגל על היסודיות, המסירות, המקצועיות ומאור הפנים.
מאחורי הקלעים יש עשרות רבות של פעילים שמקדישים מזמנם במלוא הרצינות, באכפתיות ובעיקר בנדיבות לב ובחברות. השנה מצאתי את עצמי מתרגשת שוב ושוב מרוח ההתנדבות והנתינה, והכול מתוך הכרה בחשיבות של אפי. החל מפעילותם של חברי המועצה ודרך מי שהציגו באפיזום, הגיעו למפגשים, צפו בהקלטות, שלחו כתבות למידעונט, הגישו מועמדות לכנס ולפרס אפי, שפטו הצעות לכנס ועבודות והיו פעילים בוועדת המומחים של פרס אפי.
כל זה לא מובן מאליו. בעיניי, זו עדות לרצון, או לצורך, להפוך את אפי לקהילה פעילה ומחוברת לאורך כל השנה, ולא רק בכנס. השנה הרגשתי את העוצמה הזו במיוחד (ואולי היא הייתה שם תמיד), מזווית הראייה שלי כיו"ר.
אני רוצה לנצל את ההזדמנות ולהודות לחבריי במועצה של אפי. לצערי, רבים מהם מסיימים השנה את כהונתם.
ד"ר חגית גליקמן, חברת מועצה ויו"ר נבחרת (לשנה בלבד עקב ויתור על התפקיד), שתמיד נוכחת בעקביות, תורמת עצה מקצועית לכל החלטה, ולצד זאת הובילה כיו"ר את שני הכינוסים הקודמים.
ד"ר רוני ברצלבסקי, ותיק החבורה ואדם יקר, שמסיים כהונה שנייה כחבר מועצה (6 שנים!) ולו תרומה רבה החל משיפוט הצעות לכנסים, דרך הובלת תחרות פרסי אפי בחלק מהזמן ועד לסיוע בכל דבר שהוא יכול.
אלירן שתיוי, הגזבר שלנו, שפועל במקצועיות רבה ובקפדנות, דואג לסדר ולהתנהלות תקינה. היה לי העונג להכיר אותו ולעבוד איתו.
ד"ר הלנה קימרון, שהובילה את פרסי אפי בענווה וביסודיות, עם סטנדרט מקצועי גבוה ואחריות לשמור על תהליך הוגן, אנושי ומכבד.
ד"ר מירב אריאלי־אטאלי, שנכנסה למילוי מקום ברגע שבו היה צורך, תרמה ללא לאות, כולל תפקידה כיו"ר הכינוס הקרב ובא.
חברות ועדת הביקורת: אנדראה אברמזון, שעבדה קשה וניהלה גם את הבחירות המורכבות שהיו השנה במקצועיות רבה ובקסם ששמור לה. לצידה ד"ר תמר מלינוביץ' שתרמה גם בהרצאתה המצוינת במסגרת אפיזום.
תודה גדולה גם ליועצת המשפטית שלנו, עו"ד אילה הוניגמן, שעוזרת לנו בהתנדבות מלאה להתנהל בהתאם לחוקי העמותות ולתקנון בזמינות ובנכונות יוצאות דופן.
ואי אפשר בלי לומר מילה על מתן הר־צבי, שמְתחזק את האתר באופן שוטף מבחינת תוכן, עיצוב, בנייה ותשלומים, ועל מיטל פלדמן שעובדת קשה ובאחריות רבה על הפקת הכינוס וכל מה שמסביב.
לאחרונה נערכו בחירות, ויש לנו נבחרת חדשה למועצה. לצד העצב על פרידה מחברים נהדרים, אני שמחה לומר שהנבחרת החדשה היא נבחרת מצוינת. חברי הנבחרת ייכנסו לתפקידם לאחר אשרור תוצאות הבחירות באסיפת החברים שתתקיים בכינוס הקרוב. ברכות חמות על הבחירה ואני בטוחה שתהיה לנו שנה מהנה יחד.
חברי המועצה החדשים:
-
פרופ' גילי גולצויג – יו"ר נבחר
-
ד"ר מירב אריאלי־אטאלי
-
בועז רוזנבאום
-
בעז צור
-
נוגה גוטספלד
לוועדת הביקורת מצטרף:
-
יוני שריג
כמו כן, נתנאל סילברשטיין, התנדב להיות הגזבר של אפי בשנה הקרובה. תודה רבה לנתנאל. נתנאל ייכנס לתפקיד אחרי אישור המועצה על המינוי.
ולסיום, כדי שלא אישאר רק בממד האישי, החלטתי למפות את התכנים שפורסמו בבמות הפתוחות של אפי במהלך 2025 – המידעונט ואפיזום (ללא הכנס). המיפוי מוצג בתמונה שלהלן (לחצו כאן לתמונה מוגדלת).
בולט בו המגוון הרחב של העיסוק בתחום. המיפוי המפורט מעלה גם שאלה אילו תחומים אינם נמצאים בו והיו יכולים להיות. עוד דבר חשוב שעולה הוא השילוב המוכר והמפרה בין מחקר אקדמי לבין יישומים בשטח, שיח שמזין את שני הצדדים.
אם יש עוד מחשבות, רעיונות – אשמח שתכתבו לי.
כדי שאפי תמשיך להיות קהילה מקצועית חיה לאורך השנה, אנחנו זקוקים לכם. כולם מוזמנים להציע הרצאות לאפיזום, כתבות למידעונט, או כל רעיון אחר לפעילות. נשמח שתצטרפו לעשייה, גם אם אינכם חברים במועצה.
אני מאחלת לנו שב־2026 נמשיך יחד לבנות קהילה מקצועית פעילה, סקרנית ומפרה, עם עוד שיח, עוד שיתופי פעולה, ועוד הזדמנויות ללמוד זה מזה.
תודה לכולם ומקווה לראותכם בקרוב בכנס,
עינת נוטע־קורן
יו"ר אפי
* יו"ר נבחר/ת הוא היו"ר שמיועד להיכנס לתפקיד של יו"ר אפי בתום כהונתו של היו"ר המכהן (הליך זה מתבצע כעבור שנתיים או שלוש שנים אחרי שהוא נבחר לתפקיד.)
מעבר לתשובה הנכונה: שכבות של כשירות בהערכת הבנה בכימיה
עינת בן־אליהו, אוניברסיטת בן־גוריון
פיתוח פריטי הערכה במדעים אינו עוסק רק בבחירת התוכן, אלא גם בהחלטות ייצוגיות: כיצד מוצג המידע, אילו סמלים נכללים בפריט, ואם נעשה שימוש בטקסט מילולי, באיורים או בגרפים. החלטות אלו משפיעות על רמת הקושי של הפריט, אך לא פחות מכך על סוגי החשיבה שהוא מעורר ועל האופן שבו תלמידים מפרשים את המידע. בעשורים האחרונים הולכת ומתבססת ההבנה כי הערכה אינה רק כלי למדידה, אלא גם אמצעי לחשיפת דפוסי הבנה, ידע מקוטע וקשיים סמויים.
בהוראת כימיה, ייצוגים חזותיים (visual representations) ממלאים תפקיד מרכזי. תרשימי חלקיקים, איורים מולקולריים וגרפים משמשים לתיאור תהליכים שאינם נגישים ישירות לחושים. עם זאת, תפקידם של ייצוגים אלה בהקשר של הערכה טרם הובהר במלואו. האם הם מסייעים לתלמידים לבטא הבנה מושגית, או שמא מוסיפים שכבת קושי נוספת שאינה בהכרח מושגית?
המחקר המוצג כאן בוחן שאלות אלו דרך עיסוק בעקרונות יסוד בכימיה של חטיבת הביניים, ובראשם חוק שימור המסה. נקודת המוצא היא תפיסה של כשירות מדעית ככזו שאינה חד־ממדית, אלא מורכבת ממספר שכבות מובחנות.
תפיסה רב־שכבתית של כשירות בלמידת כימיה
הבנה מושגית (conceptual understanding) של רעיונות כימיים, כגון תגובה כימית או שינוי מצב צבירה, נשענת על מושגים מופשטים שאינם נצפים ישירות. לשם כך נעשה שימוש בייצוגים חיצוניים: ניסוחים מילוליים, משוואות כימיות, איורים חלקיקיים (molecular structures) וגרפים. אולם שליטה במושגים אינה מבטיחה בהכרח שליטה בייצוגים.
כשירות ייצוגית (representational competence) מתייחסת ליכולת להבין ייצוגים מדעיים, לזהות את המידע הרלוונטי בהם ולתרגם בין ייצוגים שונים המתארים אותו רעיון. תלמיד עשוי לדעת שמסה נשמרת בתגובה כימית, אך להתקשות כאשר אותו עיקרון מוצג באמצעות גרף או איור חזותי.
בהתאם לכך, המחקר מאמץ תפיסה רב־שכבתית של כשירות (a layered view of competence), שלפיה ביצוע בפריטי הערכה משקף שילוב בין הבנה מושגית ובין כשירות ייצוגית. קשיים בפריט עשויים לנבוע מאחת השכבות או מהאינטראקציה ביניהן.
תיאור תמציתי של עיצוב המחקר
במחקר השתתפו 374 תלמידי כיתה ח', אשר ענו על שאלוני רב־ברירה שכללו פריטים איזומורפיים. כל פריט הופיע בשתי גרסאות מבחן שונות: הגרסה המילולית, שבה אפשרויות התשובה נוסחו בטקסט, והגרסה החזותית, שבה אותן אפשרויות הוצגו באמצעות איורים (isomorphic items). התלמידים חולקו בין הגרסאות כך שכל תלמיד/ה השיב/ה רק על גרסה אחת של השאלון: גרסה מילולית או גרסה חזותית. כדי לוודא שהבדלים בין הגרסה החזותית לגרסה המילולית אינם נובעים מחשיפה שונה להוראה חזותית, כללנו בשאלון פריטי רקע שעסקו בתדירות השימוש של המורה בפרקטיקות הוראה שונות, ובפרט שימוש בייצוגים חזותיים (כגון איורים בספר הלימוד, הדגמות וסימולציות מחשב המתארות חלקיקים). לאחר מכן נערכה השוואה בין הקבוצות שהשיבו לגרסה החזותית לבין אלו שהשיבו לגרסה המילולית, ונמצא כי לא היו הבדלים מובהקים בין הקבוצות במדדים אלו. מעבר לבחירת התשובה, התבקשו התלמידים לדרג את בהירות השאלה (item clarity), ובשלב מאוחר יותר של המחקר גם את בהירות האיורים עצמם (representation clarity). כדי להעמיק מעבר לדירוגי הבהירות ולבחון כיצד התלמידים מפרשים בפועל את הייצוגים החזותיים, נערכו ראיונות חצי־מובנים שבהם התלמידים התבקשו לבחור תשובה ולהסביר את נימוקיהם, תוך התייחסות מפורשת לפרטים באיורים. ניתוח ההסברים אִפשר לזהות מקרים שבהם האיורים יצרו בלבול או עומס מידע, לעומת מקרים שבהם הקושי נבע מהבנה מושגית גם כאשר הייצוג נתפס כברור. שילוב זה יצר תמונה עשירה של מקורות הקושי בפריטים.
ממצאים מרכזיים: ייצוגים חזותיים כחרב פיפיות
באופן כללי, נמצא כי בממוצע הצליחו התלמידים מעט יותר בגרסאות המילוליות, אך התמונה הייתה מורכבת בהרבה. בחלק מהפריטים לא נמצא הבדל בין הגרסאות, באחרים הפער היה גדול, ולעיתים אף לטובת הגרסה החזותית.
בפריט שעסק בפירוק תחמוצת הכספית ובהפעלת חוק שימור המסה, התלמידים הצליחו יותר בגרסה המילולית. האיור החזותי [איור 1], שכלל בלון מתנפח כתוצאה מהיווצרות גז, הסיט את תשומת הלב מהעיקרון המושגי וגרם לחלק מהתלמידים להסיק בטעות שהמסה השתנתה. ממצא זה מדגים כיצד ייצוג חזותי עשוי לחשוף ידע מקוטע (fragmented or synthetic knowledge): תלמידים שהכירו את העיקרון, אך יישמו אותו באופן לא עקבי כאשר הייצוג עורר אסוציאציות יומיומיות.
איור 1
פריט הערכה העוסק בפירוק כספית חמצנית
גרסה חזותית (ימין) וגרסה מילולית (שמאל)

לעומת זאת, בפריט שעסק בהתכת חמאה ושינוי מצב צבירה, התלמידים הצליחו יותר בגרסה החזותית [איור 2]. במקרה זה, האיורים סייעו לשלול תפיסות שגויות, כגון זיהוי נוזל עם מרווחים גדולים מאוד בין חלקיקים, האופייניים לגז. כאן הייצוג החזותי שימש כעוגן תומך, גם אם לא העיד בהכרח על הבנה עמוקה של המודל החלקיקי.
איור 2
פריט הערכה העוסק בהתכת חמאה
גרסה חזותית (ימין) וגרסה מילולית (שמאל)

בפריטים אחרים, כגון פריט האמוניה שבו נדרשה התאמה בין נוסחה כימית לייצוג חלקיקי של תגובה, נמצא קשר מובהק בין בהירות האיורים ובין הצלחה בפריט. כאשר תלמידים דירגו את האיורים כברורים, עלתה גם ההסתברות לבחירה נכונה. ממצא זה מצביע על כך שבפריטים מסוג זה, הכשירות הייצוגית מהווה תנאי מרכזי למימוש ההבנה המושגית.
דירוגי בהירות ככלי אבחוני בהערכה
אחד החידושים המרכזיים במחקר הוא השימוש בדירוגי בהירות לצד ביצוע. בניגוד לדירוגי ביטחון, המשקפים עד כמה תלמיד סבור שתשובתו נכונה, דירוגי בהירות מתמקדים בשאלה אם הפריט מובן לו.
שילוב זה מאפשר הבחנה בין מצבים שונים: טעויות שמקורן באי הבנה מושגית, טעויות הנובעות מקושי ייצוגי ומצבים שבהם ייצוג חזותי אף מסתיר קושי מושגי. כך למשל, נמצאו פריטים שבהם תלמידים רבים טעו אך דירגו את השאלה כברורה, תופעה המעידה על תפיסה שגויה יציבה שאינה נתפסת כקושי בעיני הלומד.
השלכות לפיתוח פריטים ולהערכה
לממצאי המחקר יש השלכות ישירות עבור מפתחי פריטי הערכה וחוקרים בפסיכומטריקה ובהערכת הישגים. ראשית, שילוב ייצוגים חזותיים בפריטים אינו ניטרלי. יש להגדיר במפורש מה מטרת הייצוג: אבחון הבנה מושגית, בחינת כשירות ייצוגית או שילוב בין השניים.
שנית, שימוש בפריטים איזומורפיים מאפשר חשיפה של ידע מקוטע ושל רגישות לייצוג, ומהווה כלי אבחוני רב־ערך, במיוחד בהערכה אבחונית (diagnostic assessment). נוסף על כך, דירוגי בהירות מציעים אמצעי פשוט אך עשיר להעמקת פרשנות הציונים, הן בהערכה מחקרית והן בהערכה כיתתית.
סיכום
המחקר מציע מבט רב־שכבתי על כשירות תלמידים בכימיה, ומדגיש כי הערכת הבנה מושגית אינה יכולה להתנתק מהאופן שבו ידע מיוצג. ייצוגים חזותיים עשויים לחשוף קשיים, להעמיס עומס קוגניטיבי (cognitive load) או לעיתים אף להקל על הבחירה הנכונה. הבנת יחסי הגומלין בין השכבה המושגית לשכבה הייצוגית היא מפתח לפיתוח פריטי הערכה מדויקים, רגישים ומשמעותיים יותר, הן למחקר והן לפרקטיקה החינוכית.
מחקר זה הוא חלק מעבודת הדוקטורט של עינת בן־אליהו, בהנחיית ד״ר אילון לנגבהיים,
בית הספר לחינוך, התוכנית להוראת המדעים, אוניברסיטת בן גוריון בנגב.
המאמר שעליו מבוססת כתבה זו התקבל לפרסום בכתב העת Chemistry Education Research and Practice.
על הכותבת
עינת בן־אליהו – מורה לכימיה בחטיבת הביניים, בעלת תואר בהנדסה כימית וכ־30 שנות ניסיון בהוראת המקצוע. לאחרונה השלימה דוקטורט בהוראת הכימיה באוניברסיטת בן־גוריון, וכיום עוסקת במחקר ובפיתוח תוכן במכון למחקר יישומי בבינה מלאכותית בחינוך, וכן מפתחת תוכן ברשת אמית ובחברת וואן אססמנט.
אינטליגנציה בעידן ה־AI – משבר מושגי בלב הפסיכומטריקה
ד"ר ג'ודי קוהאן
בעידן הנוכחי אנו עדים לסגידה אינטנסיבית לאינטליגנציה: אובססיה תרבותית המעמידה את היכולת הקוגניטיבית כערך עליון. סגידה זו מולידה שני תוצרים מטלטלים: בינה מלאכותית שמנסה לחקות ולבצע מטלות קוגניטיביות טוב יותר מבני אדם; וטכנולוגיות שיפור קוגניטיבי כמו גרייה מוחית עמוקה שמבקשות לבצע אופטימיזציה למוח האנושי עצמו. במקביל, מערכות מבחנים ממשיכות למדוד "אינטליגנציה" כאילו דבר לא השתנה.
במרכז מפגש זה עומדת סתירה מהותית: אנו ממשיכים לסגוד לאינטליגנציה כפי שהוגדרה במאה ה־20, בדיוק ברגע שבו יכולות אלה חדלות להיות נחלתו הבלעדית של האדם. הבעיה המרכזית אינה רק ש־AI אינו חושב כמו בני אדם, אלא שאנו מאמצים בעצמנו דפוס חשיבה "חישובי" יותר ויותר: כזה שמעדיף יעילות על פני עומק, תשובות על פני תהייה וחיקוי על פני יצירה מקורית. הפסיכומטריקה מוצאת את עצמה בלב משבר מושגי שלא ניתן עוד להתעלם ממנו.
כשמכונות פותרות את המבחן טוב מאיתנו
במשך יותר ממאה שנים, אינטליגנציה הוגדרה, הלכה למעשה, דרך סוג מסוים של ביצועים: מהירות עיבוד, פתרון בעיות, שליטה מילולית, זיהוי תבניות ויעילות קוגניטיבית. מערכות המיון, האבחון וההערכה נבנו סביב מטלות כאלה, ומבחני אינטליגנציה, פסיכומטריים ומיונים מסכמים הפכו לשער הכניסה למערכות חינוך, אקדמיה ותעסוקה.
אלא שבעשור האחרון נוצר מצב פרדוקסלי: אותן מטלות ממש, שעל בסיסן הוגדרה "אינטליגנציה", מבוצעות כיום באופן שגרתי וביעילות על ידי מערכות AI. מודלים עדכניים מגיעים לביצועים ברמת אדם ואף מעבר לכך במבחני הבנת טקסט, פתרון בעיות מתמטיות מורכבות וזיהוי תבניות. אם מכונה מסוגלת לפתור בזמן קצר וללא מאמץ את המטלות שבמשך שנים שימשו כמדד ל"חוזק קוגניטיבי", השאלה המתבקשת היא – מה בעצם נמדד כאן: יכולת אנושית ייחודית או הצלחה במשימה פורמלית שהפכה משותפת לאדם ולמכונה?
מי מחונן כשהאלגוריתם "גאון"?
השאלות המוכרות של זיהוי מחוננות מקבלות לפתע זווית אחרת. ההערצה החברתית לאינטליגנציה גבוהה אינה מתפוגגת בעידן הבינה המלאכותית אלא מתועלת מחדש: מהילד המחונן כתקוות החברה אל המכונה שמגלמת את הפנטזיה על תבונה מושלמת נקייה ממגבלות אנושיות. כאשר יכולות שהגדרנו כ"מחוננות" הפכו לסטנדרטיות עבור מערכות AI מתקדמות, מי נמצא "בקצה הימני של ההתפלגות" כשעקומת ההפצה עצמה משתנה?
לשאלה זו יש משמעויות מעשיות, לא רק פילוסופיות. תוכניות למחוננים, מסגרות מצוינות ותהליכי מיון יוקרתיים נשענים על הנחה מובלעת: המבחנים מאתרים איכות קוגניטיבית פנימית, יציבה ואנושית. כאשר אלגוריתם מסוגל לבצע את אותן מטלות ברמה זהה או גבוהה יותר, נוצר ספק אם הציון הגבוה משקף עדיין "יתרון אנושי ייחודי".
הסכנה באימוץ אמות המידה של המכונה
המטפורה של "המוח כמכונה" טומנת בחובה סכנה לצמצום מושג האינטליגנציה האנושית לממדים הניתנים למדידה, לאופטימיזציה ואף לשעתוק, ובכך להחמיץ את רב הממדיות של החוויה האנושית. כאשר אנו מתחילים לשפוט את עצמנו לפי אמות המידה של המכונה – מהירות, יעילות, אופטימיזציה – אנו מאבדים את הערכים שמרכיבים את מהותנו: מורכבות, ספק ועומק רגשי.
הפער הזה מתחדד בעידן ה־AI. מנקודת מבט פסיכומטרית חשוב להפריד בין איכות המדידה לבין האופן שבו מפרשים אותה. מבחן יכול להיות מהימן מאוד, עם עקביות גבוהה וסטנדרטיזציה מרשימה, ועדיין להוביל לפרשנויות שאינן תקפות כשהוא מנוצל למטרות שלא נבחנה עבורן התוקפות. הקפיצה מן "הנבחן הצליח במטלה מסוימת" אל "הנבחן חכם יותר" או "מחונן" היא קפיצה פרשנית, לא עובדה סטטיסטית.
האם נותר יתרון קוגניטיבי אנושי ייחודי?
אם נקבל שמכונות כבר מבצעות טוב מאיתנו חלק ניכר מן המטלות הקוגניטיביות המסורתיות, השאלה איננה רק "איך נימנע מרמאות במבחנים", אלא "מה בכלל ראוי למדידה". כידוע, מודלים של AI אינם חווים רגש, אינם נעים מתוך כוונה ואינם יוצרים רעיונות מתוך צורך קיומי. מביצועיהם, מרשימים ככל שיהיו, נעדר הממד האנושי של חוויה, משמעות ותודעה.
ייתכן שהיתרון האנושי אינו מצוי בחישוב מהיר או בזכירת מידע אלא ביכולת לשאול שאלות חדשות, להטיל ספק במסגרת עצמה, לבחור על בסיס ערכים, לשאת אי ודאות ולהחזיק סתירות לאורך זמן. דווקא כעת חשוב להדגיש: יוצא הדופן הוא מי שחושב אחרת, לא מי שחושב מהר. יכולות אלה קשורות למודעות עצמית, לשיפוט מוסרי, ליצירתיות משנה כללים ולגמישות קוגניטיבית, מרחבים שבהם האלגוריתם עדיין מוגבל בהשוואה לאדם. אם כך, מתחדד פרדוקס מטריד: מערכות ההערכה ממשיכות למדוד בעיקר את מה שהפך לפחות ייחודי לאדם, ומתמקדות פחות במה שעשוי להיות ליבת היתרון האנושי בעידן ה־AI. המטפורה של המוח כמכונה מערערת גם את תפיסת המחוננות: אם הבינה המלאכותית מסוגלת לשחזר ידע ולזהות תבניות במהירות מרשימה, האם תכונות אלו עדיין יהיו מדדי הזהב של אינטליגנציה יוצאת דופן?
אחריות מקצועית: לשמר את האנושי
כל זאת אינו אומר שמבחנים איבדו מערכם. להפך, בעידן זה תפקידם של אנשי התחום הופך חשוב ומורכב יותר. יש צורך בהבחנה שקולה בין מה שהמבחן מסוגל למדוד היטב לבין המשמעויות שאנו מייחסים לציון; בין תוקף מדידה טכני לבין תוקף פרשני וחברתי.
במקום למקד את השיח רק בשאלות טכניות כגון איך לנסח הוראות שימוש ב־AI במבחנים וכיצד לזהות תשובות שנעזרו במודל שפה, מוצע להעביר את מרכז הכובד לשאלות המושגיות. מה אנו מבקשים להבין על האדם דרך המדידה? אילו רכיבים קוגניטיביים, רגשיים וערכיים ראוי להציב במרכז? במערכת חינוך שמקדשת יעילות, קיימת סכנה שיישכח ערכם של תהליכים איטיים – של טעייה, של תהייה פתוחה. האתגר החינוכי אינו רק ללמד להשתמש בכלי בינה מלאכותית אלא לשמר את הזהות הקוגניטיבית: להעניק לגיטימציה לשאלות ללא תשובה ולעודד חשיבה איטית, לא ליניארית ובלתי צפויה. מחקרים מזהים כבר סימנים לירידה קוגניטיבית בקרב ילדים ובני נוער בעקבות שימוש בבינה מלאכותית: ירידה ביכולת לעבד מידע באופן פעיל, לקשר בין רעיונות ולבנות ידע עצמאי. בהשפעת הכלים המתקדמים, התלמידים אולי "עונים נכון" – אך לא תמיד מבינים מדוע.
לקרוא לתחום להוביל, לא להגיב
המצאת ה־AI לא יצרה יש מאין את המתח סביב הגדרת האינטליגנציה, היא רק חידדה אותו עד קצה. אלא שכעת, כשהמכונות מבצעות היטב את המטלות שהוגדרו במשך שנים כביטוי ל"אינטליגנציה", התחום אינו יכול עוד להרשות לעצמו להתעלם מן השאלה המושגית הבסיסית.
אולי זהו הרגע שבו תפקידה של הפסיכומטריקה הוא לא רק לשכלל שיטות מדידה קיימות אלא לעזור לחברה להגדיר מחדש מה נחשב "חכם", "מחונן" או "גאון" במציאות שבה הקוגניציה המסורתית כבר אינה בלעדית לנו. עלינו להישמר לא רק ממה שה־AI עושה לנו, אלא גם ממה שהוא גורם לנו לחשוב על עצמנו. אינטליגנציה אינה מסתכמת במדידה קוגניטיבית: היא רגשית, חברתית, ובחלקה ייתכן בלתי ניתנת לכימות. המבחן האמיתי של הפסיכומטריקה, ושל כל אחד מאיתנו, אינו רק להטמיע כלים חדשניים, אלא לשמור על ליבת האנושיות: היכולת להמציא שאלות חדשות, להתמודד עם עמימות ולחפש משמעות שמעבר למה שהאלגוריתם יכול לנסח. בתוך המרוץ לשדרוג קוגניטיבי חיוני להציב גבולות אתיים ברורים, לטפח רבגוניות ולהגן על ערך השונות. אם אנשי המקצוע יסכימו לראות באתגר הזה הזדמנות, ולא איום, הם יוכלו להוביל שיח ציבורי ומקצועי על מהות ההערכה, על גבולות המדידה ועל מה שבאמת ייחודי ובעל ערך באדם בעידן שבו המכונות כבר הצטרפו למשחק שאנחנו הגדרנו.
על הכותבת
ד"ר ג'ודי קוהאן – חוקרת ואשת מקצוע המתמחה בשונות קוגניטיבית, עם דגש על מחוננות ומגדר. בעלת תואר דוקטור בחינוך מהאוניברסיטה העברית בירושלים, עמיתת הוראה במחלקה ללימודי הוראה באוניברסיטה העברית וחברת סגל בתואר השני בבית הספר לחינוך באקדמית חמדת. נוסף על כך, ד"ר קוהאן מחזיקה בתעודת הוראה בפסיכולוגיה. מחקרה מתמקד בזיהוי ובפרשנות של יכולות קוגניטיביות ובהקשרן להישגים אקדמיים, תוך תרגום פרופילים קוגניטיביים להוראה ולפיתוח תלמידים מחוננים ובעלי פרופילים מגוונים. עבודתה משלבת מחקר אקדמי, פיתוח ויישום כלי הערכה לשיפור הלמידה והכשרה והדרכה של אנשי חינוך. ד"ר קוהאן היא נציגת ישראל במועצה העולמית לילדים מחוננים ומצטיינים (WCGTC), חברת מערכת בכתבי עת אקדמיים בארץ ובעולם, מאבחנת דידקטית מוסמכת ובעלת הכשרה בנוירופדגוגיה יישומית, הסמכה בנוירופידבק ובכלי הערכת קשב MOXO.
פינת הריאיון
בשנים האחרונות נידונה שאלת הזהות המקצועית של הפסיכומטריקאי והגדרת תחומי תפקידו. בפינה הזו נראיין כל פעם אחד או אחת מהעוסקים בפסיכומטריקה, נכיר את תפקידם ונברר כיצד הם בעצמם מגדירים את התפקיד.
והפעם:
שם: ד"ר טליה חימוביץ
תפקיד: פסיכומטריקאית בדקאנט לחדשנות בהוראה ובלמידה באוניברסיטת תל אביב
רקע אקדמי: תואר שני בפסיכולוגיה תעסוקתית־ארגונית, Baruch College, ניו־יורק; דוקטורט בפסיכולוגיה, האוניברסיטה העברית בירושלים. עבודת הדוקטורט התמקדה בסוגיות פסיכומטריות באוניברסיטאות מחקר.

ספרי לנו, מה את עושה בתפקידך הנוכחי ואיך היית מגדירה את תחום העיסוק שלך?
אני פסיכומטריקאית בדקאנט לחדשנות בהוראה ובלמידה באוניברסיטת תל אביב. זה טייטל שלא מאוד נפוץ באקדמיה הישראלית, וגם היום, בכל מפגש עם מישהו חדש מחוץ ליחידה שלי, אני עדיין צריכה להסביר מה זו המילה המוזרה הזו. דווקא בגלל זה אני מעריכה את אוניברסיטת תל אביב על הבחירה להגדיר תפקיד כזה באופן מפורש – מתוך תפיסה שפסיכומטריקה היא חלק מהעשייה ההוראתית והאקדמית ולא רק כלי למבחני קבלה ומכוני מיון.
ביום־יום אני מלווה הרבה חברי סגל – גם בייעוץ אישי וגם בסדנאות – סביב כתיבה והערכה של מבחנים ועבודות, ובכלל הערכת סטודנטים לאורך הסמסטר. בשנתיים האחרונות אני עוסקת הרבה גם בהערכת עבודות בעידן ה־AI ובשאלה איך אפשר להשתמש בכלי בינה מלאכותית בצורה מושכלת כחלק מתהליך ההוראה וההערכה. במסגרת הזו פיתחתי גם בוט שמסייע ביצירת שאלות רב־ברירה על בסיס עקרונות פסיכומטריים.
בנוסף, אני אחראית על אפיון דשבורדים של סקרי הוראה וניתוח הנתונים שעולים מהם, ומעורבת בפיתוח נוסחה להערכת מצוינות בהוראה, שצפויה להיכנס לשימוש באוניברסיטה בשנים הקרובות.
הפרויקט שאני הכי גאה בו הוא תהליך ההערכה של 'פרס הרקטור להתחדשות וליצירתיות בהוראה'. את העבודה השוטפת על הפרס מוביל צוות תחום פדגוגיה ופיתוח מקצועי, אבל את תהליך ההערכה הפסיכומטרי עצמו פיתחנו ומובילות בפועל אורטל אנגלברג, ראש התחום, ואני. כל הצעה נבחנת על ידי ארבעה מעריכים בלתי תלויים, מהדקנאט ומסגל הפקולטות, שעוברים הכשרה והתנסות לפני ההערכה, ועובדים עם מחוון מפורט מאוד. השנה הפרס נכנס לשנתו הרביעית, ובעיניי זה אחד מתהליכי ההערכה הרציניים והעקביים ביותר שיש היום באוניברסיטה!
איך הגעת בכלל לעולם הפסיכומטריקה?
זה התחיל בתקופת התואר השני שלי בארצות הברית, כשחיפשתי כיוון לדוקטורט. ידעתי שמבחנים ומדידה מעניינים אותי, אבל עוד לא היה לי ברור שיש לזה תחום מסודר ומובחן. כשהתחלתי לקרוא עבודות של פרופ' גרשון בן־שחר מהאוניברסיטה העברית, פתאום הבנתי שיש לזה שם ושפה – פסיכומטריקה. אני זוכרת את ההתרגשות מהגילוי שיש תחום כזה בדיוק – רגע נדיר שבו קריאה אקדמית לוּותה בעונג אינטלקטואלי.
חזרתי לארץ, עשיתי דוקטורט בהנחייתו, ומאז זה התחום שבו אני עובדת ומתפתחת מקצועית, וגם מרגישה בו בבית. בסופו של דבר, אלה פרויקטים שמאפשרים לי לשלב בין מדידה, הוראה וטכנולוגיה ולעבוד על שאלות שמעניינות אותי באמת.
את עוסקת הרבה בממשק בין פסיכומטריקה לטכנולוגיה. איך זה מתחבר אצלך?
אני אוהבת מאוד את הממשק בין פסיכומטריקה לטכנולוגיה, למרות שאני מחזיקה מעצמי לא מאוד טכנולוגית, והעולם הזה לא תמיד מרגיש לי טבעי – בטח לא כמו אצל צעירים שגדלו לתוכו. דווקא מהמקום הזה, אחת החוזקות שלי היא היכולת לתווך נתונים, גרפים ודשבורדים לאנשים שלא מרגישים בנוח עם העולם הכמותי, או אפילו נבהלים ממנו.
יש לי גם הרבה ניסיון בהוראה – לימדתי כעשר שנים באוניברסיטת רייכמן קורסים בתורת המבחנים ובשיטות מחקר – וזה משפיע מאוד על הדרך שבה אני חושבת על נתונים. בעיניי, פסיכומטריקה טובה היא לא רק חישוב מדויק, אלא היכולת להציג מספרים כך שאפשר להבין אותם ולקבל בעזרתם החלטות מושכלות.
מה את אוהבת במיוחד בתחום? מה מעורר בך סקרנות?
בגלל שאני מזוהה כמישהי "כמותית", זה תמיד קצת מפתיע אנשים שאני גם אוהבת מאוד שירה – גם לקרוא וגם לכתוב. לי זה נראה הכי טבעי: בשניהם יש צורך בדיוק, ויש ניסיון להגיד משהו שהוא במהות מורכב או עמום בצורה מדויקת. בסופו של דבר, אנחנו כל הזמן מכמתים – גם בעבודה וגם בחיים האישיים – לעיתים בלי לשים לב. פסיכומטריקה, מבחינתי, היא ניסיון לעשות את זה במודע, לפי עקרונות ברורים ושקופים, ועם אחריות למה שהמספרים מייצגים.
אם היית צריכה לציין אתגר מרכזי בעבודה פסיכומטרית – מה הוא היה?
האתגר המרכזי בעיניי הוא למצוא את האיזון בין דיוק פסיכומטרי לבין עבודה בתוך מערכת גדולה ומורכבת כמו אוניברסיטת תל אביב. העבודה נעשית בתוך הקשרים מוסדיים, עם צרכים שונים, אילוצים ולוחות זמנים, ולא תמיד יש נתונים מושלמים. האתגר הוא לדעת איפה חשוב להתעקש על עקרונות מקצועיים ברורים ודיוק, ואיפה צריך לקבל החלטות טובות ואחראיות גם על סמך נתונים חלקיים – מתוך הבנה שזו המציאות שבה פועלת מערכת אקדמית גדולה.
אם היית מתבקשת להעביר מסר לצעירים בתחילת דרכם המקצועית בתחום – מה היה הטיפ שלך?
קודם כול צניעות מקצועית. להבין שלמדידה יש מגבלות, ושלא כל הבדל בין ציונים או מדדים באמת מצדיק החלטה שונה. חשוב להכיר בטעויות מדידה, להיות מודעים להטיות שקיימות בכל תהליך הערכה ולהיזהר מהפיתוי לתת למספרים יותר כוח ממה שמגיע להם.
בעיניי, פסיכומטריקה טובה לא עוסקת רק באיך מחשבים נכון, אלא גם באחריות שמגיעה עם השימוש בתוצאות. לדעת לשאול לא רק מה הנתונים אומרים, אלא גם מה הם לא יכולים להגיד, ואילו החלטות נכון או לא נכון לבסס עליהם.





