آزمون‌های تیمز و پرلز

تیمز چیست؟

تعریف کوتاه: تیمز یا Trends in International Mathematics and Science Study یک برنامه پژوهشی بین‌المللی است که به ارزیابی سطح دانش‌آموزان پایه‌های چهارم و هشتم در ریاضیات و علوم در کشورهای گوناگون می‌پردازد.

اهداف اصلی:

اندازه‌گیری روندها و تغییرات انسانی در عملکرد ریاضیات و علوم در سرتاسر جهان.

مقایسه عملکرد بین‌کشوری و تعیین جایگاه نسبی هر کشور نسبت به سایر کشورها.

ارائه داده‌های قابل اعتماد برای سیاست‌گذاری آموزشی و بهبود کیفیت آموزش.

فریم زمانی و دوره‌های مشاهده: تیمز به طور دوره‌ای اجرا می‌شود و نتایج هر دوره می‌تواند با دوره‌های پیشین مقایسه شود تا روندهای بلندمدت مشخص گردد.

نمونه‌های سنی/پایه‌ای: پایه‌های چهارم (10-9 سالگی معمولاً) و هشتم (تقریباً 13-14 سالگی) معمولاً محور اندازه‌گیری هستند.

دامنه‌های محتوایی: ریاضیات و علوم، با پوشش حوزه‌های مفهومی و مهارتی مرتبط با هر پایه.

پرلز چیست؟

تعریف کوتاه: پرلز یا Progress in International Reading Literacy Study یک چارچوب بین‌المللی برای اندازه‌گیری سواد خواندن دانش‌آموزان در پایه چهارم ابتدایی است.

اهداف اصلی:

ارزیابی توانایی‌های بنیادی خواندن، مانند فهم متن، تفسیر، استدلال و کاربرد خواندن در موقعیت‌های مختلف.

مقایسه سطح سواد خواندن بین کشورها و ردیابی روندهای جهانی در طول زمان.

پشتیبانی از سیاست‌گذاری‌های آموزشی برای بهبود مهارت‌های خواندن پایه‌ای که پایه‌های یادگیری‌های بعدی را شکل می‌دهند.

فریم زمانی: پرلز نیز به صورت دوره‌ای برگزار می‌شود و دوره‌های مختلف از طریق ابزارهای استاندارد مقایسه می‌شوند.

نمونه‌های سنی/پایه‌ای: پایه چهارم ابتدایی عمدتاً هدف اندازه‌گیری است.

دامنه‌های محتوایی: مهارت‌های خواندن با تمرکز بر فهم متن، معناشناسی، تحلیل‌های متنی و استفاده از زبان به عنوان ابزار یادگیری.

تفاوت‌ها و اشتراک‌های تیمز و پرلز

اشتراک‌ها:

هر دو پروژه بین‌المللی هستند و به سیاست‌گذاران آموزشی در تصمیم‌گیری‌های مبتنی بر شواهد کمک می‌کنند.

هر دو از اصول روان‌سنجی و مدیریت پروژه‌های پژوهشی بین‌المللی پیروی می‌کنند تا امکان مقایسه دقیق در سطح جهانی را فراهم آورند.

هر دو از نمونه‌گیری‌های نماینده کشورها، ترجمه و استانداردسازی ابزارها، و فرایندهای کیفیت داده‌ها برای حفظ قابلیت اعتماد استفاده می‌کنند.

تفاوت‌ها:

موضوع اصلی: تیمز به ریاضیات و علوم می‌پردازد، در حالی که پرلز به سواد و خواندن مرتبط است.

پایه‌های هدف‌گذاری: تیمز چهارم و هشتم را بررسی می‌کند، پرلز تنها متمرکز بر پایه چهارم است.

نوع مهارت‌ها: تیمز بیشتر به مهارت‌های ریاضی و علمی و استدلال مرتبط می‌پردازد، در حالی که پرلز بر فهم و کاربرد مهارت‌های خواندن متمرکز است.

کاربری‌ها برای سیاست‌گذاری:

تیمز: بهبود کیفیت آموزش ریاضیات و علوم، طراحی رویکردهای آموزشی، و تخصیص منابع برای تقویت حوزه‌های ضعف.

پرلز: بهبود مهارت‌های سواد خواندن پایه‌ای، توسعه برنامه‌های خواندن مدرسه‌محور، و ارتقای انگیزه و دسترسی به متون متنوع.

طراحی و معماری آزمون‌ها

رویکرد طراحی:

استفاده از بانک سؤالات با دامنه گسترده از مفاهیم و مهارت‌ها.

ترکیب سؤالات چندگزینه‌ای، پاسخ کوتاه، و گاهی مسائل باز برای ارزیابی تفکر و استدلال.

استفاده از قالب‌های استاندارد برای مقایسه‌پذیری و قابلیت ترجمه و تطبیق در سراسر جهان.

اعتبار و روایی:

روایی محتوا: بررسی کارشناسان آموزشی برای همسو بودن با چارچوب‌های آموزشی ملی و بین‌المللی.

روایی سازه: ارزیابی اینکه آیا سؤالات به درستی مفاهیم ریاضی، علوم یا سواد خواندن را اندازه‌گیری می‌کنند.

اعتبار سازه‌ای: بررسی اینکه آیا اندازه‌گیری‌های تیمز و پرلز به سطح عمومی از مهارت‌های مرتبط با حوزه آموزشی ارتباط دارند.

پایایی:

ثبات اندازه‌گیری: بررسی اینکه اندازه‌گیری در دوره‌های مختلف یا با نمونه‌های مختلف چقدر پایدار است.

تحلیل خطای اندازه‌گیری و مدل‌سازی برای کنترل اثرات ناهمسانی نمونه‌ها و زبان‌ها.

روش‌های کیفی و کمی: ترکیبی از تحلیل‌های کمی (نمرات، شاخص‌های رفتار اندازه‌گیری) و تحلیل‌های کیفی برای درک زمینه‌های فرهنگی یا آموزشی که بر نتایج تأثیر می‌گذارند.

استانداردسازی و ترجمه:

ترجمه دقیق و تطبیق معانی سؤالات برای جلوگیری از بُعد فرهنگی با حفظ همانیت مفهومی.

تست‌های سطح‌بندی برای تضمین همسانی سطح دشواری سؤالات در زبان‌های مختلف.

سطح‌بندی و نمونه‌های سنی/پایه‌ای

تیمز:

پایه‌های چهارم و هشتم: برای هر پایه، مواد آموزشی و مهارت‌های مورد ارزیابی با سازه‌های متفاوت ارائه می‌شود.

دامنه‌های محتوا: ریاضیات (جبر پایه، هندسه، آمار و داده، محاسبات عددی) و علوم (فهارس، فیزیک پایه، زیست‌شناسی پایه، زمین‌شناسی).

پرلز:

پایه چهارم ابتدایی: تمرکز بر فرآیندهای خواندن، فهم معنای متن، استنتاج، مقایسه و تحلیل متن‌ها.

دامنه‌های محتوا: درک معنایی، استدلال متنی، استفاده از اطلاعات از متون گوناگون و مهارت‌های نقد و تجزیه و تحلیل.

بخش دوم: تاریخچه و هدف‌های بین‌المللی

تاریخچه تیمز

آغاز و معرفی اولیه: تیمز به عنوان بخشی از تلاش‌های بین‌المللی برای سنجش پیشرفت دانش‌آموزان در ریاضیات و علوم آغاز شد تا سیاست‌گذاران از داده‌های مقایسه‌ای برای بهبود سیستم‌های آموزشی استفاده کنند.

گام‌های توسعه:

گسترش دامنه کشورهای شرکت‌کننده و افزایش تنوع فرهنگی و آموزشی.

بهبود روش‌های نمونه‌گیری، ترجمه، و رویکردهای تحلیل داده به منظور افزایش قابلیت تعمیم نتایج.

تأثیرات کلان: تیمز به عنوان منبعی معتبر برای رصد روندهای جهانی در حوزه ریاضیات و علوم شناخته می‌شود و اساس طرح‌های آموزشی و آموزش معلمان در بسیاری از کشورها قرار گرفته است.

تاریخچه پرلز

آغاز و هدف: پرلز با هدف اندازه‌گیری مهارت‌های سواد خواندن در کودکان آغاز به کار کرد تا به سیاست‌گذاران اطلاعاتی بدهد که به بهبود سواد پایه منجر شود.

گام‌های توسعه:

تمرکز بر فهم متن، استنتاج از متن و استفاده از زبان در موقعیت‌های روزمره و آموزشی.

گسترش دامنه شرکت‌کنندگان و همسو کردن ابزارها با استانداردهای بین‌المللی.

تأثیرات کلان: پرلز به تقویت رویکردهای آموزشی مبتنی بر شواهد برای بهبود سواد خواندن کودکان در جهان کمک کرده و به تصمیم‌سازی‌های آموزشی در سطح ملی و بین‌المللی پایگاه داده می‌دهد.

اهداف سیاست‌گذاری آموزشی در سطح جهانی

شناسایی تفاوت‌های بین کشورها در سطح دانش‌آموزی و فهم چالش‌های آموزشی به شکل دقیق.

ارائه مبنای تصمیم‌سازی برای توسعه برنامه‌های آموزشی، منابع، و سیاست‌های آموزشی.

تشویق به پیگیری‌های مستمر برای بهبود کیفیت آموزش و منابع آموزشی با استفاده از داده‌های قابل اعتماد و قابل مقایسه.

تقویت همکاری‌های بین‌المللی در زمینه پژوهش آموزشی و اشتراک تجربه‌های موفق.

 اصول روایی و پایایی

روایی محتوا و روایی سازه

روایی محتوا: اطمینان از اینکه سؤالات به کاملاً بازنمایی مفهوم‌های آموزشی هدف مرتبط هستند.

روایی سازه: بررسی اینکه آیا ابزارها به درستی اندازه‌گیری مهارت‌های مرتبط با حوزه‌های ریاضیات، علوم و خواندن هستند.

روش‌های تأیید روایی:

داوری کارشناسان آموزشی

تحلیل پیوستار مفهومی و هم‌سانی با چارچوب‌های آموزشی ملی و بین‌المللی

تحلیل همبستگی با شاخص‌های آموزشی دیگر

اعتبار و ثبات اندازه‌گیری

اعتبار سازه‌ای و اعتبار همگرایی- تفکیک: اطمینان از اینکه سؤالات به گونه‌ای طراحی شده‌اند که با مفاهیم مرتبط همسو باشند و از لحاظ پاسخ‌دهی به دسته‌های مجزا از مهارت‌ها تلاقی نداشته باشند.

ثبات داخلی: استفاده از معیارهایی مانند α کرونباخ برای ارزیابی پایداری پاسخ‌ها در طول دوره‌های آزمایشی.

ثبات بین زبان‌ها و ترجمه:

اطمینان از اینکه ترجمه‌ها به همان معانی مفهومی و ساختاری پاسخ می‌دهند.

بررسی تطبیقی با نسخه اصلی برای حفظ یکپارچگی داده‌ها.

روش‌های تأمین کیفیت داده‌ها

کنترل‌های کیفیت قبل از اجرا (pilot testing): انجام آزمایش‌های آزمایشی با نمونه‌های کوچکتر برای اصلاح نواقص ابزار.

آموزش مفسران و تیم اجرایی: آماده‌سازی کادر آموزشی برای اجرای استاندارد آزمون‌ها در کشورهای مختلف.

فرایند‌های بازبینی داده و مدیریت خطا:

فیلتر کردن داده‌های نامعتبر یا ناقص

بررسی تکرارپذیری نتایج

بررسی تفاوت‌های ناشی از زبان و ترجمه

استانداردهای اخلاقی و حفظ حریم خصوصی: رعایت حقوق دانش‌آموزان و حفاظت از داده‌های فردی.

 مدل‌های آماری و تحلیل داده‌ها

مدل‌های سطح سه و سطح سه-کشور

مدل‌های چندسطحه: برای تحلیل داده‌های تیمز و پرلز که به صورت داده‌های با ساختار دو سطحی یا سه سطحی هستند، استفاده می‌شود.

سطح‌ها معمولاً شامل:

سطح دانش‌آموز: توانایی‌ها و مهارت‌های فردی

سطح کلاس/مدرسه: محیط آموزشی و منابع مدرسه

سطح کشور/نهاد آموزشی: سیاست‌گذاری و سیستم آموزشی ملی

تحلیل‌های معمول:

مدل‌های خطی مختلط (mixed effects models)

مدل‌های رگرسیون با لحاظ عوامل محیطی و کلاس

استفاده از مدل‌های رشد یا تحلیل‌های تبدیلی برای بررسی روندها در طول زمان

مقیاس‌گذاری و رده‌بندی نمرات

مقیاس‌های بین‌المللی: تبدیل نمرات خام به مقیاس‌هایی که قابلیت مقایسه بین کشورها را فراهم می‌کند.

شاخص‌های نمره: نمرات میانگین، مشخصه‌های توزیع، و معیارهای پراکندگی برای هر کشور و دوره.

رده‌بندی و دسته‌بندی:

تعیین سطوح عملکرد مانند بالا، متوسط، پایین

تحلیل تفاوت‌های قابل توجه بین دوره‌ها و کشورهای مختلف

روش‌های کنترل برای سطح زبان و ترجمه: اطمینان از اینکه تفاوت‌های زبانی به اندازه کافی کنترل می‌شوند تا مقایسه بین کشورها معتبر باشد.

مقایسه‌های بین‌کشوری و تفسیر نتایج

تحلیل‌های تطبیقی: مقایسه نمرات میان کشورها با استفاده از شاخص‌های همسان و کنترل برای تفاوت‌های زمینه‌ای.

تفسیر نتایج:

شناسایی حوزه‌های قوت و ضعف هر کشور در ریاضیات، علوم، و خواندن

بررسی رابطه بین سطح آموزش عمومی و نتایج آزمون‌ها

در نظر گرفتن عوامل فرهنگی، اقتصادی و آموزشی که می‌تواند بر نتایج اثر بگذارد

محدودیت‌های بین‌کشوری:

تفاوت‌های سیستم آموزشی ملی

تفاوت‌های فرهنگی و زبان

تفاوت‌های نمونه‌گیری و مشارکت Schools

نقش اندازه‌گیری سواد و تخصصی بودن سؤالات

طراحی سؤالات تخصصی برای ارزیابی جنبه‌های مختلف مهارت‌های دانش‌آموزان

اهمیت فرمول‌های مهارتی در ریاضیات و درک مفاهیم علمی

اثرات سطح دشواری سؤالات بر پاسخ‌دهی و نمایندگی توان‌های متفاوت

بررسی اینکه آیا سؤالات به اندازه کافی حساس به تفاوت‌های آموزشی میان کشورها هستند

طراحی آزمون و محتوای آزمون‌ها

دامنه‌های محتوایی تیمز

ریاضیات: جبر پایه، هندسه و اندازه‌گیری، آمار و احتمال، عملیات پایه و مفاهیم عددی

علوم: فیزیک پایه، شیمی پایه، زیست‌شناسی پایه، زمین‌شناسی و علوم محیطی

تقسیم‌بندی محتوا به دسته‌های مهارتی مانند:

تفکر نقاد و استدلال

حل مسئله و مدل‌سازی

کاربرد مفاهیم در موقعیت‌های واقعی

معماری سؤالات تیمز معمولاً شامل:

سؤالات چندگزینه‌ای با پاسخ‌های منحصر به فرد

سؤالات با پاسخ کوتاه برای ارزیابی توضیحات و استدلال

برخی سؤالات مشکل‌دار یا مسائل باز برای ارزیابی تفکر سطح بالا

دامنه‌های محتوایی پرلز

مهارت‌های خواندن: درک معنایی، استنتاج، تحلیل متون، استدلال از متن و بازخوانی

زبان و سبک‌های مختلف نویسندگی: متون داستانی و غیر داستانی برای پوشش گسترده‌ای از سبک‌های نگارشی

تعامل با متن‌های گوناگون: مقالات علمی ساده، متن‌های ادبی و متون مرتبط با زندگی روزمره

ترکیب سؤالات با تصاویر و متن برای ارزیابی توانایی‌های چندحسی و چندرسانه‌ای در خواندن

اصول طراحی سؤالات

همسانی با چارچوب‌های آموزشی ملی و بین‌المللی

پوشش گسترده مفاهیم و مهارت‌های کلیدی

سطح دشواری مناسب برای هر پایه و حوزه

ایجاد سازه‌های پاسخ‌دهی قابل ترجمه به زبان‌های گوناگون

پایش مداوم برای پاسخ‌دهی عادلانه و جلوگیری از سوگیری ابزار

رعایت استانداردهای اخلاقی و حفاظت از داده‌های شرکت‌کنندگان

نمونه‌ای از سؤالات و کلاس‌های سطح دشواری

تیمز (مثال):

سوالات با نیاز به استدلال منطقی در حل مسائل ریاضی

سوالاتی درباره فهم اصول علمی پایه با استفاده از نمودارها

پرلز (مثال):

سوالاتی که از خواندن یک متن کوتاه می‌خواهند که مفهوم کلیدی را تشخیص داده و از متن برداشت کنند

سوالاتی که به خواندن متن‌های متنوع و استفاده از اطلاعات برای پاسخ‌دهی نیاز دارند

 پیاده‌سازی و مدیریت پروژه‌های بین‌المللی

فرایند نمونه‌گیری و نمایندگی

نمونه‌گیری از مدارس به صورت نماینده از جمعیت کشور

رعایت تنوع جغرافیایی، اقتصادی و فرهنگی در داخل کشور

کنترل‌های کیفی برای اطمینان از نمایندگی مناسب

ارائه گزارش‌های دقیق درباره نحوه نمونه‌گیری و اندازه نمونه

زبان‌ها و ترجمه

ترجمه دقیق و با ثبات از زبان اصلی به زبان‌های هدف

هماهنگی بین ترجمه و معنای مفهومی سؤالات

بررسی‌های پشتیبان برای حفظ کیفیت داده‌ها across زبان‌های مختلف

زمان‌بندی و مدیریت پروژه

ایجاد تقویم اجرا برای هر دوره آزمون

هماهنگی بین‌ال ملی با تیم‌های محلی

مدیریت مجموعه داده‌ها، نگهداری و انتقال به مرکز داده بین‌المللی

گزارش‌دهی منظم به رهبران آموزشی و سیاست‌گذاران

 تجزیه و تحلیل نتایج برای سیاست‌گذاری

کارکردهای آموزشی و شاخص‌های عملکرد

شاخص‌های کارکردی در ریاضیات، علوم و خواندن

تحلیل روندهای بلندمدت و تغییرات دوره‌ای

شناسایی مناطقی که بهبود یافته‌اند و مناطقی که نیاز به توجه دارند

تشخیص نقاط ضعف و قوت سیستم‌های آموزشی

تحلیل تفاوت‌های بین مدارس، مناطق و گروه‌های اجتماعی

تحلیل اثرات منابع آموزشی، آموزش معلمان و سیاست‌های مدرسه‌ای

بررسی عوامل مدرسه‌ای و جامعه‌ای که به بهبود یا کاهش عملکرد منجر می‌شود

مقایسه‌های تطبیقی با سایر کشورها

مقایسه‌های بین‌کشوری بر پایه معانی مشترک و داده‌های همسان

تحلیل نمودارها و جداول برای ارائه تصویری روشن از جایگاه کشورها در سطح جهانی

استفاده از نتایج برای الهام از اصلاحات سیاستی

گزارش‌دهی به سیاست‌گذاران و رهبران آموزشی

ارائه گزارش‌های مختصر و مفید برای مدیران مدارس و مسئولین آموزشی

ارائه راهبردهای عملی برای ارتقای کیفیت آموزش و منابع

ایجاد ابزارهای تصمیم‌گیری با داده‌های تیمز و پرلز

بخش هشتم: بحث درباره پژوهش‌های مرتبط با تیمز و پرلز

علل پایین بودن نمرات

موانع آموزشی در سطح مدرسه، آموزش معلمان و منابع مدرسه

اثرات فقر، تفاوت‌های دسترسی به منابع آموزشی و محیط خانواده

عوامل فرهنگی و زبان در کشورهای با پس‌زمینه‌های مختلف

نقش عوامل مدرسه‌ای مانند مدیریت مدرسه، تعهد معلم و انگیزه دانش‌آموزان

رابطه سواد خواندن با عملکرد تحصیلی در پرلز و تیمز

رابطه بین مهارت‌های خواندن و عملکرد در ریاضیات و علوم

تأثیر سواد خواندن پایه بر موفقیت در یادگیری سایر دروس

نقش سواد خواندن در درک مفاهیم علمی و توانایی استدلال

مطالعات مقایسه‌ای با کشورها

بررسی تفاوت‌های ساختاری در سیستم‌های آموزشی که منجر به تفاوت‌ها می‌شود

تحلیل استراتژی‌های آموزشی که به بهبود نمرات کمک کرده‌اند

در نظر گرفتن تفاوت‌های فرهنگی و اقتصادی که بر مشارکت و عملکرد اثر می‌گذارند

چالش‌ها، محدودیت‌ها و پیشنهادها

چالش‌های فرهنگی و زبانی

تفاوت‌های زبان و ترجمه که می‌تواند بر پاسخ‌دهی و مقایسه تأثیر بگذارد

تفاوت‌های فرهنگی در نگرش به آزمون و شرکت در آن

ساعات آموزشی و شیوه‌های تدریس که می‌تواند بر نتایج اثر بگذارد

محدودیت‌های فنی و آماری

محدودیت‌های نمونه‌گیری و نمایندگی

اثر خطای اندازه‌گیری و تفاسیر آماری

محدودیت‌های مربوط به زمان‌بندی و منابع داده

پیشنهادهای بهبود برای پژوهش‌های آینده

بهبود طراحی سؤالات به منظور پوشش دامنه‌های بیشتری از مهارت‌ها

توسعه مدل‌های آماری پیشرفته برای تحلیل چندسطحه‌ای و روندهای زمانی

بهبود فرایند ترجمه و استانداردسازی برای مقایسه‌های بین‌زبان‌های بیشتر

افزایش مشارکت کشورهای بیشتر و نمایندگی‌های فرهنگی متنوع

 نتیجه‌گیری

آزمون‌های تیمز و پرلز ابزارهای اساسی برای ارزیابی کیفیت آموزش در سطح جهانی هستند.

تیمز به بررسی پیشرفت در ریاضیات و علوم در پایه‌های چهارم و هشتم می‌پردازد، در حالی که پرلز پایه چهارم را به صورت ویژه در زمینه سواد خواندن ارزیابی می‌کند.

این آزمون‌ها به سیاست‌گذاران آموزشی کمک می‌کنند تا روندهای آموزشی را پیگیری کنند، نقاط ضعف و قوت را شناسایی کنند و برای بهبود سیستم‌های آموزشی خود اقدام کنند.

با وجود برخی محدودیت‌ها، تحلیل داده‌های تیمز و پرلز با مدل‌های آماری صحیح و طراحی دقیق سؤالات می‌تواند به تصمیم‌گیری‌های بهینه در سطح ملی و بین‌المللی منجر شود.

منابع و مراجع

مجموعه منابع بین‌المللی مربوط به تیمز و پرلز

مقالات علمی منتشر شده در مجلات آموزشی درباره علل پایین بودن نمرات، رابطه سواد خواندن با عملکرد درسی، و مقایسه تطبیقی با کشورهای دیگر

راهنماهای فنی تیمز و پرلز برای مدیران آموزشی و پژوهشگران

Appendix یا پیوست‌ها (در صورت نیاز)

جداول نمونه نتیجه‌ها و شاخص‌های اصلی تیمز و پرلز برای سال‌های مختلف

مدل‌های آماری نمونه برای تحلیل داده‌های چندسطحه‌ای

الگوهای گزارش‌گری برای سیاست‌گذاران و مدیران آموزشی

چک‌لیست‌های کیفی برای ارزیابی کیفیت داده‌ها و ترجمه‌ها

توضیحات تکمیلی برای نگارش کامل:

این سند را می‌توانید به فرمت PDF تبدیل کنید. برای هر بخش، می‌توانید تصاویر نموداری، جداول و نمودارهای مسیر روند را اضافه کنید تا گزارش شما به صورت بصری قابل درک باشد.

می‌توانید بخش‌های بیشتری به تفصیل اضافه کنید، مانند مطالعات موردی کشورهای خاص، نقشه مفهومی از فرایند اجرای تیمز و پرلز، و فهرست اصطلاحات کلیدی با توضیحات دقیق.

همچنین می‌توانید یک نسخه دو زبانه (فارسی-انگلیسی) از سند آماده کنید تا متن قابل استفاده برای پژوهشگران و سیاست‌گذاران بین‌المللی باشد