تدوین و هنجاریابی آزمون پیشرفت تحصیلی زیست‌شناسی

نوع مقاله : مقاله پژوهشی

نویسندگان

1 دکتری سنجش و اندازه گیری؛ دبیر زیست شناسی دبیرستان باقرالعلوم، آموزش و پرورش ناحیه 4

2 استاد روانشناسی تربیتی، عضو هیات علمی دانشکده روانشناسی و علوم تربیتی دانشگاه شیراز

چکیده

هدف پژوهش حاضر، تدوین و هنجاریابی آزمون زیست ‏شناسی پایه دهم دوره متوسطه به‌منظور اندازه ‏گیری سطح آموخته ‏ها و تعیین پراکندگی پیشرفت تحصیلی دانش ‏آموزان در این ماده درسی بود. برای نیل به هدف کلی تحقیق، هر دو مدل کلاسیک آزمون و نظریه سؤال- پاسخ مورد استفاده قرار گرفت. ابزار اولیه پژوهش شامل 150 سؤال چهارگزینه‌ای از محتوای زیست‌شناسی پایه دهم رشته تجربی بود که بر روی نمونه‌ای به حجم 300 دانش‌آموز دختر و پسر اجرا شد. به دنبال تجزیه‌وتحلیل سؤال‌های آزمون فرم‌های نهایی آزمون تدوین شد. ابزار نهایی دو فرم موازی50 سؤالی بود که بر روی نمونه هنجاری به حجم 938 دانش‌آموز دختر و پسر شهرستان شیراز اجرا گردید. ضریب پایایی برآورد شده برای ثبات درونی فرم‌های آزمون به ترتیب 0/89 و 0/88 به دست آمد. بر اساس تحلیل عاملی، هر دو فرم آزمون از یک عامل کلی اشباع بودند. نتایج نشان داد که بین میانگین نمرات پسران و دختران تفاوت معناداری وجود ندارد؛ بنابراین هنجارهای استاندارد و هم صدک برای همه آزمودنی‌ها محاسبه شد. یافته‌های حاصل از تجزیه‌وتحلیل نظریه سؤال-پاسخ نشان داد که بیش از 92 درصد از سؤال‌ها به‌طور قابل‌توجهی با مدل لجستیک سه پارامتری برازش دارند. تابع آگاهی برآورد شده آزمون یک منحنی زنگوله‌ای شکل بود و در محدوده توانایی 0.5- تا 2.5+ بیشترین اطلاعات را ارائه می‌داد؛ همچنین حداکثر میزان آگاهی دهندگی فرم‌های آزمون در سطح توانایی 1.5+ به دست آمد که نشان می‌دهد آزمون تدوین‌شده تخمین دقیق‌تری از نمره واقعی آزمودنی‌هایی ارائه می‌دهد که سطح توانایی آن‌ها بالاتر از متوسط پیوستار توانایی است.

کلیدواژه‌ها


امبرتسون، سوزان ای. و استیون، پی. رایس (2000). نظریه های جدید روانسنجی برای روان شناسان. ترجمه حسن پاشا شریفی، ولی الله فرزاد و همکاران (1388). تهران: رشد.
ثرندایک، رابرت، ال. (1982). روان‏سنجی کاربردی. ترجمه حیدر علی هومن (1369). تهران: موسسه انتشارات و چاپ دانشگاه تهران.
سازمان پژوهش و برنامه‌ریزی آموزشی، دفتر برنامه‌ریزی و تألیف کتب درسی. (1389). راهنمای برنامه درس زیست‌شناسی، تهران: مؤلف
سیف، علی‌اکبر. (1384). سنجش فرایند و فراورده یادگیری. تهران: دوران.
دفتر همکاری‌های علمی بین‌المللی وزارت آموزش‌وپرورش. (1379). مجموعه گفتارهای ارزشیابی در آموزش. تهران: مؤلف.
کیامنش، علیرضا. (1376). گزارش سنجش عملکرد در سومین مطالعه بین المللی ریاضی و علوم سال چهارم ابتدایی و سوم راهنمایی. تهران: وزارت آموزش و پرورش.
گلاور، جان ای و برونینگ، راجر اچ. (1375). روان‌شناسی تربیتی، اصول و کاربرد آن. ترجمه علینقی خرازی (1375). تهران: مرکز نشر دانشگاهی
گیج، نیت، ل؛ و برلانیر، دیوید، سی. (1374). روان‌شناسی تربیتی. ترجمه غلامرضا خوی نژاد. مشهد: حکیم فردوسی.
هومن، حیدر علی. (1372). اندازه‌گیری‌های روانی و تربیتی. تهران دیبا.
Abraham, M. R., Williamson, V. M. & Westbrook, S. L. (1994). A cross-age study of the understanding five concepts, Journal of Research in Science Teaching, 31 (2): 147-165.
Alele-Williams, G. (2002). Measurement and evaluation in mathematics: The way forward. Journal of basic sciences, 1(1):1-7
American Educational Research Association, American Psychological Association, & National Council of Measurement in Education. (2014). Standards for educational and psychological testing. Washington, DC: Authors
Baker, J.O. (2003). Testing in modern classroom. London: George. Allen and Unwin
Birnbaum, A. (1968). Some latent trait models and their use in inferring an examinee’s bility. In F. M. Lord & M. R. Novick, Statistical theories of mental test scores (pp. 397-472). Reading, MA: Addison-Wesley.
Black, Paul; Harrison, Christine; Lee, Clara; Marshall, Bethan and William, Dylan (2003). Assessment for Learning- putting it into practice. Maidenhead, U.K.: Open university Press.
Cizek,  Gregory  J. (1993). Testing for Learning: A Remonstrance. Educational Measurement: Issues and Practice, Volume 12(4): 40-42.
Crooks, T.J. (1988) ‘The impact of classroom evaluation practices on students’, Review of Educational Research, 58: 4.
de Ayala, R. J. (2009). The Theory and Practice of Item Response Theory, New York: Guilford Publications, Inc.
DeMars, Christine (2010). Item Response Theory. New York: Oxford University Press, Inc.
Faulkner‑Bond Molly and Wells Craig S. (2016). A Brief History of and Introduction to Item Response Theory.  In Ronald K. Hambleton and Stephen G. Sireci (Ed.). Educational measurement. New York: The Guilford Press.
Frederiksen, N. (1984) ‘The real test bias: Influences of testing on teaching and learning’, American Psychologist, 39(3): 193–202.
Gipps, C.V. (2003). Beyond Testing: Towards a Theory of Educational Assessment, London: Washington, D.C. Taylor & Francis e-Library.
Gronlund, N. E. (1988). How to Construct Achievement Tests (4th ed.). Englewood Cliffs, NJ: Prentice-Hall, Inc.
Gulliksen, H. (1950). Theory of mental tests. John Wiley & Sons Inc.
Hambleton, R. K., Rogers, H. J., & Swaminathan, H. (1991) Fundamentals of item response theory, Newbury Park, Cliff: Sage Publications
Hambleton, R.K. (1989). Principles and selected applications of item- response theory. In R. Linn (Ed.) Educational measurement, (3th ed.). New York: American Council on Education
Hambleton, R.K.& Cook, L.L. (1977). Latent trait models and their use in the analysis of educational test data, Journal of Educational Measurement, 14: 75-96.
Helmstadter, G. C. (1964). Principles of Psychological Measurement. New York: Appleton Century Crofts.
InternationaL Student Achievement in the TIMSS (2011). Science Content and Cognitive Domains. chapter 3, TIMSS & PIRLS International Study Center. Lynch school of education, Boston College.
Isaacs, T., Zara, C., Herbert, G., Coombs, S. and Smith, C. (2013) Key Concepts in Educational Assessment. SAGE Publications Ltd.
Kaplan, Robert M. and Saccuzzo, Dennis P. (2018). Psychological testing: Principles, applications, and issues, (9th ed.). Boston: Cengage Learning.
Linn, R. (2000). Assessment and accountability.  Educational Researcher, 29(2): 4-16.
Mehrens, W. A. and Lehman, H. J. (1986). Using Standardized Test in Education. (4th ed). New York : Longman.
Pellegrino, J. W., Chudowsky, N.  and Glaser, R. (Eds.). (2001) Knowing what Students Know :The Science and Design of Educational Assessment . Washington, DC. National Academy Press.
Peterson, R. F. & Treagust, D. F. (1989). Grade-12 students’ misconceptions of covalent bonding and structure, Journal of Chemical Education, 66 (6): 459-460.
Phelps, Richard P. (2012). The Effect of Testing on Student Achievement, 1910–2010. International Journal of Testing, 12: 21–43.
Popham, J. (1987) ‘The merits of measurement-driven instruction’, Phi Delta Kappa, 5: 679–82.
Salmon-Cox, L. (1981). Teachers and standardized achievement tests: what's really happening? Phi Delta Kappan, 62(10): 730-736.
Simon, M., Ercikan, K., Rousseau, M., (2013). Improving large-scale assessment in education :theory, issues and practice . New York & London: Routledge Flamer.
Urry, V. W. (1977) Tailored testing: a successful application of latent trait theory. Journal of Educational Measurement, 14(2): 181-196
Vale, C. D. and Gialluca K.  (1985) ASCAL: A Microcomputer Program for Estimating Logistic IRT Item Parameters. Computer Science