12 research outputs found

    Svenska lÀrares syn pÄ avvikelser mellan resultat pÄ nationella prov och Àmnesbetyg

    Get PDF
    Since 2018, Swedish teachers are expected to pay particular attention to pupils’ results on national tests when grading. There are, however, still large discrepancies between national test results and teachers’ grades, which differ between schools and subjects. The purpose of this study is to investigate possible reasons behind these differences, from a teacher perspective. The study is based on semi-structured interviews with teachers who teach grade 9, either in physics (n=9) or English (n=12). The interviews have been transcribed and analyzed with thematic content analysis. The most important reason for differences is that the test results are considered misleading by the teachers. Although most reasons for considering the test results as misleading relate to test design, some of the reasons relate to the pupils. The only reason for differences that does not relate to test results being considered misleading, is that some pupils receive instruction at the end of the semester based on their shortcomings identified in the test. Furthermore, since the teachers tend to compare test results and own grades in a 1:1 ratio, they may discard the entire test if it is considered misleading. The fact that test results are presented as a single score or grade, therefore, seems to contribute to teachers not paying particular attention to test results when grading

    The Economic Value of Social and Emotional Learning

    Get PDF
    There is a growing body of research emphasizing the advantages of teaching students social and emotional (SE) skills in school. Here we examine the economic value of these skills within a benefit-cost analysis (BCA) framework. Our examination has three parts. First, we describe how the current method of BCA must be expanded to adequately evaluate SE skills, and we identify important decisions analysts must make. Second, we review the evidence on the benefits of SE skills, again noting key methodological issues with respect to shadow pricing. Finally, we perform BCA of four selected social and emotional learning (SEL) interventions: 4Rs; Second Step, Life Skills Training; and Responsive Classroom. These analyses illustrate both methodological and empirical challenges in estimating net present values for these interventions. Even with these challenges, we find that the benefits of these interventions substantially outweigh the costs. We highlight promising areas of research for improving the application of BCA to SEL

    A Benefit-Cost Analysis of a Long-Term Intervention on Social and Emotional Learning in Compulsory School

    Get PDF
    There is growing evidence that social and emotional skills can be taught to students in school and teaching these skills can have a positive effect on later outcomes, such as better mental health and less drug use. This paper presents a benefit-cost analysis of a longitudinal social and emotional learning intervention in Sweden, using data for 663 students participating in the evaluation. Intervention costs are compared against treatment impact on self-reported drug use. Pre-test and post-test data are available. Since follow-up data for the participantsÂŽ drug use as adults is not available, informed projections have been made. Net present monetary values are calculated for the general public and society. The results show that students in the treatment group report decreasing use of drugs over the five year long intervention, the value of which easily outweighs the intervention costs

    Taking test results “into consideration” when grading

    No full text
    In Sweden, where this study is situated, grades are high stakes for students. Grades are the only criteria used for selecting students as they leave compulsory school and apply for upper-secondary school. When students apply for higher education, selection is also made based on the “Swedish Scholastic Aptitude Test”, but a minimum of one third of the seats (often more) are based on grades. Given that it is the individual teacher who synthesizes students’ performances into a grade, and that the reliability of teachers’ grades has been questioned (e.g., Swedish National Agency of Education (SNAE), 2019), this is a problematic situation which can potentially have a significant influence on the lives of thousands of students each year. Measures have been taken to increase the agreement in teachers’ grading, most recently by legally requiring that teachers in primary and secondary education take results from national tests “into consideration” when grading. This relatively loose strategy of taking test results “into consideration” has not yet yielded any observable change in teachers’ grades, however, and there is still a large discrepancy between teacher-assigned grades and test results for most subjects (SNAE, 2019)1. For example, the proportion of students whose grades correspond to their test results varies between 61-73 percent in the various subjects. Furthermore, it is more common that the teacher-assigned grades are higher than the test results, as compared to the other way around (with the exception of English as a foreign language, EFL). There are also gender differences, where girls to a slightly higher degree than boys receive grades that are higher in comparison with their test results. There are also large variations between schools. The question in focus here is how this difference between teacher-assigned grades and test results originate and why it persists, which is investigated from a teacher perspective

    Scaffolding or simplifying : students’ perception of support in Swedish compulsory school

    No full text
    National goals and performance standards were introduced in Sweden during the 1990sas part of a curriculum reform. The intention was to detect shortcomings among studentsand provide support to those students who did not reach the passing grade in one (orseveral) subject/s. Despite this reform, approximately one-fourth of the students do notattain a passing grade in all subjects. This study therefore investigates the supportprovided to low-achieving students in Swedish compulsory school. A questionnairefocusing on support in science studies was distributed to students in grade 9 (N =1731), and data was analyzed with confirmatory factor analysis and structural equationmodeling. Findings show that low-achieving students perceive that they primarily receive“simplifying support,” which involves the lowering of expectations and limiting ofstudents’ opportunities to learn. “Scaffolding support,” which involves changes to practicesand holding the same standards for all students, seems to be mainly provided toboys, regardless of achievement level

    Betygens geografi : forskning om betyg och summativa bedömningar i Sverige och internationellt. Delrapport frÄn skolforsk-projektet

    No full text
    Den hĂ€r forskningsöversikten om betyg bygger pĂ„ en lĂ€sning av över 6000 abstracts ca 500 artiklar och ett 40 tal avhandlingar. De artiklar vi gĂ„tt igenom Ă€r vetenskapligt granskade och publicerade i vetenskapliga tidskrifter. VĂ„ra sökningar och urval har varit systematiska. Rapporten Ă€r uppbyggd kring fyra olika resultatkapitel kopplande till projektets fyra övergripande frĂ„gestĂ€llningar. I kapitel 1 studeras hur betyg ur ett elevperspektiv pĂ„verkar sjĂ€lvbild, motivation och lĂ€rande. I kapitel 2 har vi sammanstĂ€llt forskning om betyg ur ett lĂ€rarperspektiv, hur och vad lĂ€rare betygsĂ€tter och hur betyg pĂ„verkar undervisning. Kapitel 3 handlar om betyg som styrinstrument pĂ„ olika nivĂ„er i utbildningssystemet, framför allt nationell nivĂ„. I kapitel 4 har vi beskrivit betyg ut olika komparativa perspektiv och studerat den forskning som finns dĂ€r jĂ€mförelser sker mellan olika betygssystem och betyg och bedömning i ett internationellt perspektiv. Vi gör ocksĂ„ en egen jĂ€mförelse av hur betygssystemen ser ut i Europa. Den första delstudien har undersökt forskning om hur summativa bedömningar pĂ„verkar elevernas lĂ€rande, motivation för lĂ€rande och prestationer och vilka resultat den genererat. I delstudien ser vi att resultaten frĂ„n de granskade artiklarna till viss del Ă€r samstĂ€mmiga. Vuxna högpresterande studenter verkar pĂ„verkas positivt i sitt lĂ€rande och prestationer av feedback som innehĂ„ller mycket information som kommer i direkt anslutning till uppgiften. Informationen bör ocksĂ„ vara positiv. Samtidigt framkommer det att vuxna studenter inte pĂ„verkas negativt om feedback kommer i form av betyg. Detta förklaras av att vuxna studenter pĂ„ universitetsnivĂ„ ”kan” systemet och har lĂ„ng erfarenhet av summativa bedömningar och har utvecklat strategier för att hantera detta system samt att de Ă€r högpresterande. DĂ€remot verkar det vara annorlunda för yngre elever och nĂ€r representativa urval undersöks. En slutsats som kan dras av resultaten frĂ„n de inkluderade studierna Ă€r att betyg generellt differentierar och pĂ„verkar Ă€ldre och yngre elever och lĂ„g- och högpresterande elever pĂ„ olika sĂ€tt. LĂ„gpresterande och yngre elever verkar pĂ„verkas mer negativt av betygsĂ€ttning jĂ€mfört med Ă€ldre och högpresterande elever. Ålder och erfarenheter av bedömning tycks spela en stor roll för hur elevers lĂ€rande, motivation för lĂ€rande och prestationer pĂ„verkas av betygsĂ€ttning. Den andra delstudien handlar om hur och vad lĂ€rare betygsĂ€tter och hur betyg pĂ„verkar undervisning. Vi har studerat internationell respektive svensk forskning för att beskriva skillnader dem. Gemensamt Ă€r att validitetsfrĂ„gan Ă€r central men hĂ€ri ligger ocksĂ„ skillnaden. I svensk forskning Ă€r det relationen mellan lĂ€rarens betygsĂ€ttning och styrdokumenten som dominerar perspektivet. Utanför Sverige Ă€r det framförallt frĂ„gan om vad lĂ€raren bedömer som dominerar, t.ex. elevens kunskaper eller personliga egenskaper. Att lĂ€rares dagliga verksamhet pĂ„verkas av betygens inflytande Ă€r mer framtrĂ€dande i den svenska forskning vi funnit. HĂ€r Ă€r det framförallt godkĂ€ntgrĂ€nsen som problematiseras men Ă€ven hur betyg tar tid frĂ„n lĂ€rarens pedagogiska arbete. Betygens inverkan pĂ„ lĂ€rarens undervisning Ă€r dĂ€remot inte centralt i forskningen utanför Sverige. DĂ€r dominerar istĂ€llet kritiken mot ett ökat inflytande av high-stakes tester och hur lĂ€rare upplever dessa som meningslösa i sin undervisning. Standardisering av betygsĂ€ttningen och high-stakes tester ses som ett problem som kan riskera lĂ€rares möjlighet att verka som professionella bedömare. Över huvud taget framkommer i de studier som tar upp betygens dilemman en spĂ€nning mellan styrning och kontroll och pedagogiska aspekter av lĂ€rarens bedömning. I den tredje och fjĂ€rde delstudien har vi gĂ„tt mer explorativt tillvĂ€ga, dĂ„ det inte funnits internationell forskning som primĂ€rt fokuserat betyg ur styrperspektiv. I delstudie tre fann vi tre centrala teman om betyg ur styrperspektiv: 1) Betyg ur rĂ€ttvise- och jĂ€mlikhetsperspektiv, 2) Betyg som kunskaps- och urvalsmĂ„tt, 3) Betyg som high-stakes i bedömnings- och utvĂ€rderingssystem. Det tredje temat gjordes till en inramning för de andra tvĂ„. Den forskning som berörde första temat poĂ€ngterade bland annat att betygssystem mĂ„ste sĂ€ttas in i ett större perspektiv av ett rĂ€ttvist bedömnings- och utvĂ€rderingssystem, med instrument för att följa upp rĂ€ttviseaspekter i relation till olika elevgrupper m.m. Studierna poĂ€ngterade vikten av transparens i systemen, sĂ„ att grunder för bedömning och utvĂ€rdering liksom existerande orĂ€ttvisor blir synliga för systemets aktörer. KunskapsfrĂ„gan lyftes ocksĂ„ fram som central, det Ă€r lĂ€tt att anta att det som stĂ„r i lĂ€roplanen – den kunskap som bedöms – Ă€r neutralt, men kunskapen har alltid konsekvenser och olika konsekvenser för olika grupper av elever. NĂ€r det gĂ€llde tema tvĂ„ var ett tydligt resultat att betygens roll i mĂ„nga utbildningssystem reducerats de senaste decennierna. Samtidigt visar genomgĂ„ngen av betyg ur ett systemperspektiv att betyg Ă€r bĂ€ttre som urvalsinstrument för högre utbildning jĂ€mfört högskoleprov och andra liknande tester. I synnerhet kursbetyg pĂ„ gymnasienivĂ„ som ges med stor bredd och i hög frekvens har en god predikativ förmĂ„ga. Detta visar att betyg kan fylla viktiga funktioner i ett utbildningssystem och det pĂ„ ett bĂ€ttre sĂ€tt Ă€n andra instrument, och att den utveckling som man sett internationellt mot allt mer centralt administrerade examens- och antagningsprov inte bör anammas okritiskt. Den fjĂ€rde delstudien fokuserar betygen ur olika komparativa perspektiv. Det vi fokuserat pĂ„ Ă€r vad betyg jĂ€mför samt hur olika betygssystem jĂ€mförs med varandra pĂ„ nationell och internationell nivĂ„. NĂ€r vi söker pĂ„ bedömning och internationella jĂ€mförelser ser vi att betyg inte fĂ„r en sĂ€rskilt framtrĂ€dande plats i artiklarna. I huvudsak Ă€r det tre omrĂ„den forskarna fokuserar vid dessa jĂ€mförelser: system för accountability; kulturella förklaringar till varför bedömnings- och betygssystem ser olika ut i olika lĂ€nder; variationer mellan olika lĂ€rares bedömningar i olika Ă€mnen eller av olika elevgrupper. NĂ„gra viktiga iakttagelser i vĂ„r genomgĂ„ng Ă€r att det lĂ€nge funnits en internationell trend mot att upprĂ€tta olika system för ökad ansvarsskyldighet (accountability) för skolans resultat. Dessa resultat mĂ€ts frĂ€mst i elevprestationer pĂ„ test eller i betyg. SĂ„vĂ€l kritiska forskare som OECD har dock pĂ„ senare tid noterat, att förhoppningarna om att jĂ€mförelser av skolors resultat ska leda till resultatförbĂ€ttringar har varit överdrivna. De system olika lĂ€nder har för bedömning och accountability förklarar i princip ingenting av variationen i PISA resultat. Det Ă€r snarare vad lĂ€rarna gör i klassrummet som har betydelse och lĂ€rare ha svĂ„rt att dra slutsatser om vad de bör göra utifrĂ„n de resultat som tillgĂ€ngliggörs via accountability-modeller. Modellerna har sĂ€llan rĂ€tt informationsnivĂ„ för didaktiska slutsatser. I kapitel 4 gör vi ocksĂ„ en egen jĂ€mförelse av betygssystem i Europa i barn- och ungdomsskolan. Det första vi kan konstatera Ă€r att informationslĂ€get Ă€r vĂ€ldigt komplicerat. Det finns inte standardiserade data pĂ„ detta varför alla jĂ€mförelser behöver bygga pĂ„ komplicerat klassificeringsförfarande, dĂ€r det ibland uppstĂ„r tolkningsproblem. Detta Ă€r inte bara ett problem för oss utan det finns i alla de jĂ€mförelser och hĂ€nvisningar till hur det ser ut i andra lĂ€nder som ocksĂ„ görs i den offentliga debatten om betyg. Enkla listor över nĂ€r betyg ges i Ă„lder eller i hur mĂ„nga skalsteg som anvĂ€nds Ă€r ganska meningslös information utanför sitt kulturella och strukturella sammanhang. Baserat pĂ„ vad vi har fĂ„tt fram i den hĂ€r översikten har vi nĂ„gra rekommendationer. Det finns tydliga resultat som Ă„tminstone bör mana till försiktighet om att vidare sĂ€nka Ă„ldern för betyg. FrĂ„gan Ă€r ocksĂ„ pĂ„ vilket sĂ€tt utblickar mot andra lĂ€nders betygsstart kan hjĂ€lpa oss att ta kloka beslut om nĂ€r vi ska börja med betyg, dĂ€r vi efterlyser att man pĂ„ policy nivĂ„ i sĂ„ fall gĂ„r mer pĂ„ djupet och identifierar principer för bedömning som mer har med klassrummet att göra. Flera lĂ€nder ger exempelvis lĂ€rare och skolor stor autonomi över hur bedömningarna i tidiga Ă„ldrar ska tillĂ€mpas, vilket kan tĂ€nkas ha positiva konsekvenser för lĂ€rares professionalitet i frĂ„gan. Det Ă€r ocksĂ„ viktigt att det svenska nuvarande betygssystemet bĂ€ttre utvĂ€rderas pĂ„ ett nyanserat sĂ€tt i förhĂ„llande till olika lĂ€rare, Ă€mnen och elevgrupper. Betyg fungerar inte lika för alla. Det Ă€r ocksĂ„ viktigt att fundera över hur vi utvĂ€rderar elevers resultat och om det finns möjlighet att kombinera fler modeller med varandra, sĂ„ att vi bĂ€ttre kan fĂ„ data av ”value added”-karaktĂ€r samt för att följa kunskapsutvecklingen över tid. Studien visar ocksĂ„ pĂ„ flera olika plan vilka svĂ„righeter det finns med översĂ€ttning av forskningsresultat och information om utbildningssystem mellan olika lĂ€nder och kontexter. VĂ„r studie pekar pĂ„ att lĂ€rarnas autonomi över bedömningssystemen, oavsett hur de ser ut, Ă€r det som kanske har störst betydelse. Att lĂ€rarna har verktyg som de kan anvĂ€nda i bedömning av elevernas kunskaper och i kommunikationen kring dessa kunskaper som lĂ€rarna sjĂ€lva upplever Ă€r meningsfulla och som gagnar den pedagogiska processen. DĂ€rför Ă€r det ocksĂ„ av stor vikt att lĂ€rare ges möjlighet till fortbildning kring betyg och bedömning och att det kanske blir ett Ă€nnu mer markerat inslag i lĂ€rarutbildningen.This systematic research review about grades and summative assessments are based on a reading of over 6000 abstracts, 500 articles and about 40 theses. The articles we have read are peer reviewed and published in scientific journals. Our searches and selections have been systematic. The report is structured around four different chapters linking to the project's four overarching issues. In Chapter 1 we study how grades/marks from a student perspective affects self-image, motivation and learning. In Chapter 2, we have compiled research on grading/marking from a teacher's perspective, how and what teachers think of this and how grading affect teaching. Chapter 3 deals with grades and summative assessment as control instruments at different levels of the education system. In Chapter 4 we describe grading from various comparative perspectives. We also do our own comparison of how the different grading and assessment systems look like in Europe. In the first Chapter, we see that the results of the studies reviewed are partially coherent. Adults and high-performing students seem positively influenced in their learning and accomplishments from feedback that contains much information that comes directly adjacent to the task and if the information is positive. At the same time, it appears that adult students are not adversely affected if the feedback comes in the form of grades. This is explained by the fact that adult students at the university level and upper secondary education have extensive experience of summative assessments and have developed strategies to cope with this system. However, it seems to be different for younger students and when representative samples are examined. One conclusion that can be drawn from the results of the included studies is that grading generally influence older and younger students and low- and high-performing students in different ways. Underperforming and younger students seem to be more adversely affected by the scores compared with older and high-performing students. Age and experience of assessment appear to play a major role in how students' learning, motivation for learning and performance is influenced by the scores. The second Chapter is about how and what teachers view of grading and how grading affect teaching. We have studied international and Swedish research to describe differences between them. The issue of validity is central, but in a different way in international and Swedish research, respectively. In the Swedish research, the relationship between the teacher's grading and policy documents constitutes a dominant perspective. Outside Sweden, it is mainly the question of what the teacher look at when assessing that dominate, e.g. student's skills or personal qualities. In the third and fourth Chapter, we have used a more exploratory approach since grading isn’t that closely linked to governing and control in other countries as in Sweden. Instead external tests are more common. We found however three central themes from a control perspective, that is relevant to the issue of grading: 1) fairness and equality in assessments, 2) grading as merit, as a knowledge and selection measurement, 3) grading as part of a high stakes assessment and evaluation systems. The third theme was made into a setting for the other two. The research that touched the first theme emphasized in particular that grading must be put into a larger perspective of a fair assessment and evaluation system, with instruments to monitor fairness in relation to different student groups, etc. Regarding the second theme we found that the ratings' role in many educational settings, have been reduced in recent decades. But at the same time we see clear tendencies that grades are better as a selection tool for higher education compared to university aptitude tests and other similar tests. This shows that grades can fill important functions in the education system in a better way than other instruments, but are not as useful for other purposes. The fourth Chapter focuses on grades from different comparative perspectives. When we look at assessment and international comparisons we see that grades doesn’t have a particularly prominent place in the international comparative research. Essentially, there are three areas the researchers focused on in these comparisons: systems of accountability; cultural explanations for why the assessment and grading system looks different in different countries; variations between teachers' assessments of various subjects or by different groups of students. Some key findings of our survey is that there has long been an international trend towards establishing systems for measuring results and to increased accountability in education systems. These results are often measured as student performance on tests or grades. Both critical scholars as well as the OECD has, however, recently noted that the hopes that comparisons of schools' results will lead to performance improvements have been exaggerated. The systems for assessment and accountability systems in different countries explain almost nothing of the variation in the PISA results. Rather, it is what teachers do in the classroom that are important and teachers find it difficult to draw conclusions about what they should do on those results that are made available through accountability systems. The systems seldom produce the right level of information for didactical implications. In Chapter 4, we also do our own comparison of grading systems in Europe. The first thing we can say is that the data situation is very complicated. There is no standardized data on this, why all comparisons need to build on a complex classification procedure, where there sometimes are problems of interpretation. This is a problem for all references to how it looks in other countries so common in the public debate on grades in Sweden. Based on what we found in our overview, we have some recommendations. There are clear results, which at least should lead to caution about further lowering of the age when pupils meet their first grades. It is also important that the Swedish current grading system is better evaluated in relation to different teachers, subjects and groups of pupils. Grades do not work the same for everyone. It is also important to consider how we evaluate students' performance and whether it is possible to combine more models with each other, so that we can get better data of for example "value added" character, and to be able to follow the development of knowledge over time. Our study also shows on several different levels of difficulties in the translation of research findings and information on education between different countries and contexts. We suggest that teachers' autonomy in assessment systems, no matter what they look like, is perhaps the most important factor for them to work in purpose of support learning and development, at all levels. Therefore, it is also of great importance, not only for the government to pay attention to voice of teachers, but to provide teachers with the possibility to obtain further training on grading and assessment. Equally important, this aspect of teaching should be an even more marked feature of teacher education

    Betygens geografi : forskning om betyg och summativa bedömningar i Sverige och internationellt. Delrapport frÄn skolforsk-projektet

    No full text
    Den hĂ€r forskningsöversikten om betyg bygger pĂ„ en lĂ€sning av över 6000 abstracts ca 500 artiklar och ett 40 tal avhandlingar. De artiklar vi gĂ„tt igenom Ă€r vetenskapligt granskade och publicerade i vetenskapliga tidskrifter. VĂ„ra sökningar och urval har varit systematiska. Rapporten Ă€r uppbyggd kring fyra olika resultatkapitel kopplande till projektets fyra övergripande frĂ„gestĂ€llningar. I kapitel 1 studeras hur betyg ur ett elevperspektiv pĂ„verkar sjĂ€lvbild, motivation och lĂ€rande. I kapitel 2 har vi sammanstĂ€llt forskning om betyg ur ett lĂ€rarperspektiv, hur och vad lĂ€rare betygsĂ€tter och hur betyg pĂ„verkar undervisning. Kapitel 3 handlar om betyg som styrinstrument pĂ„ olika nivĂ„er i utbildningssystemet, framför allt nationell nivĂ„. I kapitel 4 har vi beskrivit betyg ut olika komparativa perspektiv och studerat den forskning som finns dĂ€r jĂ€mförelser sker mellan olika betygssystem och betyg och bedömning i ett internationellt perspektiv. Vi gör ocksĂ„ en egen jĂ€mförelse av hur betygssystemen ser ut i Europa. Den första delstudien har undersökt forskning om hur summativa bedömningar pĂ„verkar elevernas lĂ€rande, motivation för lĂ€rande och prestationer och vilka resultat den genererat. I delstudien ser vi att resultaten frĂ„n de granskade artiklarna till viss del Ă€r samstĂ€mmiga. Vuxna högpresterande studenter verkar pĂ„verkas positivt i sitt lĂ€rande och prestationer av feedback som innehĂ„ller mycket information som kommer i direkt anslutning till uppgiften. Informationen bör ocksĂ„ vara positiv. Samtidigt framkommer det att vuxna studenter inte pĂ„verkas negativt om feedback kommer i form av betyg. Detta förklaras av att vuxna studenter pĂ„ universitetsnivĂ„ ”kan” systemet och har lĂ„ng erfarenhet av summativa bedömningar och har utvecklat strategier för att hantera detta system samt att de Ă€r högpresterande. DĂ€remot verkar det vara annorlunda för yngre elever och nĂ€r representativa urval undersöks. En slutsats som kan dras av resultaten frĂ„n de inkluderade studierna Ă€r att betyg generellt differentierar och pĂ„verkar Ă€ldre och yngre elever och lĂ„g- och högpresterande elever pĂ„ olika sĂ€tt. LĂ„gpresterande och yngre elever verkar pĂ„verkas mer negativt av betygsĂ€ttning jĂ€mfört med Ă€ldre och högpresterande elever. Ålder och erfarenheter av bedömning tycks spela en stor roll för hur elevers lĂ€rande, motivation för lĂ€rande och prestationer pĂ„verkas av betygsĂ€ttning. Den andra delstudien handlar om hur och vad lĂ€rare betygsĂ€tter och hur betyg pĂ„verkar undervisning. Vi har studerat internationell respektive svensk forskning för att beskriva skillnader dem. Gemensamt Ă€r att validitetsfrĂ„gan Ă€r central men hĂ€ri ligger ocksĂ„ skillnaden. I svensk forskning Ă€r det relationen mellan lĂ€rarens betygsĂ€ttning och styrdokumenten som dominerar perspektivet. Utanför Sverige Ă€r det framförallt frĂ„gan om vad lĂ€raren bedömer som dominerar, t.ex. elevens kunskaper eller personliga egenskaper. Att lĂ€rares dagliga verksamhet pĂ„verkas av betygens inflytande Ă€r mer framtrĂ€dande i den svenska forskning vi funnit. HĂ€r Ă€r det framförallt godkĂ€ntgrĂ€nsen som problematiseras men Ă€ven hur betyg tar tid frĂ„n lĂ€rarens pedagogiska arbete. Betygens inverkan pĂ„ lĂ€rarens undervisning Ă€r dĂ€remot inte centralt i forskningen utanför Sverige. DĂ€r dominerar istĂ€llet kritiken mot ett ökat inflytande av high-stakes tester och hur lĂ€rare upplever dessa som meningslösa i sin undervisning. Standardisering av betygsĂ€ttningen och high-stakes tester ses som ett problem som kan riskera lĂ€rares möjlighet att verka som professionella bedömare. Över huvud taget framkommer i de studier som tar upp betygens dilemman en spĂ€nning mellan styrning och kontroll och pedagogiska aspekter av lĂ€rarens bedömning. I den tredje och fjĂ€rde delstudien har vi gĂ„tt mer explorativt tillvĂ€ga, dĂ„ det inte funnits internationell forskning som primĂ€rt fokuserat betyg ur styrperspektiv. I delstudie tre fann vi tre centrala teman om betyg ur styrperspektiv: 1) Betyg ur rĂ€ttvise- och jĂ€mlikhetsperspektiv, 2) Betyg som kunskaps- och urvalsmĂ„tt, 3) Betyg som high-stakes i bedömnings- och utvĂ€rderingssystem. Det tredje temat gjordes till en inramning för de andra tvĂ„. Den forskning som berörde första temat poĂ€ngterade bland annat att betygssystem mĂ„ste sĂ€ttas in i ett större perspektiv av ett rĂ€ttvist bedömnings- och utvĂ€rderingssystem, med instrument för att följa upp rĂ€ttviseaspekter i relation till olika elevgrupper m.m. Studierna poĂ€ngterade vikten av transparens i systemen, sĂ„ att grunder för bedömning och utvĂ€rdering liksom existerande orĂ€ttvisor blir synliga för systemets aktörer. KunskapsfrĂ„gan lyftes ocksĂ„ fram som central, det Ă€r lĂ€tt att anta att det som stĂ„r i lĂ€roplanen – den kunskap som bedöms – Ă€r neutralt, men kunskapen har alltid konsekvenser och olika konsekvenser för olika grupper av elever. NĂ€r det gĂ€llde tema tvĂ„ var ett tydligt resultat att betygens roll i mĂ„nga utbildningssystem reducerats de senaste decennierna. Samtidigt visar genomgĂ„ngen av betyg ur ett systemperspektiv att betyg Ă€r bĂ€ttre som urvalsinstrument för högre utbildning jĂ€mfört högskoleprov och andra liknande tester. I synnerhet kursbetyg pĂ„ gymnasienivĂ„ som ges med stor bredd och i hög frekvens har en god predikativ förmĂ„ga. Detta visar att betyg kan fylla viktiga funktioner i ett utbildningssystem och det pĂ„ ett bĂ€ttre sĂ€tt Ă€n andra instrument, och att den utveckling som man sett internationellt mot allt mer centralt administrerade examens- och antagningsprov inte bör anammas okritiskt. Den fjĂ€rde delstudien fokuserar betygen ur olika komparativa perspektiv. Det vi fokuserat pĂ„ Ă€r vad betyg jĂ€mför samt hur olika betygssystem jĂ€mförs med varandra pĂ„ nationell och internationell nivĂ„. NĂ€r vi söker pĂ„ bedömning och internationella jĂ€mförelser ser vi att betyg inte fĂ„r en sĂ€rskilt framtrĂ€dande plats i artiklarna. I huvudsak Ă€r det tre omrĂ„den forskarna fokuserar vid dessa jĂ€mförelser: system för accountability; kulturella förklaringar till varför bedömnings- och betygssystem ser olika ut i olika lĂ€nder; variationer mellan olika lĂ€rares bedömningar i olika Ă€mnen eller av olika elevgrupper. NĂ„gra viktiga iakttagelser i vĂ„r genomgĂ„ng Ă€r att det lĂ€nge funnits en internationell trend mot att upprĂ€tta olika system för ökad ansvarsskyldighet (accountability) för skolans resultat. Dessa resultat mĂ€ts frĂ€mst i elevprestationer pĂ„ test eller i betyg. SĂ„vĂ€l kritiska forskare som OECD har dock pĂ„ senare tid noterat, att förhoppningarna om att jĂ€mförelser av skolors resultat ska leda till resultatförbĂ€ttringar har varit överdrivna. De system olika lĂ€nder har för bedömning och accountability förklarar i princip ingenting av variationen i PISA resultat. Det Ă€r snarare vad lĂ€rarna gör i klassrummet som har betydelse och lĂ€rare ha svĂ„rt att dra slutsatser om vad de bör göra utifrĂ„n de resultat som tillgĂ€ngliggörs via accountability-modeller. Modellerna har sĂ€llan rĂ€tt informationsnivĂ„ för didaktiska slutsatser. I kapitel 4 gör vi ocksĂ„ en egen jĂ€mförelse av betygssystem i Europa i barn- och ungdomsskolan. Det första vi kan konstatera Ă€r att informationslĂ€get Ă€r vĂ€ldigt komplicerat. Det finns inte standardiserade data pĂ„ detta varför alla jĂ€mförelser behöver bygga pĂ„ komplicerat klassificeringsförfarande, dĂ€r det ibland uppstĂ„r tolkningsproblem. Detta Ă€r inte bara ett problem för oss utan det finns i alla de jĂ€mförelser och hĂ€nvisningar till hur det ser ut i andra lĂ€nder som ocksĂ„ görs i den offentliga debatten om betyg. Enkla listor över nĂ€r betyg ges i Ă„lder eller i hur mĂ„nga skalsteg som anvĂ€nds Ă€r ganska meningslös information utanför sitt kulturella och strukturella sammanhang. Baserat pĂ„ vad vi har fĂ„tt fram i den hĂ€r översikten har vi nĂ„gra rekommendationer. Det finns tydliga resultat som Ă„tminstone bör mana till försiktighet om att vidare sĂ€nka Ă„ldern för betyg. FrĂ„gan Ă€r ocksĂ„ pĂ„ vilket sĂ€tt utblickar mot andra lĂ€nders betygsstart kan hjĂ€lpa oss att ta kloka beslut om nĂ€r vi ska börja med betyg, dĂ€r vi efterlyser att man pĂ„ policy nivĂ„ i sĂ„ fall gĂ„r mer pĂ„ djupet och identifierar principer för bedömning som mer har med klassrummet att göra. Flera lĂ€nder ger exempelvis lĂ€rare och skolor stor autonomi över hur bedömningarna i tidiga Ă„ldrar ska tillĂ€mpas, vilket kan tĂ€nkas ha positiva konsekvenser för lĂ€rares professionalitet i frĂ„gan. Det Ă€r ocksĂ„ viktigt att det svenska nuvarande betygssystemet bĂ€ttre utvĂ€rderas pĂ„ ett nyanserat sĂ€tt i förhĂ„llande till olika lĂ€rare, Ă€mnen och elevgrupper. Betyg fungerar inte lika för alla. Det Ă€r ocksĂ„ viktigt att fundera över hur vi utvĂ€rderar elevers resultat och om det finns möjlighet att kombinera fler modeller med varandra, sĂ„ att vi bĂ€ttre kan fĂ„ data av ”value added”-karaktĂ€r samt för att följa kunskapsutvecklingen över tid. Studien visar ocksĂ„ pĂ„ flera olika plan vilka svĂ„righeter det finns med översĂ€ttning av forskningsresultat och information om utbildningssystem mellan olika lĂ€nder och kontexter. VĂ„r studie pekar pĂ„ att lĂ€rarnas autonomi över bedömningssystemen, oavsett hur de ser ut, Ă€r det som kanske har störst betydelse. Att lĂ€rarna har verktyg som de kan anvĂ€nda i bedömning av elevernas kunskaper och i kommunikationen kring dessa kunskaper som lĂ€rarna sjĂ€lva upplever Ă€r meningsfulla och som gagnar den pedagogiska processen. DĂ€rför Ă€r det ocksĂ„ av stor vikt att lĂ€rare ges möjlighet till fortbildning kring betyg och bedömning och att det kanske blir ett Ă€nnu mer markerat inslag i lĂ€rarutbildningen.This systematic research review about grades and summative assessments are based on a reading of over 6000 abstracts, 500 articles and about 40 theses. The articles we have read are peer reviewed and published in scientific journals. Our searches and selections have been systematic. The report is structured around four different chapters linking to the project's four overarching issues. In Chapter 1 we study how grades/marks from a student perspective affects self-image, motivation and learning. In Chapter 2, we have compiled research on grading/marking from a teacher's perspective, how and what teachers think of this and how grading affect teaching. Chapter 3 deals with grades and summative assessment as control instruments at different levels of the education system. In Chapter 4 we describe grading from various comparative perspectives. We also do our own comparison of how the different grading and assessment systems look like in Europe. In the first Chapter, we see that the results of the studies reviewed are partially coherent. Adults and high-performing students seem positively influenced in their learning and accomplishments from feedback that contains much information that comes directly adjacent to the task and if the information is positive. At the same time, it appears that adult students are not adversely affected if the feedback comes in the form of grades. This is explained by the fact that adult students at the university level and upper secondary education have extensive experience of summative assessments and have developed strategies to cope with this system. However, it seems to be different for younger students and when representative samples are examined. One conclusion that can be drawn from the results of the included studies is that grading generally influence older and younger students and low- and high-performing students in different ways. Underperforming and younger students seem to be more adversely affected by the scores compared with older and high-performing students. Age and experience of assessment appear to play a major role in how students' learning, motivation for learning and performance is influenced by the scores. The second Chapter is about how and what teachers view of grading and how grading affect teaching. We have studied international and Swedish research to describe differences between them. The issue of validity is central, but in a different way in international and Swedish research, respectively. In the Swedish research, the relationship between the teacher's grading and policy documents constitutes a dominant perspective. Outside Sweden, it is mainly the question of what the teacher look at when assessing that dominate, e.g. student's skills or personal qualities. In the third and fourth Chapter, we have used a more exploratory approach since grading isn’t that closely linked to governing and control in other countries as in Sweden. Instead external tests are more common. We found however three central themes from a control perspective, that is relevant to the issue of grading: 1) fairness and equality in assessments, 2) grading as merit, as a knowledge and selection measurement, 3) grading as part of a high stakes assessment and evaluation systems. The third theme was made into a setting for the other two. The research that touched the first theme emphasized in particular that grading must be put into a larger perspective of a fair assessment and evaluation system, with instruments to monitor fairness in relation to different student groups, etc. Regarding the second theme we found that the ratings' role in many educational settings, have been reduced in recent decades. But at the same time we see clear tendencies that grades are better as a selection tool for higher education compared to university aptitude tests and other similar tests. This shows that grades can fill important functions in the education system in a better way than other instruments, but are not as useful for other purposes. The fourth Chapter focuses on grades from different comparative perspectives. When we look at assessment and international comparisons we see that grades doesn’t have a particularly prominent place in the international comparative research. Essentially, there are three areas the researchers focused on in these comparisons: systems of accountability; cultural explanations for why the assessment and grading system looks different in different countries; variations between teachers' assessments of various subjects or by different groups of students. Some key findings of our survey is that there has long been an international trend towards establishing systems for measuring results and to increased accountability in education systems. These results are often measured as student performance on tests or grades. Both critical scholars as well as the OECD has, however, recently noted that the hopes that comparisons of schools' results will lead to performance improvements have been exaggerated. The systems for assessment and accountability systems in different countries explain almost nothing of the variation in the PISA results. Rather, it is what teachers do in the classroom that are important and teachers find it difficult to draw conclusions about what they should do on those results that are made available through accountability systems. The systems seldom produce the right level of information for didactical implications. In Chapter 4, we also do our own comparison of grading systems in Europe. The first thing we can say is that the data situation is very complicated. There is no standardized data on this, why all comparisons need to build on a complex classification procedure, where there sometimes are problems of interpretation. This is a problem for all references to how it looks in other countries so common in the public debate on grades in Sweden. Based on what we found in our overview, we have some recommendations. There are clear results, which at least should lead to caution about further lowering of the age when pupils meet their first grades. It is also important that the Swedish current grading system is better evaluated in relation to different teachers, subjects and groups of pupils. Grades do not work the same for everyone. It is also important to consider how we evaluate students' performance and whether it is possible to combine more models with each other, so that we can get better data of for example "value added" character, and to be able to follow the development of knowledge over time. Our study also shows on several different levels of difficulties in the translation of research findings and information on education between different countries and contexts. We suggest that teachers' autonomy in assessment systems, no matter what they look like, is perhaps the most important factor for them to work in purpose of support learning and development, at all levels. Therefore, it is also of great importance, not only for the government to pay attention to voice of teachers, but to provide teachers with the possibility to obtain further training on grading and assessment. Equally important, this aspect of teaching should be an even more marked feature of teacher education

    Betygens geografi : forskning om betyg och summativa bedömningar i Sverige och internationellt. Delrapport frÄn skolforsk-projektet

    No full text
    Den hĂ€r forskningsöversikten om betyg bygger pĂ„ en lĂ€sning av över 6000 abstracts ca 500 artiklar och ett 40 tal avhandlingar. De artiklar vi gĂ„tt igenom Ă€r vetenskapligt granskade och publicerade i vetenskapliga tidskrifter. VĂ„ra sökningar och urval har varit systematiska. Rapporten Ă€r uppbyggd kring fyra olika resultatkapitel kopplande till projektets fyra övergripande frĂ„gestĂ€llningar. I kapitel 1 studeras hur betyg ur ett elevperspektiv pĂ„verkar sjĂ€lvbild, motivation och lĂ€rande. I kapitel 2 har vi sammanstĂ€llt forskning om betyg ur ett lĂ€rarperspektiv, hur och vad lĂ€rare betygsĂ€tter och hur betyg pĂ„verkar undervisning. Kapitel 3 handlar om betyg som styrinstrument pĂ„ olika nivĂ„er i utbildningssystemet, framför allt nationell nivĂ„. I kapitel 4 har vi beskrivit betyg ut olika komparativa perspektiv och studerat den forskning som finns dĂ€r jĂ€mförelser sker mellan olika betygssystem och betyg och bedömning i ett internationellt perspektiv. Vi gör ocksĂ„ en egen jĂ€mförelse av hur betygssystemen ser ut i Europa. Den första delstudien har undersökt forskning om hur summativa bedömningar pĂ„verkar elevernas lĂ€rande, motivation för lĂ€rande och prestationer och vilka resultat den genererat. I delstudien ser vi att resultaten frĂ„n de granskade artiklarna till viss del Ă€r samstĂ€mmiga. Vuxna högpresterande studenter verkar pĂ„verkas positivt i sitt lĂ€rande och prestationer av feedback som innehĂ„ller mycket information som kommer i direkt anslutning till uppgiften. Informationen bör ocksĂ„ vara positiv. Samtidigt framkommer det att vuxna studenter inte pĂ„verkas negativt om feedback kommer i form av betyg. Detta förklaras av att vuxna studenter pĂ„ universitetsnivĂ„ ”kan” systemet och har lĂ„ng erfarenhet av summativa bedömningar och har utvecklat strategier för att hantera detta system samt att de Ă€r högpresterande. DĂ€remot verkar det vara annorlunda för yngre elever och nĂ€r representativa urval undersöks. En slutsats som kan dras av resultaten frĂ„n de inkluderade studierna Ă€r att betyg generellt differentierar och pĂ„verkar Ă€ldre och yngre elever och lĂ„g- och högpresterande elever pĂ„ olika sĂ€tt. LĂ„gpresterande och yngre elever verkar pĂ„verkas mer negativt av betygsĂ€ttning jĂ€mfört med Ă€ldre och högpresterande elever. Ålder och erfarenheter av bedömning tycks spela en stor roll för hur elevers lĂ€rande, motivation för lĂ€rande och prestationer pĂ„verkas av betygsĂ€ttning. Den andra delstudien handlar om hur och vad lĂ€rare betygsĂ€tter och hur betyg pĂ„verkar undervisning. Vi har studerat internationell respektive svensk forskning för att beskriva skillnader dem. Gemensamt Ă€r att validitetsfrĂ„gan Ă€r central men hĂ€ri ligger ocksĂ„ skillnaden. I svensk forskning Ă€r det relationen mellan lĂ€rarens betygsĂ€ttning och styrdokumenten som dominerar perspektivet. Utanför Sverige Ă€r det framförallt frĂ„gan om vad lĂ€raren bedömer som dominerar, t.ex. elevens kunskaper eller personliga egenskaper. Att lĂ€rares dagliga verksamhet pĂ„verkas av betygens inflytande Ă€r mer framtrĂ€dande i den svenska forskning vi funnit. HĂ€r Ă€r det framförallt godkĂ€ntgrĂ€nsen som problematiseras men Ă€ven hur betyg tar tid frĂ„n lĂ€rarens pedagogiska arbete. Betygens inverkan pĂ„ lĂ€rarens undervisning Ă€r dĂ€remot inte centralt i forskningen utanför Sverige. DĂ€r dominerar istĂ€llet kritiken mot ett ökat inflytande av high-stakes tester och hur lĂ€rare upplever dessa som meningslösa i sin undervisning. Standardisering av betygsĂ€ttningen och high-stakes tester ses som ett problem som kan riskera lĂ€rares möjlighet att verka som professionella bedömare. Över huvud taget framkommer i de studier som tar upp betygens dilemman en spĂ€nning mellan styrning och kontroll och pedagogiska aspekter av lĂ€rarens bedömning. I den tredje och fjĂ€rde delstudien har vi gĂ„tt mer explorativt tillvĂ€ga, dĂ„ det inte funnits internationell forskning som primĂ€rt fokuserat betyg ur styrperspektiv. I delstudie tre fann vi tre centrala teman om betyg ur styrperspektiv: 1) Betyg ur rĂ€ttvise- och jĂ€mlikhetsperspektiv, 2) Betyg som kunskaps- och urvalsmĂ„tt, 3) Betyg som high-stakes i bedömnings- och utvĂ€rderingssystem. Det tredje temat gjordes till en inramning för de andra tvĂ„. Den forskning som berörde första temat poĂ€ngterade bland annat att betygssystem mĂ„ste sĂ€ttas in i ett större perspektiv av ett rĂ€ttvist bedömnings- och utvĂ€rderingssystem, med instrument för att följa upp rĂ€ttviseaspekter i relation till olika elevgrupper m.m. Studierna poĂ€ngterade vikten av transparens i systemen, sĂ„ att grunder för bedömning och utvĂ€rdering liksom existerande orĂ€ttvisor blir synliga för systemets aktörer. KunskapsfrĂ„gan lyftes ocksĂ„ fram som central, det Ă€r lĂ€tt att anta att det som stĂ„r i lĂ€roplanen – den kunskap som bedöms – Ă€r neutralt, men kunskapen har alltid konsekvenser och olika konsekvenser för olika grupper av elever. NĂ€r det gĂ€llde tema tvĂ„ var ett tydligt resultat att betygens roll i mĂ„nga utbildningssystem reducerats de senaste decennierna. Samtidigt visar genomgĂ„ngen av betyg ur ett systemperspektiv att betyg Ă€r bĂ€ttre som urvalsinstrument för högre utbildning jĂ€mfört högskoleprov och andra liknande tester. I synnerhet kursbetyg pĂ„ gymnasienivĂ„ som ges med stor bredd och i hög frekvens har en god predikativ förmĂ„ga. Detta visar att betyg kan fylla viktiga funktioner i ett utbildningssystem och det pĂ„ ett bĂ€ttre sĂ€tt Ă€n andra instrument, och att den utveckling som man sett internationellt mot allt mer centralt administrerade examens- och antagningsprov inte bör anammas okritiskt. Den fjĂ€rde delstudien fokuserar betygen ur olika komparativa perspektiv. Det vi fokuserat pĂ„ Ă€r vad betyg jĂ€mför samt hur olika betygssystem jĂ€mförs med varandra pĂ„ nationell och internationell nivĂ„. NĂ€r vi söker pĂ„ bedömning och internationella jĂ€mförelser ser vi att betyg inte fĂ„r en sĂ€rskilt framtrĂ€dande plats i artiklarna. I huvudsak Ă€r det tre omrĂ„den forskarna fokuserar vid dessa jĂ€mförelser: system för accountability; kulturella förklaringar till varför bedömnings- och betygssystem ser olika ut i olika lĂ€nder; variationer mellan olika lĂ€rares bedömningar i olika Ă€mnen eller av olika elevgrupper. NĂ„gra viktiga iakttagelser i vĂ„r genomgĂ„ng Ă€r att det lĂ€nge funnits en internationell trend mot att upprĂ€tta olika system för ökad ansvarsskyldighet (accountability) för skolans resultat. Dessa resultat mĂ€ts frĂ€mst i elevprestationer pĂ„ test eller i betyg. SĂ„vĂ€l kritiska forskare som OECD har dock pĂ„ senare tid noterat, att förhoppningarna om att jĂ€mförelser av skolors resultat ska leda till resultatförbĂ€ttringar har varit överdrivna. De system olika lĂ€nder har för bedömning och accountability förklarar i princip ingenting av variationen i PISA resultat. Det Ă€r snarare vad lĂ€rarna gör i klassrummet som har betydelse och lĂ€rare ha svĂ„rt att dra slutsatser om vad de bör göra utifrĂ„n de resultat som tillgĂ€ngliggörs via accountability-modeller. Modellerna har sĂ€llan rĂ€tt informationsnivĂ„ för didaktiska slutsatser. I kapitel 4 gör vi ocksĂ„ en egen jĂ€mförelse av betygssystem i Europa i barn- och ungdomsskolan. Det första vi kan konstatera Ă€r att informationslĂ€get Ă€r vĂ€ldigt komplicerat. Det finns inte standardiserade data pĂ„ detta varför alla jĂ€mförelser behöver bygga pĂ„ komplicerat klassificeringsförfarande, dĂ€r det ibland uppstĂ„r tolkningsproblem. Detta Ă€r inte bara ett problem för oss utan det finns i alla de jĂ€mförelser och hĂ€nvisningar till hur det ser ut i andra lĂ€nder som ocksĂ„ görs i den offentliga debatten om betyg. Enkla listor över nĂ€r betyg ges i Ă„lder eller i hur mĂ„nga skalsteg som anvĂ€nds Ă€r ganska meningslös information utanför sitt kulturella och strukturella sammanhang. Baserat pĂ„ vad vi har fĂ„tt fram i den hĂ€r översikten har vi nĂ„gra rekommendationer. Det finns tydliga resultat som Ă„tminstone bör mana till försiktighet om att vidare sĂ€nka Ă„ldern för betyg. FrĂ„gan Ă€r ocksĂ„ pĂ„ vilket sĂ€tt utblickar mot andra lĂ€nders betygsstart kan hjĂ€lpa oss att ta kloka beslut om nĂ€r vi ska börja med betyg, dĂ€r vi efterlyser att man pĂ„ policy nivĂ„ i sĂ„ fall gĂ„r mer pĂ„ djupet och identifierar principer för bedömning som mer har med klassrummet att göra. Flera lĂ€nder ger exempelvis lĂ€rare och skolor stor autonomi över hur bedömningarna i tidiga Ă„ldrar ska tillĂ€mpas, vilket kan tĂ€nkas ha positiva konsekvenser för lĂ€rares professionalitet i frĂ„gan. Det Ă€r ocksĂ„ viktigt att det svenska nuvarande betygssystemet bĂ€ttre utvĂ€rderas pĂ„ ett nyanserat sĂ€tt i förhĂ„llande till olika lĂ€rare, Ă€mnen och elevgrupper. Betyg fungerar inte lika för alla. Det Ă€r ocksĂ„ viktigt att fundera över hur vi utvĂ€rderar elevers resultat och om det finns möjlighet att kombinera fler modeller med varandra, sĂ„ att vi bĂ€ttre kan fĂ„ data av ”value added”-karaktĂ€r samt för att följa kunskapsutvecklingen över tid. Studien visar ocksĂ„ pĂ„ flera olika plan vilka svĂ„righeter det finns med översĂ€ttning av forskningsresultat och information om utbildningssystem mellan olika lĂ€nder och kontexter. VĂ„r studie pekar pĂ„ att lĂ€rarnas autonomi över bedömningssystemen, oavsett hur de ser ut, Ă€r det som kanske har störst betydelse. Att lĂ€rarna har verktyg som de kan anvĂ€nda i bedömning av elevernas kunskaper och i kommunikationen kring dessa kunskaper som lĂ€rarna sjĂ€lva upplever Ă€r meningsfulla och som gagnar den pedagogiska processen. DĂ€rför Ă€r det ocksĂ„ av stor vikt att lĂ€rare ges möjlighet till fortbildning kring betyg och bedömning och att det kanske blir ett Ă€nnu mer markerat inslag i lĂ€rarutbildningen.This systematic research review about grades and summative assessments are based on a reading of over 6000 abstracts, 500 articles and about 40 theses. The articles we have read are peer reviewed and published in scientific journals. Our searches and selections have been systematic. The report is structured around four different chapters linking to the project's four overarching issues. In Chapter 1 we study how grades/marks from a student perspective affects self-image, motivation and learning. In Chapter 2, we have compiled research on grading/marking from a teacher's perspective, how and what teachers think of this and how grading affect teaching. Chapter 3 deals with grades and summative assessment as control instruments at different levels of the education system. In Chapter 4 we describe grading from various comparative perspectives. We also do our own comparison of how the different grading and assessment systems look like in Europe. In the first Chapter, we see that the results of the studies reviewed are partially coherent. Adults and high-performing students seem positively influenced in their learning and accomplishments from feedback that contains much information that comes directly adjacent to the task and if the information is positive. At the same time, it appears that adult students are not adversely affected if the feedback comes in the form of grades. This is explained by the fact that adult students at the university level and upper secondary education have extensive experience of summative assessments and have developed strategies to cope with this system. However, it seems to be different for younger students and when representative samples are examined. One conclusion that can be drawn from the results of the included studies is that grading generally influence older and younger students and low- and high-performing students in different ways. Underperforming and younger students seem to be more adversely affected by the scores compared with older and high-performing students. Age and experience of assessment appear to play a major role in how students' learning, motivation for learning and performance is influenced by the scores. The second Chapter is about how and what teachers view of grading and how grading affect teaching. We have studied international and Swedish research to describe differences between them. The issue of validity is central, but in a different way in international and Swedish research, respectively. In the Swedish research, the relationship between the teacher's grading and policy documents constitutes a dominant perspective. Outside Sweden, it is mainly the question of what the teacher look at when assessing that dominate, e.g. student's skills or personal qualities. In the third and fourth Chapter, we have used a more exploratory approach since grading isn’t that closely linked to governing and control in other countries as in Sweden. Instead external tests are more common. We found however three central themes from a control perspective, that is relevant to the issue of grading: 1) fairness and equality in assessments, 2) grading as merit, as a knowledge and selection measurement, 3) grading as part of a high stakes assessment and evaluation systems. The third theme was made into a setting for the other two. The research that touched the first theme emphasized in particular that grading must be put into a larger perspective of a fair assessment and evaluation system, with instruments to monitor fairness in relation to different student groups, etc. Regarding the second theme we found that the ratings' role in many educational settings, have been reduced in recent decades. But at the same time we see clear tendencies that grades are better as a selection tool for higher education compared to university aptitude tests and other similar tests. This shows that grades can fill important functions in the education system in a better way than other instruments, but are not as useful for other purposes. The fourth Chapter focuses on grades from different comparative perspectives. When we look at assessment and international comparisons we see that grades doesn’t have a particularly prominent place in the international comparative research. Essentially, there are three areas the researchers focused on in these comparisons: systems of accountability; cultural explanations for why the assessment and grading system looks different in different countries; variations between teachers' assessments of various subjects or by different groups of students. Some key findings of our survey is that there has long been an international trend towards establishing systems for measuring results and to increased accountability in education systems. These results are often measured as student performance on tests or grades. Both critical scholars as well as the OECD has, however, recently noted that the hopes that comparisons of schools' results will lead to performance improvements have been exaggerated. The systems for assessment and accountability systems in different countries explain almost nothing of the variation in the PISA results. Rather, it is what teachers do in the classroom that are important and teachers find it difficult to draw conclusions about what they should do on those results that are made available through accountability systems. The systems seldom produce the right level of information for didactical implications. In Chapter 4, we also do our own comparison of grading systems in Europe. The first thing we can say is that the data situation is very complicated. There is no standardized data on this, why all comparisons need to build on a complex classification procedure, where there sometimes are problems of interpretation. This is a problem for all references to how it looks in other countries so common in the public debate on grades in Sweden. Based on what we found in our overview, we have some recommendations. There are clear results, which at least should lead to caution about further lowering of the age when pupils meet their first grades. It is also important that the Swedish current grading system is better evaluated in relation to different teachers, subjects and groups of pupils. Grades do not work the same for everyone. It is also important to consider how we evaluate students' performance and whether it is possible to combine more models with each other, so that we can get better data of for example "value added" character, and to be able to follow the development of knowledge over time. Our study also shows on several different levels of difficulties in the translation of research findings and information on education between different countries and contexts. We suggest that teachers' autonomy in assessment systems, no matter what they look like, is perhaps the most important factor for them to work in purpose of support learning and development, at all levels. Therefore, it is also of great importance, not only for the government to pay attention to voice of teachers, but to provide teachers with the possibility to obtain further training on grading and assessment. Equally important, this aspect of teaching should be an even more marked feature of teacher education

    A benefit-cost analysis of a long-term intervention on social and emotional learning in compulsory school

    Get PDF
    There is growing evidence that social and emotional skills can be taught to students in school and teaching these skills can have a positive effect on later outcomes, such as better mental health and less drug use. This paper presents a benefit-cost analysis of a longitudinal social and emotional learning intervention in Sweden, using data for 663 students participating in the evaluation. Intervention costs are compared against treatment impact on self-reported drug use. Pre-test and post-test data are available. Since follow-up data for the participantsÂŽ drug use as adults is not available, informed projections have been made. Net present monetary values are calculated for the general public and society. The results show that students in the treatment group report decreasing use of drugs over the five year long intervention, the value of which easily outweighs the intervention costs
    corecore