Randomiserade, kontrollerade studier – en gyllene standard

En randomiserad kontrollerad studie är den bästa metoden för att ta reda på om en bestämd typ av behandling har effekt.

Uppdaterad den: 2013-02-06
Publicerad av: Mats Halldin, ST-läkare i allmänmedicin och medicine doktor, medicinsk chef, Netdoktor

Annons

Behandlingsstudier

När man blir sjuk, och sjukdomen inte går över av sig själv, behövs aktiv behandling. Sådan behandling kan vara information, kostråd, fysioterapi, ett läkemedel eller andra åtgärder. Men hur vet man att behandlingen verkar, och att den behandling man får är den bästa?

Den medicinska forskningen har utvecklat metoder för att bedöma om en viss behandling har effekt, och om den är bättre än annan behandling. Den gyllene standarden, den bästa metoden, för sådan forskning, är en randomiserad, kontrollerad studie – på engelska heter det "randomized controlled trial", förkortat RCT. 

Vad är en randomiserad, kontrollerad studie?

Huvudkravet på ett randomiserat, kontrollerat försök är att studien är – ja, just det – randomiserad och kontrollerad.

Annons
Annons

En behandlingsstudie innebär att den nya behandlingen, som man önskar att få veta mer om, blir jämförd med en annan behandling, en kontrollbehandling. En sådan kontrollbehandling kan vara låtsasmedicin, placebo, eller så kan det vara en vanligen förekommande, accepterad, behandling. En kontrollerad studie betyder att den nya behandlingen blir jämförd med en kontrollbehandling. En sådan jämförelse är avgörande för att kunna avgöra om den nya behandlingen är bättre, lika bra eller sämre än kontrollbehandlingen.

Fördelningen av patienter till de två behandlingsgrupperna – den grupp som får den nya behandlingen och den grupp som får kontrollbehandlingen – måste ske på ett sådant sätt att de två grupperna är så lika som möjligt innan behandlingsförsöket startar. Det betyder att de två grupperna bör vara någorlunda likt sammansatta när det gäller förhållanden som ålder, kön, arbete, sjukdomskarakteristika, riskfaktorer och alla tänkbara och okända faktorer som kan påverka försöksresultatet. Om till exempel den ena gruppen är klart äldre än den andra, så kan det leda till att resultatet i de två grupperna blir olika – bara på grund av skillnad i ålder. Om den ena gruppen är sjukare än den andra innan behandlingen startar, så finns det ökad risk för att denna grupp också är sämre efter genomförd behandling.

Randomisering betyder att urvalet av patienter till de två behandlingsgrupperna sker på ett slumpartat sätt, genom lottning, och att urvalet inte är bestämt utifrån egenskaper hos patienten. Genom randomisering blir de två behandlingsgrupperna så lika som möjligt, grupperna är i genomsnitt sammansatta av personer med ungefär samma egenskaper. När behandlingsgrupperna är lika innan behandlingen startar, betyder det att resultatet när försöket är över kan tillskrivas egenskaper hos de två behandlingarna. Är den ena behandlingen bättre än den andra enligt undersökningen, så talar det för det att den verkligen är bättre.

Annons
Annons

Viktiga krav på en randomiserad, kontrollerad studie

Blindning

Om man innan försöket startar får veta att man får den nya behandlingen, är sannolikheten hög för att det skapar en förväntning om att behandlingen kommer att hjälpa. På motsatt sätt gäller att om man innan försöket startar får veta att man får placebo eller en "gammal" behandling, så kan det påverka förväntningarna negativt. För att undvika denna partiskhet genomförs behandlingsstudier om möjligt som "blinda" studier. Vanligtvis gäller detta behandlingsstudier med läkemedel, till exempel med tabletter. De två tablettyperna görs så lika som möjligt när det gäller form, färg, smak och konsistens, så att det inte är möjligt för den som är försöksperson att märka någon skillnad. Även den person i forskargruppen som ger behandlingen bör vara blindad med hänsyn till vilken behandling som ges – annars kan denne i sin tur vara påverkad av sina förväntningar på behandlingen och denna förväntan kan omedvetet "smittas över" till försökspersonen, vilket kan påverka resultatet. Kravet är därför att studien ska vara "dubbelblind". Varken försökspersonen eller den som ger behandlingen ska på förhand veta vilken behandling som ges. Det blir först klart när studien är avslutad.

Inte alla studier låter sig göras blinda. Ett exempel på det kan vara en jämförelse av fysisk träning med icke-fysisk träning.

Bortfall

En utmaning för forskarna är att säkerställa att så många som möjligt av försökspersonerna, helst alla, genomför studien och kommer tillbaka till kontroll när försöket är över. Ändå vet man att det nästan alltid är ett visst bortfall av försökspersoner under studiens gång. Om detta bortfall är stort, eller skevt, kan det påverka resultatet av studien. Som regel vet inte forskarna varför försökspersoner drar sig ur försöket som de har påbörjat. Det kan till exempel vara att de blev så bra att de inte bryr sig om att komma till kontroll. Det kan också vara att de är så missnöjda med behandlingen att de drar sig ur försöket.

Om bortfallet är skevt i de två grupperna som jämförs, kan det i några fall vara hela förklaringen till försöksresultatet. Om man tänker sig att de flesta av dem som uteblir från kontrollen, har blivit bättre och tillhörde gruppen som fick det nya läkemedlet. Då kommer detta att minska den uppmätta effekten av den nya behandlingen, man underskattar med andra ord effekten. Motsatt så gäller att om de flesta som uteblir från kontrollen gör det eftersom de blev sämre och att samtidigt de flesta av dessa fanns i gruppen som fick det nya läkemedlet, så kommer det att kunna ge som resultat att studien visade att den nya behandlingen var effektiv; man överskattar effekten eftersom så många med dålig effekt inte räknas in.

För att motverka en sådan olycklig påverkan på resultatet i studierna, är det en utmaning för forskarna att ha ett upplägg som gör att så få som möjligt drar sig ur studien, och att forskarna i största möjliga grad ska kunna redogöra för bortfallet, till exempel genom att få reda på varför en försöksperson drog sig ur. Dessutom kan forskarna med hjälp av statistiska metoder bedöma i vilken grad bortfall av patienter har påverkat resultatet, samt att de kan göra analyser som säger om "i bästa fall"-scenariet (alla bortfallna blev bättre) eller "i värsta fall"-scenariet (alla bortfallna blev sämre) har påverkat slutresultatet för studien.

Blinda mätningar

En annan möjlig felkälla i en studie är mätningar. Det vill säga när man ska mäta om en försöksperson har blivit bättre, är oförändrad eller sämre. Några av dessa mätningarna utförs av testpersonal. Om testpersonalen vet vilken behandling som har getts, så kan de medvetet eller omedvetet påverka mätningarna i den riktning som de vill. Och eftersom det är mätningarna som är underlaget för att avgöra om den nya behandlingen är bättre än kontrollbehandlingen, så kan en sådan situation påverka hela resultatet av studien. Därför måste även testpersonalen vara "blind" med hänsyn till vilken behandling den enstaka försökspersonen har mottagit.

Bägge behandlingsgrupperna blev hanterade lika

Det är mycket viktigt att uppföljningen av de två behandlingsgrupperna är likadan. Det får inte vara så att den ena gruppen får en bättre uppföljning med mer uppmärksamhet än den andra gruppen. En eventuell skillnad i uppföljningen av de två grupperna kan alltså påverka resultatet. Principen är att den enda skillnaden på de två grupperna ska vara skillnaden som ligger i de olika behandlingarna – den nya behandlingen och kontrollbehandlingen. Alla andra skillnader kan påverka slutresultatet.

Hur stora är skillnaderna?

För att avgöra skillnaden i effekt mellan de två behandlingarna används statistiska metoder. Resultaten från de två grupperna jämförs. Oftast är det genomsnittsskillnaden forskarna ser på. En eventuell skillnad bedöms i de statistiska analyserna. Om skillnaden är markant säger forskarna att det föreligger en statistiskt signifikant skillnad. Skillnaden är då så stor att man kan förkasta möjligheten för att resultatet har uppstått genom en ren slump. Det föreligger en reell skillnad i effekt. Detta anges ibland med så kallade p-värden och andra gånger – eller samtidigt – med konfidensintervall.

P-värdet anger sannolikheten för att uppnå en skillnad i resultat vid ren slump. Om till exempel p-värdet är lägre än 5 %, innebär det att chansen är mindre än 5 % för att uppnå detta resultatet genom ren slump, och forskarna säger då att den ena behandlingen är statistiskt signifikant bättre än den andra behandlingen.

Konfidensintervall är ett annat sätt att presentera resultaten på. Då beräknas skillnaden mellan de två behandlingarna så att man beräknar ett genomsnittsvärde (en uppskattning, till exempel en riskreduktion för en oönskad händelse med att använda den ena behandlingen och inte den andra på 1,5). Runt detta värde ligger ett område som betecknas konfidensintervallet (till exempel från 1,2 till 1,7). Detta intervall beskriver var det korrekta värdet (riskreduktionen i detta fall) tros ligga, givet att man upprepar försöket många gånger. Vanligtvis uppges 95 %-konfidensintervallet. Då betyder detta intervall från 1,2 till 1,7 att resultatet från studien ligger mellan dessa två värden i 95 % av fallen, om studien upprepas många gånger. Fördelen med konfidensintervallet är att det ger extra information i förhållande till ett p-värde. Konfidensintervallet avslöjar hur säkert resultatet är. Om konfidensintervallet är brett, så betyder det att resultatet är osäkert. Om konfidensintervallet är smalt, betyder det att man har ett precist och säkert resultat.

Vem gäller resultatet från studien för?

När en läkare ska bedöma om resultatet från en behandlingsstudie har giltighet för de patienter han eller hon behandlar, granskas studiens inklusions- och exklusionskriterier. Vilka deltog i studien? Inklusionskriterierna beskriver vem som blev inbjuden till studien – till exempel krav på diagnos, symtom, ålder eller kön. Exklusionskriterierna beskriver vem som inte fick vara med i studien – till exempel på grund av annan sjukdom eller hög ålder. Genom att kombinera dessa upplysningar kan läkaren – eller man själv – avgöra om resultatet har giltighet för en själv, om ens egen situation är samma som för de patienter som deltog i studien.

En annan bedömning som måste göras, är att ta ställning till om en eventuell ny behandling som i försöket har visat sig effektiv – det vill säga bättre än kontrollbehandlingen – är värd kostnaderna. Det kan vara priset i kronor och ören för det nya preparatet. Genomgående kostar nya läkemedel långt mer än gamla läkemedel, och det kan mycket väl vara att priset är så högt att det inte motsvarar hur mycket bättre det nya preparatet är. Det kan också tänkas att den nya behandlingen har biverkningar som är av en sådan karaktär eller så ofta förekommande att den nya behandlingen bör användas.

Inte alla behandlingsstudier är trovärdiga

Som det framgår av ovanstående, finns det många fallgropar när man ska bedöma effekten av en ny behandling. Behandlingsstudier som inte uppfyller kraven på ett randomiserat, kontrollerat försök, har i dag liten trovärdighet och blir oftast förkastade när man ska ta ställning till om en behandling kan rekommenderas eller inte.


Annons
Annons
Annons