Beoordeeld: 30-09-2024
Uitgangsvraag
Op welke wijze dient follow-up plaats te vinden op basis van risicoclassificatie?
Aanbeveling
- Verricht in ieder geval 12 maanden na (hemi)thyreoïdectomie routinematig eenmalig echografie voor herstadiëring met uitzondering van de per toeval gevonden microcarcinomen. Overweeg dit onderzoek eerder plaats te laten vinden bij patiënten met bekende structurele ziekte na de primaire behandeling.
- Routinematige echografie wordt NIET aanbevolen bij patiënten met niet aantoonbaar Tg na totale thyreoïdectomie (al dan niet in combinatie met adjuvante radioactief jodium behandeling) na herstadiëring.
- Bij aantoonbaar of stijgend Tg is echografie het eerste onderzoek van keuze.
- Bij aantoonbaar of stijgend Tg indien echografie negatief is wordt een aanvullende diagnostiek middels FDG PET-CT geadviseerd.
- Routinematige diagnostische jodium scans worden niet aanbevolen.
Onderstaand voorstel kan gebruikt worden als handvat, zie box 2.
Handvat follow-up na herstadiëring (middels echo hals en eventueel ongestimuleerd Tg bepaling 1 jaar na de operatie):
- Laag risico ≤1 cm (klinisch manifest) met hemithyreoïdectomie*
- Uitstekend respons:
- Staak follow-up.
- Biochemisch onvoldoende:
- Niet van toepassing.
- Structureel onvoldoende of recidief:
- Overweeg lokale behandeling (operatie eventueel gevolgd door radioactief jodium, of radioactief jodium en/of radiotherapie indien niet operabel) of expectatief met follow-up middels bepaling van ongestimuleerd Tg en beeldvorming (zie behandeling van locoregionaal recidief). Frequentie van follow-up is afhankelijk van de klinische situatie. Overweeg een FDG-PET-CT-scan te verrichten vooraf aan het definitief besluit met betrekking tot de lokale behandeling indien er therapeutische consequenties hieraan verbonden worden.
- Inconclusief:
- Herhaal de echo van de hals 2 en 5 jaar na de primaire behandeling. Indien geen afwijkingen of stabiele situatie staak de follow-up.
- Laag risico >1-≤4 cm met hemithyreoïdectomie*
- Uitstekend respons
- Herhaal de echo van de hals 2 en 5 jaar na de primaire behandeling. Indien geen afwijkingen, staak de follow-up.
- Biochemisch onvoldoende:
- Niet van toepassing.
- Structureel onvoldoende of recidief:
Zie punt 1.
- Inconclusief:
Zie punt 1.
- Laag risico >1-≤4 cm met totale thyreoïdectomie zonder radioactief jodium behandeling*
Zie punt 2.
- Laag risico >1-≤4 cm met totale thyreoïdectomie gevolgd door radioactief jodium behandeling
- Uitstekend respons:
- Jaarlijkse controle middels ongestimuleerd Tg gedurende 5 jaar na de primaire behandeling. Indien geen afwijkingen, staak de follow-up.
- Biochemisch onvoldoende:
- Overweeg eenmalige evaluatie middels FDG-PET-CT scan (whole body scan inclusief opname van de hals met de armen naar beneden). De groep adviseert geen specifieke afkap Tg-waarde voor deze indicatie aangezien deze sterk afhankelijk is van de meetmethode en de karakteristieken van de tumor. Klinische inzicht is van groot belang. Bespreek om die reden deze patiënten in het MDO met een level 1 ziekenhuis.
- Indien geen pathologische bevindingen bij de beeldvorming, zet follow-up voort middels ongestimuleerd Tg bepaling 1x/6-12 maanden. Herhaal op indicatie (bij voorbeeld bij afwijkende bevindingen bij lichamelijk onderzoek, richtinggevende klachten suggestief voor een structureel recidief en/of stijgende Tg) beeldvormende diagnostiek. Voor de overige overwegingen t.a.v. klinisch occulte recidieven zie module Behandeling recidief en metastasen op afstand).
- Indien pathologische bevindingen, beleid zoals bij structureel recidief (zie ook module Behandeling recidief en metastasen op afstand). Wanneer besloten wordt tot expectatief, kan de follow up plaats vinden middels bepaling van ongestimuleerd Tg en CT scans (frequentie van follow-up is afhankelijk van de klinische situatie). Herhaal de FDG-PET scan alleen maar op indicatie en bij voorkeur na overleg in MDO met een level 1 centrum.
- Overweeg eenmalige evaluatie middels FDG-PET-CT scan (whole body scan inclusief opname van de hals met de armen naar beneden). De groep adviseert geen specifieke afkap Tg-waarde voor deze indicatie aangezien deze sterk afhankelijk is van de meetmethode en de karakteristieken van de tumor. Klinische inzicht is van groot belang. Bespreek om die reden deze patiënten in het MDO met een level 1 ziekenhuis.
- Structureel onvoldoende of recidief:
- Overweeg lokale behandeling (operatie eventueel gevolgd door radioactief jodium behandeling of radioactief jodium en/of radiotherapie indien niet operabel) of expectatief met follow-up middels bepaling van ongestimuleerd Tg en beeldvorming (zie module Behandeling recidief en metastasen op afstand). Overweeg een FDG-PET-CT-scan te verrichten vooraf aan het definitief besluit met betrekking tot de lokale behandeling indien er therapeutische consequenties hieraan verbonden worden. Wanneer besloten wordt tot expectatief, kan de follow up plaats vinden middels CT-scans (frequentie van follow-up is afhankelijk van de klinische situatie). De FDG-PET scan wordt herhaald alleen maar op indicatie en bij voorkeur na overleg in MDO met een level 1 centrum.
- Inconclusief:
- Jaarlijkse controle middels ongestimuleerd Tg (en Tg-antistoffen) bepaling. Bij geen pathologische bevindingen of stabiele situatie herhaal de echografie van de hals 2 en 5 jaar na de primaire behandeling. Indien geen afwijkingen of stabiele situatie, staak de follow-up na maximaal 5-10 jaar.
- Intermediair risico totale thyreoïdectomie** zonder radioactief jodium behandeling
- Uitstekend respons:
- Herhaal de echo van de hals 2 en 5 jaar na de primaire behandeling. Indien geen afwijkingen, staak de follow-up.
- Structureel onvoldoende of recidief:
- Overweeg lokale behandeling (operatie eventueel gevolgd door radioactief jodium behandeling of radioactief jodium en/of radiotherapie indien niet operabel) of expectatief met follow-up middels bepaling van ongestimuleerd Tg en beeldvorming (zie module Behandeling recidief en metastasen op afstand). Overweeg een FDG-PET-CT-scan te verrichten vooraf aan het definitief besluit met betrekking tot de lokale behandeling indien er therapeutische consequenties hieraan verbonden worden.
Wanneer besloten wordt tot expectatief, kan de follow up plaats vinden middels CT-scans (frequentie van follow-up is afhankelijk van de klinische situatie). De FDG-PET scan wordt herhaald alleen maar op indicatie en bij voorkeur na overleg in MDO met een level 1 centrum.
- Inconclusief:
- Herhaal de echo van de hals 2 en 5 jaar na de primaire behandeling. Indien geen afwijkingen of stabiele situatie staak de follow-up na maximaal 5-10 jaar.
- Intermediair risico totale thyreoïdectomie gevolgd door radioactief jodium behandeling
- Uitstekend respons:
- Jaarlijkse controle middels ongestimuleerd Tg-bepaling gedurende 5 jaar na de primaire behandeling. Op basis van klinische factoren kan overwogen worden deze controles voor te zetten 5 jaar na de primaire behandeling met een frequentie van één keer per 2 jaar, tot maximaal 10 jaar na de primaire behandeling.
- Biochemisch onvoldoende:
- Overweeg eenmalige evaluatie middels FDG-PET-CT scan (whole body scan inclusief opname van de hals met de armen naar beneden). De groep adviseert geen specifieke afkap Tg-waarde voor deze indicatie aangezien deze sterk afhankelijk is van de meetmethode en de karakteristieken van de tumor. Klinische inzicht is van groot belang. Bespreek om die reden deze patiënten in het MDO met een level 1 ziekenhuis.
- Indien geen pathologische bevindingen bij de beeldvorming, zet follow-up voort middels palpatie van de hals (en zo nodig uitgebreidere lichamelijk onderzoek op geleide van de klinische verschijnselen) en middels ongestimuleerd Tg bepaling 1x/6-12 maanden. Herhaal op indicatie (bij voorbeeld bij afwijkende bevindingen bij lichamelijk onderzoek, richtinggevende klachten suggestief voor een structureel recidief en/of stijgende Tg) beeldvormende diagnostiek. Voor de overige overwegingen t.a.v. klinisch occulte recidieven zie module Behandeling recidief en metastasen op afstand).
- Indien pathologische bevindingen, beleid zoals bij structureel recidief (zie ook module Behandeling recidief en metastasen op afstand). Wanneer besloten wordt tot expectatief, kan de follow up plaats vinden middels bepaling van ongestimuleerd Tg en CT-scans (frequentie van follow-up is afhankelijk van de klinische situatie). Herhaal de FDG-PET scan alleen maar op indicatie en bij voorkeur na overleg in MDO met een level 1 centrum.
- Overweeg eenmalige evaluatie middels FDG-PET-CT scan (whole body scan inclusief opname van de hals met de armen naar beneden). De groep adviseert geen specifieke afkap Tg-waarde voor deze indicatie aangezien deze sterk afhankelijk is van de meetmethode en de karakteristieken van de tumor. Klinische inzicht is van groot belang. Bespreek om die reden deze patiënten in het MDO met een level 1 ziekenhuis.
- Structureel onvoldoende.
- Overweeg lokale behandeling (operatie eventueel gevolgd door radioactief jodium behandeling of radioactief jodium en/of radiotherapie indien niet operabel) of expectatief met follow-up middels bepaling van ongestimuleerd Tg en beeldvorming (zie module Behandeling recidief en metastasen op afstand). Overweeg een FDG-PET-CT-scan te verrichten vooraf aan het definitief besluit met betrekking tot de lokale behandeling indien er therapeutische consequenties hieraan verbonden worden.
Wanneer besloten wordt tot expectatief, kan de follow up plaats vinden middels CT scans (frequentie van follow-up is afhankelijk van de klinische situatie). De FDG-PET scan wordt herhaald alleen maar op indicatie en bij voorkeur na overleg in MDO met een level 1 centrum.
- Inconclusief:
- Controle middels ongestimuleerd Tg bepaling a 6-12 maanden en echografie van de hals 2 en 5 jaar na de primaire behandeling. Indien geen afwijkingen en/of stabiele situatie zet de follow-up voort middels jaarlijkse ongestimuleerd Tg bepalingen en echografie van de hals op indicatie. Wanneer anti-Tg antistoffen negatief worden en Tg niet aantoonbaar is en echografie van de hals geen afwijkingen laat zien, kan remissie vastgesteld worden. In dit geval kan de follow-up voortgezet worden middels jaarlijkse ongestimuleerd Tg bepalingen. Na een follow-up van maximaal 5-10 jaar kan de follow-up worden gestaakt.
- Hoog risico totale thyreoïdectomie gevolgd door radioactief jodium behandeling: Zie punt 6.
Follow-up advies na een behandeling van een recidief of persisterende ziekte
Aangezien over de follow up na een behandeling van een recidief of persisterende ziekte geen eenduidig behandeladvies kan worden gegeven dient op basis van de uitgangssituatie en de bevindingen op de post-therapiescan in het MDO een verder beleid te worden bepaald.
*Hier ontbreekt de categorie biochemisch onvoldoende omdat er voor deze patiënten geen betrouwbare Tg afkapwaarden gedefinieerd zijn om remissie vast te stellen. Zie module Risicostratificatie.
**Uitzondering: een hemithyreoïdectomie kan overwogen worden wanneer men vooraf aan de primaire operatie heeft besloten na gedeelde besluitvorming dat er geen behandeling met radioactief jodium zal plaats vinden. Dit kan ook het geval zijn wanneer men na de hemithyreoïdectomie een pT3a tumor heeft gevonden die afgezien van de pT3a stadium voldoet aan de criteria voor een laag risico en na gedeelde besluitvorming besluit om af te zien van de behandeling met radioactief jodium. Deze situaties zullen zich weinig voortdoen in de praktijk.Overwegingen
Voor- en nadelen van de interventie en de kwaliteit van het bewijs
In totaal zijn vier studies (retrospectief) beschreven die de diagnostische waarde van echografie (ultrasound; US) vergelijken met pathologie, biopsie (fine needle aspiration cytology (FNAC)) en/of thyreoglobuline (Tg) concentratie. Hierbij is voornamelijk FNAC gebruikt als referentietest (vier studies). Een I-131 scan en een post-therapeutic whole body scan (tWBS) werden als vergelijkingstest voor US onderzocht, beide in één studie. Verder zijn enkele studies gevonden die voldeden aan de PICO, maar een studiepopulatie van <100 hadden en om deze reden zijn geëxcludeerd. Eveneens is een studie gevonden waarbij onvoldoende gegevens beschikbaar zijn om de diagnostische waardes van US te berekenen. De geïncludeerde studies berusten allen op retrospectieve data, hebben sterk verschillende studiepopulaties (in type en stadium van de maligniteit en prevalentie ‘recurrent disease’) en verschillen eveneens qua type behandeling. Mede hierdoor konden resultaten niet samengevoegd/gecombineerd worden. Daarnaast werd in geen enkele studie de referentietest in alle geïncludeerde patiënten uitgevoerd. Mede door deze factoren verschillen de diagnostische waarden tussen de studies sterk, met name de sensitiviteit en de positief voorspellende waarde (PPV). De gradering van de bewijskracht voor alle uitkomstmaten voor US en 131I scan is zeer laag. Voor tWBS is de gradering van de bewijskracht van de sensitiviteit en de PPV zeer laag en voor de specificiteit en negatief voorspellende waarde (NPV) laag.
Aanvullende literatuur
De echografie van de hals is het meest gebruikte beeldvormend onderzoek voor de diagnostiek en follow-up van patiënten met schildkliercarcinoom. In het bijzonder is de echografie zeer waardevol bij de detectie van locoregionale recidieven na de primaire behandeling. In de context van het de-escaleren van de primaire behandeling voor schildkliercarcinoom, verdient de echografie van de hals een prominente plek bij de follow-up van de patiënten die alleen een hemithyreoïdectomie (HT) hebben ondergaan en die geen adjuvante radioactief jodium behandeling hebben gekregen (Gamble, 2020). Hoewel in de literatuur gerapporteerd wordt dat bij de helft van de laag risico patiënten die een totale thyreoïdectomie (TT) zonder radioactief jodium behandeling hebben ondergaan, een niet aantoonbaar Tg gevonden wordt (zie module Follow-up - Thyreoglobuline bepaling), waardoor bepaling van Tg zou kunnen gebruikt worden voor de follow-up, is de verwachting dat dit percentage lager is wanneer de operatie minder radicaal is en nog (normaal) rest schildklierweefsel aanwezig is postoperatief. Voor deze patiënten, kan de Tg minder goed gebuikt worden voor de follow-up en vindt de follow-up voornamelijk plaats middels echografie van de hals. De waarde van de echografie in de follow-up van patiënten met een schildkliercarcinoom hangt ook af van de vooraf kans op pathologische bevindingen. En dit vertaalt zich ook in de kosten-baten verhoudingen. In de studie van Wang (2016) in een serie van 752 patiënten met laag risico papillair schildkliercarcinoom, zoals in de ATA (2015) richtlijn gedefinieerd, geopereerd tussen 2000 en 2010, leed toepassing van routine herhaaldelijke echografie van de hals tot 5,3 keer stijging in het aantal onderzoeken per patiënt in het betreffende centrum. Dit terwijl er slechts 3/752 (0,4%) recidieven werden aangetoond. In de betreffende periode nam het aantal behandelingen met radioactief jodium bij deze categorie af van 40% in 2000 tot 8,7% in 2010. In hetzelfde centrum, rapporteert Wang (2015) een kosten-baten analyse m.b.t. de follow-up voor detectie van recidieven bij 1087 patiënten met schildkliercarcinoom (waarvan 363 laag risico; 561 intermediair risico en 164 hoog risico) afhankelijk van de risicoclassificatie. In deze studie werden in de eerste 36 maanden na thyreoïdectomie recidieven gevonden bij 0,8%, 7,8%, en 13,4% van de patiënten in de laag-, intermediair- en hoog risico categorieën. De kosten voor de detectie van een recidief bij patiënten met een laag risico tumor waren 6-7 keer hoger dan voor detectie van een recidief bij intermediair- of hoog risico.
Echografie van de hals kan ook aspecifieke bevindingen als gevolg hebben. In een retrospectief onderzoek van Yang (2015) in een serie van Memorial Sloan Kettering Center wordt na een mediane follow-up van 8 jaar bij 171 patiënten met een laag risico schildkliercarcinoom een structureel recidief kleiner of gelijk aan 1 cm gevonden bij 2 (1,2%) patiënten na een mediane duur van 2,8 jaar (range 1,6 - 4,1 jaar) na de primaire behandeling. Gedurende dezelfde periode werden er 114 (67%) aspecifieke afwijkingen gevonden tot aanvullende diagnostiek leden zonder het vaststellen van een recidief. In een ander retrospectief onderzoek van Yang (2015) van Memorial Sloan Kettering Center werd na een mediane follow-up van 10 jaar een structureel recidief gevonden bij 9 (10%) van de 90 intermediair risico patiënten (met een niet aantoonbaar basaal ongestimuleerd Tg na de primaire behandeling) na een mediane duur van 6,3 jaar na de primaire behandeling. Slechts 4 van deze patiënten hadden geen andere klinische uitingen van een recidief of aantoonbaar basaal ongestimuleerd Tg ten tijde van de diagnose. Daarentegen, fout-positieve bevindingen waren gevonden bij 51 (57%) van de 90 patiënten die tot aanvullende diagnostiek leden zonder het vaststellen van een recidief.
Op basis van deze studies kan geconcludeerd worden dat routinematige beeldvormende diagnostiek bij de laag en intermediair risico patiënten niet doelmatig is zolang er geen andere klinische (zoals palpabele bevindingen) of biochemische (zoals aantoonbaar Tg) uitingen zijn voor een recidief. Bovendien heeft dit naast een toename van het aantal (onnodige) onderzoeken ook niet klinisch relevante bevindingen als gevolg. Dit laatste leidt tot een toename in aanvullende diagnostiek en onnodige belasting voor de patiënt. Derhalve wordt in de huidige richtlijn het beleid aangepast op basis van het initiële risico inschatting en de herstadiëring na de evaluatie van de respons op de primaire behandeling. Het belangrijkste doel is de doelmatige detectie van voor de patiënt klinisch relevante recidieven.
Er is geen systematisch literatuuronderzoek uitgevoerd m.b.t. de duur van de follow-up bij de patiënten in de verschillende risico categorieën. In een retrospectieve studie (Durante, 2013) werd uit 1020 consecutieve patiënten vervolgt in 8 Italiaanse centra, waarvan 948 geen aanwijzingen hadden voor resttumor binnen een jaar na de primaire behandeling, een locoregionaal recidief vastgesteld bij 13 patiënten (1,4%) na een mediaan follow-up van 10,4 (5,1-20,4) jaar. Alle recidieven werden binnen 8 jaar vastgesteld; 10 van de 13 binnen 5 jaar en 6 binnen de eerste 3 jaar. Van de in deze studie geïncludeerde patiënten, hadden 61,3% van de patiënten een laag risico, 35,5% een intermediair risico en 3,2% een hoog risico, volgens de ATA 2015 criteria en 11,6% van de patiënten kreeg geen behandeling met radioactief jodium en het risico op een recidief was niet geassocieerd met deze therapie. Gezien het feit dat bij alle initiële risicogroepen meer dan 80% van de recidieven worden gevonden binnen de eerste 5 jaar na de primaire behandeling, lijkt een follow-up duur van 5-10 jaar bij patiënten met een uitstekende respons op de primaire behandeling voldoende.
Een studie gebaseerd op Nederlandse data tussen 2000 en 2020 (van Dijk, 2023) laat zien dat terugkeer van ziekte na een HT bij patiënten met een laag risico, unifocaal papillair microcarcinoom (pT1a) zonder vasculaire invasie zeldzaam is (<2%) en veelal binnen 2 jaar wordt ontdekt. Hierdoor lijkt de toegevoegde waarde van follow-up in deze patiëntengroep laag en moet deze worden afgewogen tegen de kans op onrust bij de patiënt ten gevolge van fout-positieve echografische bevindingen. Individuele patiëntbetrokkenheid door middel van gedeelde besluitvorming ondersteunt het kiezen van de meest geschikte follow-up optie. De richtlijn commissie is van mening dat follow-up na een incidenteel gevonden unifocaal papillair microcarcinoom vallende in de laag risico categorie achterwege gelaten kan worden. Dit betreffen dus papillaire microcarcinomen die per toeval gevonden zijn in resectiepreparaten van patiënten die om een andere reden een (hemi) thyreoïdectomie hebben ondergaan (zoals m. Graves of een symptomatisch multinodulair struma).
De werkgroep is van mening dat voor de patiënten met een initieel laag risico en een uitstekende respons bij herstadiëring de follow-up kan worden gestaakt na 5 jaar. Op basis van de beschikbare literatuur (en deels de nieuwe adviezen) houdt de werkgroep een follow-up van 5 jaar aan.
In de follow-up van patiënten na een hemithyreoïdectomie en na een totale thyreoïdectomie zonder adjuvante radioactief jodium behandeling vanwege een laag risico carcinoom >1-≤4 cm dient de lage kans op recidief na 5 jaar afgewogen te worden tegen de kans op onrust bij de patiënt t.g.v. fout-positieve echografische bevindingen. Het nut van follow-up langer dan 5 jaar dient met de patiënt besproken te worden. Hieronder wordt een handvat gegeven dat is opgesteld door de werkgroep.
Handvat – follow-up na herstadiëring
De aanbevolen follow-up strategie hangt nauw samen met de initiële risico-classificatie indeling van de goedgedifferentieerde schildkliertumor zoals beschreven in zie module Risicostratificatie en met de aanbevolen behandelstrategie zoals beschreven in zie module Behandeling.
Afhankelijk van de initiële risico inschatting en de primaire behandeling volgens shared decision making kunnen de volgende categorieën worden onderscheiden:
- Laag risico ≤1 cm met hemithyreoïdectomie.
- Laag risico >1-≤4 cm met hemithyreoïdectomie.
- Laag risico >1-≤4 cm met totale thyreoïdectomie zonder radioactief jodium behandeling.
- Laag risico >1-≤4 cm met totale thyreoïdectomie gevolgd door radioactief jodium behandeling.
- Intermediair risico met hemi- of totale thyreoïdectomie zonder radioactief jodium behandeling.
- Intermediair risico met totale thyreoïdectomie gevolgd door radioactief jodium behandeling.
- Hoog risico totale thyreoïdectomie gevolgd door radioactief jodium behandeling.
Alle patiënten ondergaan een evaluatie van de effectiviteit van de op de primaire behandeling een jaar na deze behandeling (zie module Risicostratificatie). Afhankelijk van het resultaat van deze onderzoeken vindt herstadiëring plaats (zie module Risicostratificatie):
- Uitstekend.
- Biochemisch onvoldoende.
- Structureel onvoldoende.
- Inconclusief.
De werkgroep beveelt aan om elke stap in de diagnostiek en behandelding van iedere individuele patiënt in het MDO te bespreken. In het bijzonder vereist de follow-up en behandeling van patiënten met een biochemisch onvoldoende of inconclusief en structureel onvoldoende respons klinische inzicht en expertise. De follow-up en behandeling van deze patiënten dient plaats te vinden in overleg met het multidisciplinaire team van een level 1 ziekenhuis, zie module Organisatie van zorg.
Bij patiënten met een biochemisch onvoldoende respons (aantoonbaar Tg zonder pathologische bevindingen bij de echografie) kan aanvullende beeldvormende diagnostiek middels een FDG-PET-CT scan waardevol zijn voor detectie van een mogelijk recidief of persisterende ziekte zowel locoregionaal als metastasen op afstand. De werkgroep adviseert geen specifieke afkap Tg-waarde voor deze indicatie aangezien deze sterk afhankelijk is van de meetmethode en de karakteristieken van de tumor. Klinische inzicht is van groot belang.
Bij patiënten met aantoonbaar structureel recidief kan de follow-up plaatsvinden middels echografie van de hals en/of diagnostische CT scans. Herhaling van FDG-PET-CT is alleen maar op indicatie nodig, bij voorkeur na overleg in het MDO met een level 1 ziekenhuis.
- De follow-up adviezen voor patiënten die slechts een hemithyreoïdectomie hebben ondergaan komen overeen met elkaar.
Uitzonderingen: bij patiënten met unifocale laag risico microcarcinomen kan na 2 jaar de follow-up achterwege worden gelaten. Bij patiënten met een per toeval gevonden laagrisico microcarcinoom (≤ 1 cm) in een schildklier resectiepreparaat kan follow-up achterwege worden gelaten.
- De follow-up adviezen van patiënten die een totale thyreoïdectomie hebben ondergaan zonder radioactief jodium behandeling komen overeen met elkaar, ongeacht de initiële risicoclassificatie.
- De follow-up adviezen van patiënten die een totale thyreoïdectomie hebben ondergaan gevolgd door radioactief jodium behandeling komen overeen met elkaar, ongeacht de initiële risicoclassificatie.
- Er wordt geen gebruik gemaakt van Tg bepalingen bij de follow-up van patiënten die geen totale thyreoïdectomie hebben ondergaan gevolgd door 131I behandeling.
- Er wordt geen gebruik gemaakt van gestimuleerde (middels onttrekking of rhTSH) Tg bepalingen bij de follow-up van patiënten met schildkliercarcinoom.
Waarden en voorkeuren van patiënten (en evt. hun verzorgers)
De echografie van de hals wordt standaard uitgevoerd in de follow-up van patiënten met schildklierkanker. Het wordt ervaren als een weinig belastend onderzoek. Als op de echografie afwijkingen worden gezien die kunnen passen bij metastasen van schildklierkanker, bestaat gedurende het onderzoek de mogelijkheid om direct weefsel te verkrijgen middels een dunnen naald aspiratie (FNAC).
Kosten (middelenbeslag)
De kosten van echografie van de hals zijn relatief laag in vergelijking met de andere beeldvormende onderzoeken. Desalniettemin, er zijn aanwijzingen dat het onnodig verrichten van beeldvormend onderzoek gepaard gaat met ‘extra’ kosten.
Aanvaardbaarheid, haalbaarheid en implementatie
De echografie is in alle ziekenhuizen in Nederland beschikbaar en wordt nu al routinematig ingezet in de follow-up van patiënten met schildklierkanker. Een nadeel van het onderzoek is dat de uitvoering operator afhankelijk is. De kwaliteit van de beschikbare literatuur is laag en in de klinische praktijk is de echografie van patiënten met aantoonbaar Tg na thyreoïdectomie en radioactief jodium vaak negatief. Hierdoor wordt vaak overgegaan om meer geavanceerde technieken zoals FDG PET-CT.
Rationale van de aanbeveling:
De gradering van het wetenschappelijke bewijs wordt gegradeerd met “low” of “very low”. Desalniettemin, zijn er veel retrospectieve data over de waarde van de echografie van de hals bij de follow-up van patiënten met schildklierkanker, de techniek is relatief goedkoop, overal beschikbaar en er is veel praktische ervaring met de echografie van de hals. Een postoperatief verrichte echografie in combinatie met de Tg bepaling 6-12 maanden na de thyreoïdectomie zijn de belangrijkste onderzoeken om de effecten van de primaire behandeling vast te stellen. Op basis hiervan vindt herstadiëring plaats. In deze richtlijn is gekozen voor een termijn van 12 maanden na de primaire behandeling te definiëren voor ter behoefte van herstadiëring. Dit omdat bij sommige patiënten de Tg-waarde nog dalende is na 6 maanden follow-up en deze patiënten onterecht in de categorie biochemisch onvoldoende zouden kunnen vallen als de herstadiëring te vroeg plaats vindt. Daarnaast streven we hiermee naar een uniform beleid in Nederland ten aanzien van herstadiëring. Er verdient echter wel de overweging om bij patiënten met een hoog risico op recidief of bij patiënten met bekende structurele macroscopische metastasen deze evaluatie eerder plaats te laten vinden wanneer dit therapeutische consequenties heeft (bijvoorbeeld een aanvullende behandeling met I131 of een operatie). Een routinematige echografie van de hals bij patiënten zonder klinische aanwijzingen voor een recidief én met een niet aantoonbaar Tg kan echter aspecifieke bevindingen aantonen die tot onnodige aanvullende diagnostiek leiden. Dit kan zorgen voor onrust bij de patiënt. Daarentegen laat de echografie vaak geen afwijkingen zien bij patiënten met aantoonbaar Tg na thyreoïdectomie en radioactief jodium behandeling. Dit kan duiden op klinisch occulte locoregionale ziekte of afstandsmetastasen. In dit geval kan aanvullende beeldvorming gebruikt worden voor de detectie dan wel het uitsluiten van deze metastasen. Vanwege de lage sensitiviteit van dit onderzoek wordt het routinematige uitvoering van een diagnostische 131I of 123I scan niet aanbevolen bij de follow-up van patiënten met schildkliercarcinoom.
Flowchart
De aanbevelingen van dit onderdeel kunnen gedeeltelijk worden samengevat in de volgende flowchart, zie bij FlowchartFollow-up.
Onderbouwing
Achtergrond
Echografie van de hals wordt momenteel aanbevolen in de follow-up van het schildkliercarcinoom na operatieve behandeling en eventuele behandeling met I-131. Standaard aanbevelingen in internationale richtlijnen omvatten regelmatige herhaling van de echografie ongeachte de waarde van de tumormarker thyreoglobuline. Deze aanbevelingen baseren echter veelal op literatuur van >20 jaar oud en houden geen rekening met de ontwikkelingen in resolutie van de echografie en de sensitiviteit van de thyreoglobuline meting. Ook is deze oudere literatuur vaak gebaseerd op retrospectieve data. Het is daarom van belang de recentere literatuur te evalueren, mede in afhankelijkheid van de spiegel van de tumormarker thyreoglobuline.
Conclusies
Sensitivity
Very low GRADE | The sensitivity of ultrasound for detection of lymph node metastases in patients with thyroid carcinoma at follow-up, ranges from 74% to 100%, using FNA, histology, cytology, RAI imaging and/or positive I-131 cervical uptake as reference. The sensitivity of I-131 scan for detection of lymph node metastases in patients with thyroid carcinoma at follow-up, is 28%, using FNA as reference. The sensitivity of tWBS for detection of lymph node metastases in patients with thyroid carcinoma at follow-up, is 40%, using FNA, histology and/or positive I-131 cervical uptake as reference. Source: Chindris, 2012; Lepoutre-Lussey, 2014; Verburg, 2018; Yang, 2015 |
Specificity
Very low GRADE Low GRADE | The specificity of ultrasound for detection of lymph node metastases in patients with thyroid carcinoma at follow-up, ranges from 55% to 99%, using FNA, histology, cytology, RAI imaging and/or positive I-131 cervical uptake as reference. The specificity of I-131 scan for detection of lymph node metastases in patients with thyroid carcinoma at follow-up, is 93%, using FNA as reference. The specificity of tWBS for detection of lymph node metastases in patients with thyroid carcinoma at follow-up, is 80%, using FNA, histology and/or positive I-131 cervical uptake as reference. Source: Chindris, 2012; Lepoutre-Lussey, 2014; Verburg, 2018; Yang, 2015 |
Positive predictive value (PPV)
Very low GRADE | The PPV of ultrasound for detection of lymph node metastases in patients with thyroid carcinoma at follow-up, ranges from 3% to 61%, using FNA, histology, cytology, RAI imaging and/or positive I-131 cervical uptake as reference. The PPV of I-131 scan for detection of lymph node metastases in patients with thyroid carcinoma at follow-up, is 18%, using FNA as reference. The PPV of tWBS for detection of lymph node metastases in patients with thyroid carcinoma at follow-up, is 31%, using FNA, histology and/or positive I-131 cervical uptake as reference. Source: Chindris, 2012; Lepoutre-Lussey, 2014; Verburg, 2018; Yang, 2015 |
Negative predictive value (NPV)
Very low GRADE Low GRADE | The NPV of ultrasound for detection of lymph node metastases in patients with thyroid carcinoma at follow-up, ranges from 96% to 100%, using FNA, histology, cytology, RAI imaging and/or positive I-131 cervical uptake as reference. The NPV of I-131 scan for detection of lymph node metastases in patients with thyroid carcinoma at follow-up, is 96%, using FNA as reference. The NPV of tWBS for detection of lymph node metastases in patients with thyroid carcinoma at follow-up, is 85%, using FNA, histology and/or positive I-131 cervical uptake as reference. Source: Chindris, 2012; Lepoutre-Lussey, 2014; Verburg, 2018; Yang, 2015 |
Samenvatting literatuur
Description of studies
Chindris (2012) performed a retrospective cohort study to assess the utility of neck ultrasound (US) in thyroid cancer patients with a suppressed thyroid globulin (Tg-supp) value below 0.1 ng/ml. All included patients (n = 163) had undergone thyroidectomy and at least one dose of radioactive iodine treatment (RAI) as initial therapy. All patients received a recombinant human TSH (rhTSH)-stimulated Tg (Tg-stim) within 60 days. Mean age was 47 years at time of initial surgery (range 16-82) and the proportion of males was 31%. The interval between the last RAI treatment and Tg-stim was 27.5 months (range 6–96) months. In 138 patients, serial Tg-supp levels were obtained over a median of 3.6 years (up to 9.6 years). Neck US images were obtained in 153 patients. A total of 597 US exams were done with a median follow-up of three years (range 0 to 9.6 years). These were compared to an I-131 scan. As reference, fine-needle aspirates (FNA) were done for cytological examination in case of a suspicious US. The prevalence of recurrent disease was 7/153 (4.6%). The study was limited by risk of bias due to interpretation of the FNA results with knowledge of the US exams. Next, FNA (reference) was not performed in all patients.
Lepoutre-Lussey (2014) performed a retrospective cohort study to the value of post-operative cervical US (POCUS) in the detection of persistent disease (PD) in patients with PTC. A total of 638 patients were included who underwent total thyroidectomy and RAI ablation therapy (within 12 months of surgery). The median age of the study population was 42.2 years (range 11.3 to 82.2) and the proportion of males was 25%. POCUS was performed on average 90 days after surgery and compared to assessment of Tg via RAI-Tg (at 4 weeks of thyroid hormone withdrawal or after stimulation by rTSH during follow-up) or post-therapeutic whole-body scans (tWBS, performed five days after RAI ablation). Median follow-up time was 41.6 months (range 6-171 months), consisting of follow-up visits at 6 months, 12 months, and every 3 years for the following 7 years. The reference for assessing recurrence of PD or late recurrence (L-RD) after surgery was assessed via histology, FNA or positive I131 cervical uptake. The prevalence of recurrent disease was 138/638 (21.6%). The overall risk of bias of the study was low.
Verburg (2018) performed a retrospective database study to determine whether there is a clinical benefit from routine cervical US in patients with differentiated TC (DTC). Records from a total of 773 patients with outpatient non-TSH-stimulated follow-up procedures after RAI ablation therapy. The median age of the study population was 47.1 (range 5 to 87) and the proportion of males was 29%. All patients underwent total thyroidectomy. After surgery and RAI ablation therapy, TSH-suppressive levothyroxine treatment was initiated throughout follow-up. Lifelong follow-up with half-year intervals for the first five years with yearly follow-up visits thereafter. At least one neck US was performed at each follow-up visit, with a total of 3176 US images among all patients. In addition, 6-12 months after the first RAI ablation dose, whole body scans (WBS) and Tg measurements were performed. FNA was performed in case of highly suspicious lymph nodes. The prevalence of recurrent disease on the US images was 285/3176 (9.0%). It is unclear which exact number of patients this involves. The study was limited by risk of bias due to interpretation of the FNA results by the US results and risk factors. Next, FNA (reference) was not performed in all patients.
Yang (2015) performed a retrospective cohort study to evaluate the findings from serial US evaluations performed in patients with low-risk PTC (according to the American Thyroid Association (ATA)). A total of 171 patients who underwent total thyroidectomy, with (39%) or without (61%) RAI ablation therapy, with no suspicious finding on the initial postoperative neck US and absence of interfering anti-Tg antibodies (TgAB). Median age was 42 years at diagnosis and the proportion of males was 14%. The median follow-up duration was 8 years (range 2 to 42 years). Patients underwent a median of five neck US (range 2 to 17). Furthermore, five patients had CT/MRI scans, one patient underwent a PET scan and 9 patients underwent biopsy under US-guidance. The reference for abnormalities found with US was histology, cytology or RAI imaging. The prevalence of recurrent disease was 2/171 (1.2%). The study was limited by risk of bias due to interpretation of the reference results with knowledge of the US exams. Next, the reference was not performed in all patients.
Results
- US versus FNA/histology/cytology/RAI imaging/positive I-131 cervical uptake
All studies reported on the diagnostic performance of US with FNA (Chindris, 2012; Verburg, 2018), a combination of histology/cytology/RAI imaging (Yang, 2015) or a combination of FNA, histology and positive I-131 cervical uptake (Lepoutre-Lussey, 2014) as reference. Verburg (2018) reported results separately for patients at low-risk and at high-risk for recurrence. Yang (2015) reported results for US images post-operatively and thereafter separately for patients with a positive and negative US scan.
Sensitivity
The sensitivity ranged from 74% to 100%, see Table 1.
Specificity
The specificity ranged from 55% to 99%, see Table 1.
Positive predictive value (PPV)
The PPV ranged from 3% to 61%, see Table 1.
Negative predictive value (NPV)
The NPV ranged from 96% to 100%, see Table 1.
Table 2. Diagnostic values of US versus FNA/histology/cytology/RAI imaging/positive I-131 cervical uptake.
Study | Sensitivity (95%CI) | Specificity (95%CI) | PPV (95%CI) | NPV (95%CI) |
Chindris, 2012 | 86% | 92% | 33% | 99% |
Lepoutre-Lussey, 2014 | 82.64% (74.70% to 88.92%) | 87.43% (84.26% to 90.16%) | 60.61% (54.72% to 66.20%) | 95.56% (93.58% to 96.95%) |
Verburg, 2018 (total) | 75.8% (71.1% -81.5%) | 76.1% (74.3% -77.8%) | 23.8% (18.1% -29.5%) | 97.0% (96.2% -97.7%) |
Verburg, 2018 (low-risk) | 87.3% (68.7% -87.8%) | 76.4% (73.7% -79.1%) | 19.5% (10.4% -28.7%) | 98.0% (97.1% -98.8%) |
Verburg, 2018 (high-risk) | 74.2% (70.0% -81.4%) | 75.7% (73.3% -78.1%) | 26.3% (19.0% -33.6%) | 98.0% (97.1% -98.8%) |
Yang, 2015 (post-operative) | 100% (16% to 100%) | 55% (47% to 63%) | 3% (2% to 3%) | 100% (96% to 100%) |
Yang, 2015 (follow-up after negative US) | n.a. | 59% (48% to 69%) | n.a. | 100% (94% to 100%) |
Yang, 2015 (follow-up after positive US) | 100% (16% to 100%) | 18% (10% to 28%) | 3% (3% to 4%) | 100% (75% to 100%) |
- I-131 scan versus FNA
One study reported on the diagnostic performance of a I-131 scan with FNA as reference (Chindris, 2012). Table 2 provides an overview of the sensitivity, specificity, PPV and NPV.
Table 3. Diagnostic values of I-131 scan versus FNA.
Study | Sensitivity (95%CI) | Specificity (95%CI) | PPV (95%CI) | NPV (95%CI) |
Chindris, 2012 | 28% | 93% | 18% | 96% |
- tWBS versus FNA/histology/positive I-131 cervical uptake
One study reported on the diagnostic performance of tWBS with histology, FNA or positive I131 cervical uptake as reference (Lepoutre-Lussey; 2014). Table 3 provides an overview of the sensitivity, specificity, PPV and NPV.
Table 4. Diagnostic values of tWBS versus FNA/histology/positive I-131 cervical uptake.
Study | Sensitivity (95%CI) | Specificity (95%CI) | PPV (95%CI) | NPV (95%CI) |
Lepoutre-Lussey, 2014 | 39.67% (30.89%-48.96%) | 80.46% (76.78%-83.80%) | 32.21% (26.41%-38.63%) | 85.07% (83.06%-86.88%) |
Level of evidence of the literature
The level of evidence came from diagnostic performance studies and therefore started as high.
- US versus reference
The level of evidence regarding the outcome measure sensitivity was downgraded by three levels to very low because of study limitations (reference test only performed in small number of patients, low prevalence of recurrence in several studies, -2 levels for risk of bias); applicability (difference in type of study population and reference test, -1 level for indirectness) and number of included patients (wide confidence intervals, -1 level for imprecision).
The level of evidence regarding the outcome measure specificity was downgraded by three levels to very low because of study limitations (reference test only performed in small number of patients, low prevalence of recurrence in several studies, -2 levels for risk of bias); applicability (difference in type of study population and reference test, -1 level for indirectness) and number of included patients (wide confidence intervals, -1 level for imprecision).
The level of evidence regarding the outcome measure PPV was downgraded by three levels to very low because of study limitations (reference test only performed in small number of patients, low prevalence of recurrence in several studies, -2 levels for risk of bias); applicability (difference in type of study population and reference test, -1 level for indirectness) and number of included patients (wide confidence intervals, -1 level for imprecision).
The level of evidence regarding the outcome measure NPV was downgraded by three levels to very low because of study limitations (reference test only performed in small number of patients, low prevalence of recurrence in several studies, -2 levels for risk of bias) and applicability (difference in type of study population and reference test, -1 level for indirectness).
- I-131 scan versus reference
The level of evidence regarding the outcome measure sensitivity was downgraded by three levels to very low because of study limitations (reference test only performed in small number of patients, low prevalence of recurrence -2 levels for risk of bias) and number of included patients (small and single study, no CI reported, -2 levels for imprecision).
The level of evidence regarding the outcome measure specificity was downgraded by three levels to very low because of study limitations (reference test only performed in small number of patients, low prevalence of recurrence -2 levels for risk of bias) and number of included patients (small and single study, no CI reported, -2 levels for imprecision).
The level of evidence regarding the outcome measure PPV was downgraded by three levels to very low because of study limitations (reference test only performed in small number of patients, low prevalence of recurrence -2 levels for risk of bias) and number of included patients (small and single study, no CI reported, -2 levels for imprecision).
The level of evidence regarding the outcome measure NPV was downgraded by three levels to very low because of study limitations (reference test only performed in small number of patients, low prevalence of recurrence -2 levels for risk of bias) and number of included patients (small and single study, no CI reported, -2 levels for imprecision).
- tWBS versus reference
The level of evidence regarding the outcome measure sensitivity was downgraded by two levels to very low because of applicability (specific study population (N1-PTC patients), -1 level for indirectness) and number of included patients (single study, wide confidence interval, -2 levels for imprecision).
The level of evidence regarding the outcome measure sensitivity was downgraded by two levels to low because of applicability (specific study population (N1-PTC patients), -1 level for indirectness) and number of included patients (single study, -1 level for imprecision).
The level of evidence regarding the outcome measure PPV was downgraded by two levels to very low because of applicability (specific study population (N1-PTC patients), -1 level for indirectness) and number of included patients (single study, wide confidence interval, -2 levels for imprecision).
The level of evidence regarding the outcome measure NPV was downgraded by two levels to low because of applicability (specific study population (N1-PTC patients), -1 level for indirectness) and number of included patients (single study, -1 level for imprecision).
Zoeken en selecteren
A systematic review of the literature was performed to answer the following question:
What are the benefits/harms of ultrasound for detection of lymph node metastases in patients with thyroid carcinoma in follow-up compared with pathology/fine needle biopsy/thyroglobulin?
P: patients with differentiated thyroid cancer after surgery
I: ultrasound
C: pathology, fine needle biopsy, thyroglobulin
O: diagnostic values (e.g. negative predictive value, positive predicative value)
Relevant outcome measures
The guideline development group considered sensitivity as a critical outcome measure for decision making, and the other diagnostic values as important.
A priori, the working group did not define the outcome measures listed above but used the definitions used in the studies.
Search and select (Methods)
The databases Medline (via OVID) and Embase (via Embase.com) were searched with relevant search terms until 03-08-2022. The detailed search strategy is depicted under the tab Methods. The systematic literature search resulted in 970 hits. Studies were selected based on the following criteria;
- patients with differentiated thyroid cancer after surgery
- comparing ultrasound with pathology, fine needle biopsy, thyroglobulin,
- reporting at least one of the outcome of interest.
Twenty-two articles were initially selected based on title and abstract screening. After reading the full text, fourteen studies were excluded (see the table with reasons for exclusion under the tab Methods), and eight studies were included.
Although, one of the additional inclusion criteria were N ≥100 participants. Therefore, four additional studies were excluded, see table in Methods.
Results
Four studies were included in the analysis of the literature. Important study characteristics and results are summarized in the evidence tables. The assessment of the risk of bias is summarized in the risk of bias tables.
Referenties
Chindris AM, Diehl NN, Crook JE, Fatourechi V, Smallridge RC. Undetectable sensitive serum thyroglobulin (<0.1 ng/ml) in 163 patients with follicular cell-derived thyroid cancer: results of rhTSH stimulation and neck ultrasonography and long-term biochemical and clinical follow-up. J Clin Endocrinol Metab. 2012 Aug;97(8):2714-23. doi: 10.1210/jc.2011-3017. Epub 2012 May 25. PMID: 22639286.
van Dijk SPJ, Coerts HI, Loncar I, Verhoef C, Kruijff S, Engelsman AF, Peeters RP, van Ginhoven TM. Deescalating Follow-up After Hemithyroidectomy for Patients With Low-risk Papillary Thyroid Microcarcinoma. JAMA Otolaryngol Head Neck Surg. 2023 Jan 1;149(1):42-48. doi: 10.1001/jamaoto.2022.3686. PMID: 36416850; PMCID: PMC9685547.
Durante C, Montesano T, Torlontano M, Attard M, Monzani F, Tumino S, Costante G, Meringolo D, Bruno R, Trulli F, Massa M, Maniglia A, D'Apollo R, Giacomelli L, Ronga G, Filetti S; PTC Study Group. Papillary thyroid cancer: time course of recurrences during postsurgery surveillance. J Clin Endocrinol Metab. 2013 Feb;98(2):636-42. doi: 10.1210/jc.2012-3401. Epub 2013 Jan 4. PMID: 23293334.
Gambale C, Elisei R, Matrone A. Management and follow-up of differentiated thyroid cancer not submitted to radioiodine treatment: a systematic review. Minerva Endocrinol. 2020 Dec;45(4):306-317. doi: 10.23736/S0391-1977.20.03240-X. Epub 2020 Jul 3. PMID: 32623845.
Lepoutre-Lussey C, Maddah D, Golmard JL, Russ G, Tissier F, Trésallet C, Menegaux F, Aurengo A, Leenhardt L. Post-operative neck ultrasound and risk stratification in differentiated thyroid cancer patients with initial lymph node involvement. Eur J Endocrinol. 2014 Jun;170(6):837-46. doi: 10.1530/EJE-13-0888. Epub 2014 Mar 21. PMID: 24659355.
Verburg FA, Mäder U, Giovanella L, Luster M, Reiners C. Low or Undetectable Basal Thyroglobulin Levels Obviate the Need for Neck Ultrasound in Differentiated Thyroid Cancer Patients After Total Thyroidectomy and 131I Ablation. Thyroid. 2018 Jun;28(6):722-728. doi: 10.1089/thy.2017.0352. Epub 2018 May 14. PMID: 29665748.
Wang LY, Roman BR, Palmer FL, Tuttle RM, Shaha AR, Shah JP, Patel SG, Ganly I. Effectiveness of routine ultrasonographic surveillance of patients with low-risk papillary carcinoma of the thyroid. Surgery. 2016 May;159(5):1390-5. doi: 10.1016/j.surg.2015.11.018. Epub 2015 Dec 31. PMID: 26747227; PMCID: PMC4991630.
Wang LY, Roman BR, Migliacci JC, Palmer FL, Tuttle RM, Shaha AR, Shah JP, Patel SG, Ganly I. Cost-effectiveness analysis of papillary thyroid cancer surveillance. Cancer. 2015 Dec 1;121(23):4132-40. doi: 10.1002/cncr.29633. Epub 2015 Aug 17. PMID: 26280253; PMCID: PMC4976498.
Yang SP, Bach AM, Tuttle RM, Fish SA. SERIAL NECK ULTRASOUND IS MORE LIKELY TO IDENTIFY FALSE-POSITIVE ABNORMALITIES THAN CLINICALLY SIGNIFICANT DISEASE IN LOW-RISK PAPILLARY THYROID CANCER PATIENTS. Endocr Pract. 2015 Dec;21(12):1372-9. doi: 10.4158/EP15851.OR. Epub 2015 Sep 15. PMID: 26372300; PMCID: PMC5027141.
Peiling Yang S, Bach AM, Tuttle RM, Fish SA. Frequent screening with serial neck ultrasound is more likely to identify false-positive abnormalities than clinically significant disease in the surveillance of intermediate risk papillary thyroid cancer patients without suspicious findings on follow-up ultrasound evaluation. J Clin Endocrinol Metab. 2015 Apr;100(4):1561-7. doi: 10.1210/jc.2014-3651. Epub 2015 Jan 29. PMID: 25632970; PMCID: PMC7372578.
Evidence tabellen
Evidence tables
Study reference | Study characteristics | Patient characteristics | Index test (test of interest) | Reference test | Follow-up | Outcome measures and effect size | Comments |
Chindris, 2012 | Type of study[1]: retrospective study Setting and country: hospital, USA Funding and conflicts of interest: This work was supported by the Mayo Clinic and a generous gift from Alfred D. and Audrey M. Petersen. No COI disclosed. | Inclusion criteria: all thyroid cancer patients who had rhTSH tests between August 2001 and June 2011. And who after surgery and 131I had a Tg-supp value below 0.1 ng/ml (and negative thyroglobulin antibody) with an rhTSH test within 60 days. Exclusion criteria: N=153 persons with serial neck ultrasound. A total of 597 US exams were done, with a median (range) follow-up of 3.0 yr (0 months to 9.6 yr) Prevalence: 7 of 153 US showed recurrences. Mean age ± SD: 47y (16-82) for initial surgery 52y (20-85) for rhTSH study Sex: 31% M 69% F Other important characteristics: | Describe index test: neck ultrasonography images were obtained using a high-frequency linear-array transducer (8–12 MHz). Cut-off point(s): See article Comparator test[2]: 131I- scan Cut-off point(s): See article | Describe reference test[3]: Fine-needle aspirates (FNA) were done for cytological examination in patients with Tg below 0.1 ng/ml Cut-off point(s): | Time between the index test en reference test: Not mentioned For how many participants were no complete outcome data available? N (%) 10 ? Reasons for incomplete outcome data described? Patients were not included since Tg was above 0.1 ng/ml | Outcome measures and effect size (include 95%CI and p-value if available)4: US vs. FNA Sensitiviteit: 86% (6/7) Specificiteit: 92% (134/146) PPV: 33% (6/18) NPV: 99% (134/135) 131I scan vs FNA | Limitaties door auteur: A limitation to our study is represented by its retrospective design and therefore with the inherent inclusion of patients who had extensive history of disease before their evaluation here. Eighty of the 163 patients included in our study had their first endocrinology visit within 12 months from the initial surgery. This, however, reflects common clinical practice in a tertiary referral center and makes possible observing the course of the disease over a long period of time. Conclusie door auteur: In conclusion, we believe that in almost all patients with DTC whose T4-suppressed serum Tg is below 0.1 ng/ml, long-term monitoring with annual Tg-supp and periodic neck US are adequate. In our experience, the results of rhTSH testing do not impact or change management and therefore are not needed. |
De Campos, 2022 | Type of study: retrospective longitudinal single-center study. Setting and country: hospital, Portugal Funding and conflicts of interest: Funding not clear no potential conflict of interest relevant to this article was reported. | Inclusion criteria: patients followed in the Thyroid Group Consultation (TGC) between January 2017 and October 2020 with low- and intermediate-risk PTC, according to the 2015 ATA guidelines. AND i) age at diagnosis of 18 years old or higher; ii) histologically confirmed diagnosis of PTC; iii) risk of recurrence classified as low or intermediate, according to the ATA Initial Risk Stratification System (1); iv) primary treatment consisting of total thyroidectomy (with or without central and/or lateral neck dissection and with or without RRA); v) Tg, TgAb and TSH levels at FUV-1 and at the five-year follow-up visit (FUV-5) available; and vi) neck US reports of FUV-1 and FUV-5. Exclusion criteria: i) patients with suspicion or evidence of disease and/or TgAb positivity at FUV-1, ii) histological diagnosis of other DTC: follicular or Hürthle cell carcinoma or aggressive DTC variants (e.g., hobnail, tall-cell, columnar cell), and iii) any missing data from the inclusion criteria. N=88 Group 1: N=80 Group 2: N=8 Prevalence: Mean age ± SD: Group 1: 48.3 ± 13.6 Group 2: 46.9 ± 16.4 Sex: % M / % F Group 1: 13 (16.3%) M 67 (83.8%) F Group 2: 0 (0%) M 8 (100.0%) F Other important characteristics: | Describe index test: High-resolution gray-scale and color Doppler US studies of the thyroid bed and neck lymph node compartments Cut-off point(s): we classified the patients’ neck US as US-N if all the nodes were considered normal, US-I if no suspicious nodes but one or more indeterminate node was present or US-S if at least one node was classified as suspicious Comparator test: Cut-off point(s): | Describe reference test: Serum Tg Cut-off point(s): i) Negative (Tg-N) if undetectable, that is, <0.20 ng/mL; ii) Indeterminate (Tg-I) if detectable but <1 ng/mL; iii) Suspicious (Tg-S) if =1 ng/mL. | Time between the index test en reference test: For how many participants were no complete outcome data available? 96/184 (52%) Reasons for incomplete outcome data described? 68 patients for missing data, six for suspicious Tg levels (Tg-S; >1 ng/mL), 10 for TgAb positivity at FUV-1 and 12 for neck lymph node status of US-I or US-S at FUV-1, we included a total of 88 cases. | Outcome measures and effect size (include 95%CI and p-value if available): Group 1 (n=80) Year 5: 100.0% (95.5%-100.0%) TP=0; FP = 3; FN=0; TN-= 77 Last follow-up: 98.8% (93.2%-100.0%) Group 2 (n=8) patients with positive Tg and US at year 1 Year 5: 75.0% (34.9%-96.8%) At FUV-5, of the eight patients, six had a US-N status.(FP) Last follow-up: 87.5% (47.4%-99.7%) a total of seven patients had US-N status (FP) | Limitaties: Focus more on Tg and not on ultrasound. Conclusies door auteur: In conclusion, our results show that low- and intermediate-risk PTC patients treated with total thyroidectomy with an excellent response to treatment (normal US, undetectable unstimulated Tg and negative TgAb levels) at the 1-year evaluation can be safely monitored with regular unstimulated serum Tg assessments. In these patients, neck USs should be reserved for those patients with rising serum Tg levels and/or TgAb titers. |
Epstein, 2018 | Type of study: retrospective chart review Setting and country: Academic institution, USA? Funding and conflicts of interest: Funding and COI not clear | Inclusion criteria: (1) had a diagnosis of PTC; (2) underwent near-total or total thyroidectomy; (3) showed no evidence of distant metastatic disease on initial imaging; (4) underwent RAI ablation therapy; (5) had postoperative serum Tg levels obtained, with negative anti-Tg antibody results; and (6) had postoperative US examinations within 6 months before or 6 months after the serum Tg level test Exclusion criteria: excluded because serum Tg was not measured postoperatively; US examinations were not performed postoperatively; RAI ablation was not performed; or they had positive Tg antibody results N=118 Prevalence: 9 Mean age ± SD: 44.9 (range: 14-87) Sex: 25.4% M 74.6% F Other important characteristics: | Describe index test: Neck US Cut-off point(s): See article Comparator test: Cut-off point(s): | Describe reference test: US-guided FNA Cut-off point(s): | Time between the index test en reference test: Not described For how many participants were no complete outcome data available? N=245/363 (67%) Reasons for incomplete outcome data described? | Outcome measures and effect size (include 95%CI and p-value if available): Among 76 patients with undetectable serum Tg levels, there were 19 examinations in 18 patients in which US raised the possibility of recurrence. None of these 18 patients had recurrence by FNA (n58) or clinical follow-up of at least 1 year (n510). Among 65 patients with elevated serum Tg levels, there were 24 examinations in 22 patients in which US raised the possibility of recurrence. Twelve patients underwent FNA, with 9 patients (34.6%) showing PTC; 7 patients had follow-up neck US examinations showing stability of findings; and 3 patients were lost to follow up. | Limitaties: Conclusies door auteur: Neck US did not identify recurrent PTC when the serum Tg level was undetectable in patients who underwent total thyroidectomy and RAI therapy. Eliminating neck US when serum TG levels are undetectable could decrease unnecessary imaging examinations without negatively affecting the ability to detect recurrent disease. |
Lepoutre-Lussey, 2014 | Type of study: Retrospective cohort study Setting and country: Hospital, France Funding and conflicts of interest: This research did not receive any specific grant from any funding agency in the public, commercial or not-for-profit sector | Inclusion criteria: N1-PTC patients referred to our center for RAI after thyroidectomy, and systematically underwent a post-operative cervical ultrasound (POCUS) examination. Exclusion criteria:
N=638 Prevalence: Recurrence: 138/638 (21.6 %) of which 121/638 (18.9%) persistent disease. Recurrence was diagnosed by histology for 116 patients (86%), positive 131I cervical uptake for 13 patients (9.6%), and FNAB for nine patients (5%). Mean age ± SD: Median 42.2 (range 11.3-82.2) Sex: 24.4% M 75.5% F Other important characteristics: | Describe index test: post-operative cervical ultrasound (POCUS) Cut-off point(s): According to the recent US European guidelines, the US result was considered suspicious when at least one of the following features was detected: i) a vascular hypoechogenic mass in the thyroid bed, with or without microcalcifications or cystic areas, ii) a LN with at least one of the following signs: microcalcifications, cystic areas, peripheral or anarchic vascularization, echogenicity similar to thyroid tissue (hyperechoic area). Comparator test: Postoperative s-Tg (RAI-Tg) and post-therapeutic whole body scans (tWBS) Cut-off point(s): An RAI-Tg value O10 mg/l was considered suspicious for persistent or recurrent disease. | Describe reference test: The diagnosis of recurrence was assessed by histological analysis after surgery, by fine-needle aspiration biopsy (FNAB; malignant cytological result and/or Tg washout measurement O10 mg/l (15)), or positive 131I cervical uptake after a 131I diagnostic (11.1 MBq) or therapeutic (3.7 GBq) dose Cut-off point(s): Recurrence was divided into two groups depending on the date of occurrence (Fig. 1): i) Persistence (PD) if disease was detected at ablation and/or at 6 months of follow-up without documented disease-free period. ii) Late recurrence (l-RD) if no PD was detected and when recurrence was detected after a normal check-up at 6 months (negative cervical US, s-Tg %1 mg/l (and/or in case of detectable anti-Tg antibody, if the d-WBS was normal)). | Time between the index test en reference test:
For how many participants were no complete outcome data available? Ninety-three patients were excluded: 75 without follow-up in our institution, eight without examination during the first 6 months after radioiodine therapy, four with no primary tumor discovered (Tx), and six with unavailable data. Reasons for incomplete outcome data described? | Outcome measures and effect size (include 95%CI and p-value if available): For the detection of PD, sensitivity, specificity, NPV, and PPV of POCUS were 82.6, 87.4, 95.6, and 60.6% respectively. POCUS vs. reference Sensitivity 82.64% (74.70% to 88.92%) Specificity 87.43% (84.26% to 90.16%) PPV: 60.61%(54.72% to 66.20%) NPV: 95.56% (93.58% to 96.95%) tWBS vs reference Sensitivity: 39.67% (30.89% to 48.96%) Specificity: 80.46% (76.78% to 83.80%) PPV 32.21% (26.41% to 38.63%) NPV : 85.07% (83.06% to 86.88%) | Conclusies door auteur: the results of this large cohort study highlight the crucial diagnostic role of POCUS in detection of PD. A normal POCUS result combined with a low RAI-Tg level allows the clinician to reassure the patient by re-stratifying his case into the LR N1-PTC category. Thus, our results support the introduction of a systematic POCUS in individualized risk assessment to improve therapeutic interventions and follow-up management. Limitaties: |
Liu, 2018 | Type of study: cohort Setting and country: Hospital, China Funding and conflicts of interest: Funding not clear. The authors declare that they have no conflicts of interest. | Inclusion criteria: DTC patients who visited the outpatients department for follow-up between September 2014 and August 2016 were enrolled in our study. All patients had undergone total or near-total thyroidectomy and received consecutive high-dose RIT which achieved successful thyroid remnant ablation. Blood sampling 131 for laboratory data, including Tg and TgAb; I-WBS and neck US were examined every 6 or 12 months Exclusion criteria: Not mentioned N=49 Prevalence: 20/49 (40.8%) positive neck ultrasound Mean age ± SD: 42.7±12.9 years Sex: 9/49: 18.4% M 40/49: 81.6% F Other important characteristics: n.a. | Describe index test: Neck ultrasound Cut-off point(s): The US features suggestive of metastatic lymph nodes included: a) round shape (long axis to short axis ratio <1.5), b) absence of an echogenic hilum, c) microcalcifications, d) cystic changes and peripheral blood flow on the color Doppler image [6]. Comparator test: 18F-FDG PET/CT Cut-off point(s): See article. | Describe reference test: pathology Cut-off point(s): | Time between the index test en reference test: Not mentioned For how many participants were no complete outcome data available? Unclear Reasons for incomplete outcome data described? Unclear US vs. reference: Sensi : 66.67% (38.38% to 88.18%) Spec: 70.59%(52.52% to 84.90%) 18F-FDG PET/CT vs. reference: Sensi: 93.33%(68.05% to 99.83%) Spec: 70.59% (52.52% to 84.90%) PPV: 58.33%(44.98% to 70.57%) | Outcome measures and effect size (include 95%CI and p-value if available): neck US: 10/15 = 66.67% sensitivity 24/34 = 70.59% specificity 10/20 = 50.00% PPV 24/29 = 82.76% NPV F-FDG PET/CT imaging: 14/15 = 93.33% sensitivity 24/34 = 70.59% specificity 14/24 = 58.33% PPV 24/25 = 96.00% NPV | Conclusies door auteur: In the 131 49 DTC patients with elevated serum levels of TgAb but negative findings in serum Tg and in I-WBS, neck 18 US and F-FDG PET/CT imaging supported the clinical diagnosis and suggested subsequent treatment. Limitaties: Heel kleine studie |
Verburg, 2018 | Type of study: Retrospective database study Setting and country: University of Würzburg, Germany Funding and conflicts of interest: F.A.V. was a consultant to Bayer Healthcare and SanofiGenzyme and has received speaker honoraria from Diasorin and SanofiGenzyme. For several more funding statements: see article. The other authors declare that they have no competing financial interests pertaining to this study. | Inclusion criteria: Records were selected of all outpatient non-TSH-stimulated follow-up procedures after 131I ablation without evidence of antithyroglobulin antibody interference performed since the introduction of a Tg assay with a functional sensitivity of <1 ug/L in the hospital on June 15, 1996. Data collection ended at the moment of data extraction on July 1, 2012 Exclusion criteria: N=773 patients, N=3176 US Prevalence: Mean age ± SD: 47.1 (5-87) at diagnosis Sex: 228: 29.5% M 545: 70.5% F Other important characteristics: | Describe index test: Neck ultrasound Cut-off point(s): High suspicious lymph nodes: with one or more characteristics of a diameter >1cm, those with a non-oval shape, with a missing fat-hilus sign, with a more echo-intense signal, or an increased perfusion). More details in paper. Comparator test: Tg Cut-off point(s): | Describe reference test: FNA biopsy A scan was deemed true positive if further supporting evidence in the form of histology, cytology, radiodine scanning, or ather ancillary studies was found within six months Cut-off point(s): | Median (range) time since diagnosis at exam: 2.9y (0.1-31.3) Time between the index test en reference test: For how many participants were no complete outcome data available? Reasons for incomplete outcome data described? | Outcome measures and effect size (include 95%CI and p-value if available): US. Vs. FNA 2199/3176 US true negative 216/3176 US true positive 692/3176 US false positive 69/3176 US false negative. Sensi: 75.8% (71.1-81.5%) Speci: 76.1% (74.3-77.8%)) PPV: 23.8% (18.1-29.5%) NPV: 97.0% (96.2-97.7%) Accuracy: 76.0% (74.3-77.7%) Low risk group: Sensi: 87.3% (68.7-87.8%) Speci: 76.4% (73.7-79.1%) PPV: 19.5% (10.4-28.7%) NPV: 98.0% (97.1-98.8%) High risk group: Sensi: 74.2% (70.0-81.4%) Speci: 75.7% (73.3-78.1%) PPV: 26.3% (19.0-33.6%) NPV: 98.0% (97.1-98.8%) | Conclusies door auteur: After total thyroidectomy and 131I ablation, neck ultrasound should be reserved only for anti-Tg antibody negative patients with a Tg level of ≥1 ug/L. Limitaties: Data collectie tot 2012, >10j geleden. Retrospective database study, data collection was not designed for the purpose of this research question. Since the database was only filled with a one-worde summary of the examination, namely “pathologic” or “normal”, the retrospective nature of the study and the highly observer-dependent methodology of NUS make it impossible to expand further on the precise nature and localization of the pathological findings. |
Wei, 2018 | Type of study: RCT Setting and country: Oncology department of hospital, China Funding and conflicts of interest: | Inclusion criteria: accessible metastatic LN before operation, and PTC patients with metastatic LN underwent total thyroidectomy or selective neck dissection. Patients without metastasis were diagnosed by biopsy, all tumors were examined by one pathologist, and tumor size and the presence of LN metastasis were recorded completely. Exclusion criteria: extrathyroidal extension or distant metastasis N= 93 Prevalence of recurrence after 3 -year: 9/93 (10%) LN metastasis after resection was present in 69/93 (74.19%) And not in 24/93 (25.81%) | Describe index test: US Cut-off point(s): See article. Comparator test: CT Cut-off point(s): See article. | Describe reference test: biopsy Cut-off point(s): | Duration of follow-up: 3 years. Time between the index test en reference test: For how many participants were no complete outcome data available? None. Reasons for incomplete outcome data described? Na.a. | Outcome measures and effect size (include 95%CI and p-value if available): Diagnostic values only present of patients with LN metastasis after surgery. Appraisal value (%) US Sensitivity PPV: 69/77 (89.61) NPV: Accuracy: CT Sensitivity PPV: 69/85 (81.18) NPV: Accuracy: Combination Sensitivity PPV: 69/73 (94.52) NPV: Accuracy: The 1-year recurrence or metastasis rates in 24 LN non-metastasis patients and 69 LN metastasis patients were 0, while the 3-year recurrence or metastasis rates were 1/24 (4.54%) and 8/69 (11.27%), respectively. | Limitations: Not possible to recalculate diagnostic values. Conclusion author: The results of the present study indicate that in the preoperative assessment of LN in patients with PTC, the combined examination of US and CT is superior to each method alone in the diagnosis of LN metastases in the central and bilateral regions of the neck and is worthy of clinical promotion. |
Yang, 2015 | Type of study: Retrospective cohort Setting and country: Hospital, USA Funding and conflicts of interest: | Inclusion criteria: patients with thyroid cancer treated with total thyroidec‐ tomy and radioiodine ablation (RAI) who had serial neck US performed during their early fol‐ low-up at our center between 1999 and 2009. And Exclusion criteria: N=90 Prevalence of atypical finding on US: 41/90 (46%) Median age at start of sty entry was 45.9. Sex: 66/90 (73%) Female Other important characteristics: zie follow-up | Describe index test: Neck Ultrasound Cut-off point(s): See article. Comparator test: serum Tg measurement on Cut-off point(s): See article. | Describe reference test: Histology Cut-off point(s): | Median duration of follow-up: 10 years (range 2-16). Time between the index test en reference test: For how many participants were no complete outcome data available? N.a. retrospective study Reasons for incomplete outcome data described? See above. | Outcome measures and effect size (include 95%CI and p-value if available): US vs. histology Post operative. 4 cases in histology 41 patients with findings US Sensitivity 1.00 (95%CI 0.38 to 1.00) Specificity 0.57 (95%CI 0.46 to 0.68) PPV 0.10 (95%CI 0.08 to 0.12) NPV 1.00 (95%CI 0.93 to 1.00) During follow-up In patients with negative US Sensitivity Specificity 0.67 (95%CI 0.51 to 0.80) PPV NPV During follow-up In patients with findings US Sensitivity 1.00 (95%CI 0.48 to 1.00) Specificity 0.00 (95%CI 0.00 to 0.10) PPV 0.12 (95%CI 0.12 to 0.12) NPV Na. | Conclusion author: In ATA intermediate-risk patients who have a nonstimulated thyroglobulin less than 1.0 ng/mLand a neck US without suspicious findings after therapy, frequent US screening during follow-up is more likely to identify false-positive abnormalities than clinically significant structural dis‐ ease recurrence. Only 90 patients. |
Yang, 2015b | Type of study: Retrospective cohort Setting and country: Hospital, USA Funding and conflicts of interest: | Inclusion criteria: ATA low-risk patients with PTC treated with total thyroidectomy, with(out) RAI, who had serial neck US during following , and
Exclusion criteria: - N= 171 Prevalence of atypical finding on US: 114/171 (67%) Median age at diagnose was 42. Sex: 141/171 (86%) Female Other important characteristics: zie follow-up | Describe index test: Neck Ultrasound Cut-off point(s): See article. Comparator test: serum Tg measurement on Cut-off point(s): See article. | Describe reference test: Histology Cut-off point(s): | Median duration of follow-up: 8 years (range 2-42). Duration >10 years (n/N, %): 58/171 (34%). Time between the index test en reference test: For how many participants were no complete outcome data available? N.a. retrospective study Reasons for incomplete outcome data described? See above. | Outcome measures and effect size (include 95%CI and p-value if available): US vs. histology Post operative. 2 cases in histology 78 patients with findings US Sensitivity 1.00 (95%CI 0.16 to 1.00) Specificity 0.55 (95%CI 0.47 to 0.63) PPV 0.03 (95%CI 0.02 to 0.03) NPV 1.00 (95%CI 0.96 to 1.00) During follow-up In patients with negative US Sensitivity Specificity 0.59 (95%CI 0.48 to 0.69) PPV NPV During follow-up In patients with findings US Sensitivity 1.00 (95%CI 0.16 to 1.00) Specificity 0.18 (95%CI 0.10 to 0.28) PPV 0.03 (95%CI 0.03 to 0.04) NPV 1.00 (95%CI 0.75 to 1.00) | Conclusion author: neck US in the early years of follow-up in ATA low-risk PTC patients without evidence of structural disease on postoperative neck US is more likely to identify false positive results than true structural disease. Furthermore, routine US surveillance in the absence of clinical indications for recurrent disease rarely identifies clinically significant disease during follow-up. Therefore, we recommend surveillance neck US no more frequently than every 3 to 5 years in ATA low-risk patients with atypical, nonsuspicious findings on the initial postoperative neck US. If the initial postoperative neck US is negative, no further neck US is necessary in the absence of clinical indicators of recurrence limitations: difference in technology between 1994 and 2010. |
Risk of bias tables
Study reference | Patient selection | Index test | Reference standard | Flow and timing | Comments with respect to applicability |
Chindris, 2012 | Was a consecutive or random sample of patients enrolled? No, retrospective cohort Was a case-control design avoided? Yes, retrospective cohort. Did the study avoid inappropriate exclusions? Yes, strict inclusion criteria. | Were the index test results interpreted without knowledge of the results of the reference standard? Yes If a threshold was used, was it pre-specified? Yes | Is the reference standard likely to correctly classify the target condition? Yes Were the reference standard results interpreted without knowledge of the results of the index test? No | Was there an appropriate interval between index test(s) and reference standard? Unclear. Did all patients receive a reference standard? No Did patients receive the same reference standard? Yes Were all patients included in the analysis? Yes. | Are there concerns that the included patients do not match the review question? No Are there concerns that the index test, its conduct, or interpretation differ from the review question? No Are there concerns that the target condition as defined by the reference standard does not match the review question? No |
CONCLUSION: Could the selection of patients have introduced bias? RISK: Low, retrospective cohort. | CONCLUSION: Could the conduct or interpretation of the index test have introduced bias? RISK: LOW | CONCLUSION: Could the reference standard, its conduct, or its interpretation have introduced bias? RISK: High, based on Tg/US, FNA | CONCLUSION Could the patient flow have introduced bias? RISK: Unclear, not all patients received reference test. | Some risk of bias. |
Lepoutre-Lussey, 2014 | Was a consecutive or random sample of patients enrolled? No, retrospective cohort study Was a case-control design avoided? Yes Did the study avoid inappropriate exclusions? Yes, strict inclusion criteria. | Were the index test results interpreted without knowledge of the results of the reference standard? Yes If a threshold was used, was it pre-specified? Yes | Is the reference standard likely to correctly classify the target condition? Yes Were the reference standard results interpreted without knowledge of the results of the index test? Yes | Was there an appropriate interval between index test(s) and reference standard? Yes, after 90 days. Did all patients receive a reference standard? Yes (?) Did patients receive the same reference standard? Yes Were all patients included in the analysis? Yes. | Are there concerns that the included patients do not match the review question? No Are there concerns that the index test, its conduct, or interpretation differ from the review question? No Are there concerns that the target condition as defined by the reference standard does not match the review question? No |
CONCLUSION: Could the selection of patients have introduced bias? RISK: Low, retrospective cohort. | CONCLUSION: Could the conduct or interpretation of the index test have introduced bias? RISK: LOW | CONCLUSION: Could the reference standard, its conduct, or its interpretation have introduced bias? RISK: Low | CONCLUSION Could the patient flow have introduced bias? RISK: Low. | Low |
Verburg, 2018 | Was a consecutive or random sample of patients enrolled? No, retrospective cohort Was a case-control design avoided? Yes, retrospective cohort. Did the study avoid inappropriate exclusions? Yes, strict inclusion criteria. | Were the index test results interpreted without knowledge of the results of the reference standard? No If a threshold was used, was it pre-specified? Yes | Is the reference standard likely to correctly classify the target condition? Yes Were the reference standard results interpreted without knowledge of the results of the index test? No | Was there an appropriate interval between index test(s) and reference standard? Yes, every follow-up visit. Did all patients receive a reference standard? Unclear Did patients receive the same reference standard? Yes Were all patients included in the analysis? Yes. | Are there concerns that the included patients do not match the review question? No Are there concerns that the index test, its conduct, or interpretation differ from the review question? No Are there concerns that the target condition as defined by the reference standard does not match the review question? No Low |
CONCLUSION: Could the selection of patients have introduced bias? RISK: Low, retrospective cohort. | CONCLUSION: Could the conduct or interpretation of the index test have introduced bias? RISK: LOW | CONCLUSION: Could the reference standard, its conduct, or its interpretation have introduced bias? RISK: Some concerns, based on risk factors and US. | CONCLUSION Could the patient flow have introduced bias? RISK: Unclear if all patients received reference standard. |
Yang, 2015b | Was a consecutive or random sample of patients enrolled? No, retrospective cohort Was a case-control design avoided? Yes, retrospective cohort. Did the study avoid inappropriate exclusions? Yes, strict inclusion criteria. | Were the index test results interpreted without knowledge of the results of the reference standard? No If a threshold was used, was it pre-specified? Yes | Is the reference standard likely to correctly classify the target condition? Yes Were the reference standard results interpreted without knowledge of the results of the index test? No | Was there an appropriate interval between index test(s) and reference standard? Unclear. Did all patients receive a reference standard? No Did patients receive the same reference standard? Yes Were all patients included in the analysis? Yes. | Are there concerns that the included patients do not match the review question? No Are there concerns that the index test, its conduct, or interpretation differ from the review question? No Are there concerns that the target condition as defined by the reference standard does not match the review question? No |
CONCLUSION: Could the selection of patients have introduced bias? RISK: No, retrospective cohort. | CONCLUSION: Could the conduct or interpretation of the index test have introduced bias? RISK: LOW | CONCLUSION: Could the reference standard, its conduct, or its interpretation have introduced bias? RISK: High, based on US, histology | CONCLUSION Could the patient flow have introduced bias? RISK: Unclear, not all patients received reference test. |
Judgments on risk of bias are dependent on the research question: some items are more likely to introduce bias than others, and may be given more weight in the final conclusion on the overall risk of bias per domain:
Patient selection:
- Consecutive or random sample has a low risk to introduce bias.
- A case control design is very likely to overestimate accuracy and thus introduce bias.
- Inappropriate exclusion is likely to introduce bias.
Index test:
- This item is similar to “blinding” in intervention studies. The potential for bias is related to the subjectivity of index test interpretation and the order of testing.
- Selecting the test threshold to optimise sensitivity and/or specificity may lead to overoptimistic estimates of test performance and introduce bias.
Reference standard:
- When the reference standard is not 100% sensitive and 100% specific, disagreements between the index test and reference standard may be incorrect, which increases the risk of bias.
- This item is similar to “blinding” in intervention studies. The potential for bias is related to the subjectivity of index test interpretation and the order of testing.
Flow and timing:
- If there is a delay or if treatment is started between index test and reference standard, misclassification may occur due to recovery or deterioration of the condition, which increases the risk of bias.
- If the results of the index test influence the decision on whether to perform the reference standard or which reference standard is used, estimated diagnostic accuracy may be biased.
- All patients who were recruited into the study should be included in the analysis, if not, the risk of bias is increased.
Judgement on applicability:
Patient selection: there may be concerns regarding applicability if patients included in the study differ from those targeted by the review question, in terms of severity of the target condition, demographic features, presence of differential diagnosis or co-morbidity, setting of the study and previous testing protocols.
Index test: if index tests methods differ from those specified in the review question there may be concerns regarding applicability.
Reference standard: the reference standard may be free of bias but the target condition that it defines may differ from the target condition specified in the review question.
Epstein, 2018 | Was a consecutive or random sample of patients enrolled? No, retrospective chart review Was a case-control design avoided? Yes Did the study avoid inappropriate exclusions? Yes, strict inclusion criteria. | Were the index test results interpreted without knowledge of the results of the reference standard? Yes If a threshold was used, was it pre-specified? Yes | Is the reference standard likely to correctly classify the target condition? Yes Were the reference standard results interpreted without knowledge of the results of the index test? No | Was there an appropriate interval between index test(s) and reference standard? Yes, within 6 months. Did all patients receive a reference standard? No Did patients receive the same reference standard? Yes Were all patients included in the analysis? Yes. | Are there concerns that the included patients do not match the review question? No Are there concerns that the index test, its conduct, or interpretation differ from the review question? No Are there concerns that the target condition as defined by the reference standard does not match the review question? No |
CONCLUSION: Could the selection of patients have introduced bias? RISK: Low, retrospective chart review. | CONCLUSION: Could the conduct or interpretation of the index test have introduced bias? RISK: LOW | CONCLUSION: Could the reference standard, its conduct, or its interpretation have introduced bias? RISK: High, based on US, FNA | CONCLUSION Could the patient flow have introduced bias? RISK: Unclear, not all patients received reference test. | Some risk of bias. |
De Campos, 2022 | Was a consecutive or random sample of patients enrolled? No, retrospective cohort Was a case-control design avoided? Yes, retrospective cohort. Did the study avoid inappropriate exclusions? Yes, strict inclusion criteria. | Were the index test results interpreted without knowledge of the results of the reference standard? No If a threshold was used, was it pre-specified? Yes | Is the reference standard likely to correctly classify the target condition? No Were the reference standard results interpreted without knowledge of the results of the index test? Unclear | Was there an appropriate interval between index test(s) and reference standard? Unclear. Did all patients receive a reference standard? Yes Did patients receive the same reference standard? Yes Were all patients included in the analysis? Yes. | Are there concerns that the included patients do not match the review question? No Are there concerns that the index test, its conduct, or interpretation differ from the review question? No Are there concerns that the target condition as defined by the reference standard does not match the review question? Yes |
CONCLUSION: Could the selection of patients have introduced bias? RISK: No, retrospective cohort. | CONCLUSION: Could the conduct or interpretation of the index test have introduced bias? RISK: LOW | CONCLUSION: Could the reference standard, its conduct, or its interpretation have introduced bias? RISK: High, Tg not gold standard | CONCLUSION Could the patient flow have introduced bias? RISK: Unclear. | ||
Wei, 2018 | Was a consecutive or random sample of patients enrolled? Yes, RCT Was a case-control design avoided? Yes, RCT Did the study avoid inappropriate exclusions? Yes | Were the index test results interpreted without knowledge of the results of the reference standard? No If a threshold was used, was it pre-specified? Yes, | Is the reference standard likely to correctly classify the target condition? Yes Were the reference standard results interpreted without knowledge of the results of the index test? No. | Was there an appropriate interval between index test(s) and reference standard? Yes Did all patients receive a reference standard? Yes Did patients receive the same reference standard? Yes Were all patients included in the analysis? Yes | Are there concerns that the included patients do not match the review question? Yes Are there concerns that the index test, its conduct, or interpretation differ from the review question? Yes Are there concerns that the target condition as defined by the reference standard does not match the review question? Yes |
CONCLUSION: Could the selection of patients have introduced bias? RISK: LOW, RCT | CONCLUSION: Could the conduct or interpretation of the index test have introduced bias? RISK: High, category based on surgery. | CONCLUSION: Could the reference standard, its conduct, or its interpretation have introduced bias? RISK: High, first reference thereafter index | CONCLUSION Could the patient flow have introduced bias? RISK: Low | ||
Yang, 2015 | Was a consecutive or random sample of patients enrolled? No, retrospective cohort Was a case-control design avoided? Yes, retrospective cohort. Did the study avoid inappropriate exclusions? Yes, strict inclusion criteria. | Were the index test results interpreted without knowledge of the results of the reference standard? No If a threshold was used, was it pre-specified? Yes | Is the reference standard likely to correctly classify the target condition? Yes Were the reference standard results interpreted without knowledge of the results of the index test? No | Was there an appropriate interval between index test(s) and reference standard? Unclear. Did all patients receive a reference standard? No Did patients receive the same reference standard? Yes Were all patients included in the analysis? Yes. | Are there concerns that the included patients do not match the review question? No Are there concerns that the index test, its conduct, or interpretation differ from the review question? No Are there concerns that the target condition as defined by the reference standard does not match the review question? No |
CONCLUSION: Could the selection of patients have introduced bias? RISK: No, retrospective cohort. | CONCLUSION: Could the conduct or interpretation of the index test have introduced bias? RISK: LOW | CONCLUSION: Could the reference standard, its conduct, or its interpretation have introduced bias? RISK: High, based on US, histology | CONCLUSION Could the patient flow have introduced bias? RISK: Unclear, not all patients received reference test. |
Liu, 2018 | Was a consecutive or random sample of patients enrolled? Unclear Was a case-control design avoided? Yes, cohort. Did the study avoid inappropriate exclusions? Yes, strict inclusion criteria. | Were the index test results interpreted without knowledge of the results of the reference standard? Yes If a threshold was used, was it pre-specified? Yes | Is the reference standard likely to correctly classify the target condition? Yes Were the reference standard results interpreted without knowledge of the results of the index test? No | Was there an appropriate interval between index test(s) and reference standard? Yes Did all patients receive a reference standard? No. Did patients receive the same reference standard? Yes Were all patients included in the analysis? Yes. | Are there concerns that the included patients do not match the review question? No Are there concerns that the index test, its conduct, or interpretation differ from the review question? No Are there concerns that the target condition as defined by the reference standard does not match the review question? No |
CONCLUSION: Could the selection of patients have introduced bias? RISK: Some concerns, study design unclear. | CONCLUSION: Could the conduct or interpretation of the index test have introduced bias? RISK: LOW | CONCLUSION: Could the reference standard, its conduct, or its interpretation have introduced bias? RISK: High, based on index test, reference test. | CONCLUSION Could the patient flow have introduced bias? RISK: Some concerns, not all patients received reference test. |
Exclusietabel
Referentie | Reden voor exclusie |
de Campos Lopes SG, Dias Silva Ferreira DN, Fernandes VAR, da Costa Cardoso Marques HM, da Silva Santos Pereira RF, Monteiro AMC. The role of neck ultrasound in the follow-up of low- and intermediate- risk papillary thyroid cancer. Arch Endocrinol Metab. 2022 Sept 08;66(4):481-488. doi: 10.20945/2359-3997000000485. Epub 2022 Jun 23. PMID: 35758832. | Less than 100 participants |
Liu J, Liu B, Yu Y, Chao F, Liu Y, Han X. 18F-FDG PET/CT and ultrasonogrpahy in differentiated thyroid carcinoma patients with elevated serum levels of antithyroglobulin antibody, negative Tg and whole body 131I scan. Hell J Nucl Med. 2018 Jan-Apr;21(1):24-27. doi: 10.1967/s002449910703. Epub 2018 Mar 20. PMID: 29550843. | Less than 100 participants |
Wei Q, Wu D, Luo H, Wang X, Zhang R, Liu Y. Features of lymph node metastasis of papillary thyroid carcinoma in ultrasonography and CT and the significance of their combination in the diagnosis and prognosis of lymph node metastasis. J BUON. 2018 Jul-Aug;23(4):1041-1048. PMID: 30358209. | Less than 100 participants |
Peiling Yang S, Bach AM, Tuttle RM, Fish SA. Frequent screening with serial neck ultrasound is more likely to identify false-positive abnormalities than clinically significant disease in the surveillance of intermediate risk papillary thyroid cancer patients without suspicious findings on follow-up ultrasound evaluation. J Clin Endocrinol Metab. 2015 Apr;100(4):1561-7. doi: 10.1210/jc.2014-3651. Epub 2015 Jan 29. PMID: 25632970; PMCID: PMC7372578. | Less than 100 participants |
Referentie | Reden voor exclusie |
Alabousi M, Alabousi A, Adham S, Pozdnyakov A, Ramadan S, Chaudhari H, Young JEM, Gupta M, Harish S. Diagnostic Test Accuracy of Ultrasonography vs Computed Tomography for Papillary Thyroid Cancer Cervical Lymph Node Metastasis: A Systematic Review and Meta-analysis. JAMA Otolaryngol Head Neck Surg. 2022 Feb 1;148(2):107-118. doi: 10.1001/jamaoto.2021.3387. PMID: 34817554; PMCID: PMC8613701. | P not according to PICO, pre-operative |
Gambale C, Elisei R, Matrone A. Management and follow-up of differentiated thyroid cancer not submitted to radioiodine treatment: a systematic review. Minerva Endocrinol. 2020 Dec;45(4):306-317. doi: 10.23736/S0391-1977.20.03240-X. Epub 2020 Jul 3. PMID: 32623845. | Review, for considerations |
Domínguez JM, Nilo F, Contreras T, Carmona R, Droppelmann N, González H, Iturrieta V, Tuttle RM. Neck Sonography and Suppressed Thyroglobulin Have High Sensitivity for Identifying Recurrent/Persistent Disease in Patients With Low-risk Thyroid Cancer Treated With Total Thyroidectomy and Radioactive Iodine Ablation, Making Stimulated Thyroglobulin Unnecessary. J Ultrasound Med. 2017 Nov;36(11):2299-2307. doi: 10.1002/jum.14260. Epub 2017 May 24. PMID: 28543974. | Not only US |
Gray JL, Singh G, Uttley L, Balasubramanian SP. Routine thyroglobulin, neck ultrasound and physical examination in the routine follow up of patients with differentiated thyroid cancer-Where is the evidence? Endocrine. 2018 Oct;62(1):26-33. doi: 10.1007/s12020-018-1720-3. Epub 2018 Aug 20. PMID: 30128957; PMCID: PMC6153587. | O not according to PICO |
AlNoury MK, Almuhayawi SM, Alghamdi KB, Al-Noury KI. Preoperative imaging modalities to predict the risk of regional nodal recurrence in well-differentiated thyroid cancers. Int Arch Otorhinolaryngol. 2015 Apr;19(2):116-20. doi: 10.1055/s-0034-1396521. Epub 2014 Dec 8. PMID: 25992165; PMCID: PMC4399163. | P not according to PICO, pre-operative |
Censi S, De Rosa A, Galuppini F, Manso J, Bertazza L, Merante-Boschin I, Plebani M, Faggian D, Pennelli G, Barollo S, Vianello F, Iacobone M, Mian C. Can ultrasensitive thyroglobulin immunoassays avoid the need for ultrasound in thyroid cancer follow-up? Endocrine. 2022 Mar;75(3):837-845. doi: 10.1007/s12020-021-02936-2. Epub 2021 Nov 20. PMID: 34800265. | Not according to PICO, focus on TG-antibodies |
Choi YS, Kim DW, Lee YJ, Ha TK, Jung SJ, Baek HJ. Appropriate Neck Ultrasonography Surveillance During the First 10 Years After Hemithyroidectomy in Papillary Thyroid Microcarcinoma Patients: A Single-Center Study. Ultrasound Q. 2019 Sep;35(3):275-280. doi: 10.1097/RUQ.0000000000000429. PMID: 30789488. | P not according to PICO |
Ryoo I, Kim DW, Lee CY, Huh JY, Lee S, Ahn HS, Sung JY. Analysis of postoperative ultrasonography surveillance after total thyroidectomy in patients with papillary thyroid carcinoma: a multicenter study. Acta Radiol. 2018 Feb;59(2):196-203. doi: 10.1177/0284185117700448. Epub 2017 Mar 26. PMID: 28343399. | P not according to PICO |
Choi JW, Lee JH, Baek JH, Choi BS, Jeong KS, Ryu JS, Kim TY, Kim WB, Shong YK. Diagnostic accuracy of ultrasound and 18-F-FDG PET or PET/CT for patients with suspected recurrent papillary thyroid carcinoma. Ultrasound Med Biol. 2010 Oct;36(10):1608-15. doi: 10.1016/j.ultrasmedbio.2010.07.013. PMID: 20850026. | Not only US |
Yoon J, Yoon JH, Han K, Lee J, Kim EK, Moon HJ, Park VY, Kwak JY. Ultrasonography surveillance in papillary thyroid carcinoma patients after total thyroidectomy according to dynamic risk stratification. Endocrine. 2020 Aug;69(2):347-357. doi: 10.1007/s12020-020-02347-9. Epub 2020 May 24. PMID: 32449109. | P not according to PICO |
Epstein S, McEachern R, Khot R, Padia S, Patrie JT, Itri JN. Papillary Thyroid Carcinoma Recurrence: Low Yield of Neck Ultrasound With an Undetectable Serum Thyroglobulin Level. J Ultrasound Med. 2018 Oct;37(10):2325-2331. doi: 10.1002/jum.14580. Epub 2018 Mar 2. PMID: 29498418. | According to PICO, but lack of data. Diagnostic accuracy not reported and not retractable. |
Baek HJ, Kim DW, Lee S, Ryoo I, Lee CY, Choi YJ, Sung JY. Postoperative ultrasonography surveillance in patients with follicular thyroid carcinoma: a multicenter study. Radiol Med. 2017 Jul;122(7):530-537. doi: 10.1007/s11547-017-0753-7. Epub 2017 Mar 14. PMID: 28293811. | P not according to PICO |
Blažeković I, Romić M, Bosak Butković M, Šiško Markoš I, Gladić Nenadić V, Vidranski V, Petranović Ovčariček P, Krilić D, Varjačić T, Staničić J, Granić R, Punda M, Mihaljević I, Jukić T, Franceschi M. Thyroglobulin Measurement in Needle Aspiration for Detection of Recurrences and Neck Metastases in Patients with Differentiated Thyroid Carcinoma: Significance of Anti-Tg Antibodies. Acta Clin Croat. 2020 Jun;59(Suppl 1):9-17. doi: 10.20471/acc.2020.59.s1.01. PMID: 34219879; PMCID: PMC8212602. | Not according to PICO, focus on TG-antibodies |
Wu J, Hu X, Seal P, Amin P, Diederichs B, Paschke R. Improvement in neck ultrasound report quality following the implementation of European Thyroid Association guidelines for postoperative cervical ultrasound for thyroid cancer follow-up, a prospective population study. Eur Thyroid J. 2023 Aug 11;12(5):e230110. doi: 10.1530/ETJ-23-0110. PMID: 37439446; PMCID: PMC10448586. | Not according to PICO, prediction model. For considerations |
Epstein S, McEachern R, Khot R, Padia S, Patrie JT, Itri JN. Papillary Thyroid Carcinoma Recurrence: Low Yield of Neck Ultrasound With an Undetectable Serum Thyroglobulin Level. J Ultrasound Med. 2018 Oct;37(10):2325-2331. doi: 10.1002/jum.14580. Epub 2018 Mar 2. PMID: 29498418. | No diagnostic values |
Verantwoording
Autorisatiedatum en geldigheid
Laatst beoordeeld : 30-09-2024
Laatst geautoriseerd : 30-09-2024
Geplande herbeoordeling : 30-09-2026
Initiatief en autorisatie
Initiatief:
- Nederlandse Internisten Vereniging
Geautoriseerd door:
- Nederlandse Internisten Vereniging
- Nederlandse Vereniging voor Heelkunde
- Nederlandse Vereniging voor Nucleaire geneeskunde
- Nederlandse Vereniging voor Pathologie
- Nederlandse Vereniging voor Radiologie
- Nederlandse Vereniging voor Radiotherapie en Oncologie
- Nederlandse Vereniging voor Klinische Chemie en Laboratoriumgeneeskunde
- Schildklier Organisatie Nederland
Algemene gegevens
De ontwikkeling/herziening van deze richtlijnmodule werd ondersteund door het Kennisinstituut van de Federatie Medisch Specialisten (www.demedischspecialist.nl/kennisinstituut) en werd gefinancierd uit de Kwaliteitsgelden Medisch Specialisten (SKMS). De financier heeft geen enkele invloed gehad op de inhoud van de richtlijnmodule.
Samenstelling werkgroep
Voor het ontwikkelen van de richtlijnmodule is in 2021 een multidisciplinaire werkgroep ingesteld, bestaande uit vertegenwoordigers van alle relevante specialismen (zie hiervoor de Samenstelling van de werkgroep) die betrokken zijn bij de zorg voor patiënten met (verdenking op) schildkliercarcinoom).
Expertisegroep
- Prof. dr. R.T. Netea-Maier (voorzitter), internist-endocrinoloog, werkzaam in Radboud Universitair Medische Centrum, NIV.
- Prof dr. W.E. Visser, internist-endocrinoloog, werkzaam in Erasmus Universitair Medisch Centrum, NIV.
- Dr. A.N.A. van der Horst-van der Schrivers, internist-endocrinoloog/specialist ouderengeneeskunde i.o., werkzaam bij SOON, Maastricht University.
- Dr. G.S. Bleumink, internist-endocrinoloog, werkzaam in Rijnstate, NIV.
- Dr. B. Havekes, internist-endocrinoloog, werkzaam in Maastricht Universitair Medisch Centrum Plus, NIV.
- Drs. K.E. Broekman, internist-oncoloog, werkzaam in Universitair Medisch Centrum Groningen, NIV.
- Dr. W. Zandee, internist-endocrinoloog, werkzaam in Universitair Medisch Centrum Groningen, NIV.
- Dr. M. Snel, internist-endocrinoloog, werkzaam in Leids Universitair Medisch Centrum, NIV.
- Dr. K.M.A. Dreijerink, internist-endocrinoloog, werkzaam in Amsterdam Universitair Medische Centra, NIV.
- Dr. J.P. de Boer, internist-oncoloog, werkzaam in Antoni van Leeuwenhoek Ziekenhuis, NIV.
- Dr. G.A.P. Nieuwenhuijzen, chirurg, werkzaam in Catharina Ziekenhuis, NVvH.
- Dr. T.M. van Ginhoven, chirurg, werkzaam in Erasmus Medische Centrum, NVvH.
- Prof dr. J. Morreau, patholoog, werkzaam in Leids Universitair Medisch Centrum, NVVP.
- Dr. M. de Ridder, radiotherapeut, werkzaam in Universitair Medisch Centrum Utrecht, NVRO.
- Drs. H. Ahmad, radioloog, werkzaam in Erasmus Medisch Centrum, NVvR.
- Dr. ir. J.J.G. Hillebrand, klinische chemicus, werkzaam in Amsterdam Universitair Medisch Centrum, NVKC.
- Prof. Dr. F.A. Verburg, nucleair geneeskundige, werkzaam in Erasmus Medisch Centrum, NVNG.
- Dr. B. de Keizer, nucleair geneeskundige, werkzaam in Universitair Medisch Centrum Utrecht, NVNG.
- Mw. M. Porrey, patiëntvertegenwoordiger, NFK/ Schildklierorganisatie Nederland.
Klankbordgroep
- Mw. E. Schrama, patiëntvertegenwoordiger, Schildklier Organisatie Nederland.
- Mw. C.C. van Zweeden- van Leeuwen, diëtist, Reinier de Graaf Ziekenhuis, Nederlandse Vereniging van Diëtisten.
Met ondersteuning van
- Drs. L. Niesink-Boerboom, literatuurspecialist, Kennisinstituut van de Federatie Medisch Specialisten.
- MSc. F.A. Pepping, junior adviseur, Kennisinstituut van de Federatie Medisch Specialisten (vanaf mei 2024).
- Dr. J. Tra, senior adviseur, Kennisinstituut van de Federatie Medisch Specialisten.
- Dr. M.M.A. Verhoeven, adviseur, Kennisinstituut van de Federatie Medisch Specialisten.
Belangenverklaringen
De Code ter voorkoming van oneigenlijke beïnvloeding door belangenverstrengeling is gevolgd. Alle werkgroepleden hebben schriftelijk verklaard of zij in de laatste drie jaar directe financiële belangen (betrekking bij een commercieel bedrijf, persoonlijke financiële belangen, onderzoek financiering) of indirecte belangen (persoonlijke relaties, reputatiemanagement) hebben gehad. Gedurende de ontwikkeling of herziening van een module worden wijzigingen in belangen aan de voorzitter doorgegeven. De belangenverklaring wordt opnieuw bevestigd tijdens de commentaarfase.
Een overzicht van de belangen van werkgroepleden en het oordeel over het omgaan met eventuele belangen vindt u in onderstaande tabel. De ondertekende belangenverklaringen zijn op te vragen bij het secretariaat van het Kennisinstituut van de Federatie Medisch Specialisten.
Expertiselid | Functie | Nevenfuncties | Gemelde belangen | Ondernomen actie |
Prof. dr. R.T. Netea-Maier (voorzitter) | internist-endocrinoloog, werkzaam in Radboud Universitair Medische Centrum | "Bestuurlid Dutch Thyroid Cancer Group (vicevoorzitter) (onbetaald) Bestuurlid Dutch Thyroid Research Foundation (penningmeester) (onbetaald) Voorzitter Radboudumc Expertisecenter Schildkliercarcinoom en vertegenwoordiger van dit center in de ERN Rare Cancers en EndoERN (onbetaald). Associate Editor European Journal Endocrinology (onbetaald)" | Geen deelname adviesraden vanaf de start van de ontwikkeling van de richtlijn (vanaf start raamwerk). | |
Dr. W.E. Visser | internist-endocrinoloog, werkzaam in Erasmus Universitair Medisch Centrum | - | - | Geen |
Dr. A.N.A. van der Horst-van der Schrivers | Internist-endocrinoloog/specialist ouderengeneeskunde i.o, | - | - | Geen |
Dr. G.S. Bleumink | internist-endocrinoloog, werkzaam in Rijnstate | - | - | Geen |
Dr. B. Havekes | Internist-endocrinoloog, werkzaam in Universitair Medisch Centrum Maastricht | - | KWF subsidie E-Nose, hoofdaanvrager is Prof. dr. Nicole Bouvy (schildklierchirurg) | Geen |
Drs. K.E. Broekman | Internist-oncoloog, werkzaam in Universitair Medisch Centrum Groningen | - | Lokale PI Libretto-531 studie | Exclusie participatie als trekker opstellen aanbeveling voor module 7.3 |
Dr. W. Zandee | internist-endocrinoloog, werkzaam in Universitair Medisch Centrum Groningen | - | Adviesraad Lilly (selpercatinib), uitbetaald aan onderzoeksrekening UMCG | Exclusie participatie als trekker opstellen aanbeveling voor module 7.3 |
Dr. M. Snel | Internist-endocrinoloog, werkzaam in Leids Universitair Medisch Centrum | Secretaris van de Dutch Thyroid Cancer Group | - | Geen |
Dr. K.M.A. Dreijerink | internist-endocrinoloog, werkzaam in Amsterdam Universitair Medisch Centrum | - | Advisory Board, Lilly, betaald, mbt selpercatinib als behandeling bij gemetastaseerd gedifferentieerd en medullair schildkliercarcinoom | Exclusie participatie als trekker opstellen aanbeveling voor module 7.3 |
Dr. J.P. de Boer, | Internist-oncoloog, werkzaam in Antoni van Leeuwenhoek Ziekenhuis | Advisory Board MSD Head and neck cancer | - | Geen |
Dr. G.A.P. Nieuwenhuijzen, | Nieuwenhuijzen, chirurg, werkzaam in Catharina Ziekenhuis | - | - | Geen |
Dr. T.M. van Ginhoven | chirurg, werkzaam in Erasmus Medische Centrum | - Voorzitter regionale SchildklierNetwerk (onbetaald) - Secretaris Werkgroep Endocriene chirurgie NVVH (onbetaald) - Penningmeester Dutch Thyroid Study Group (onbetaald) - bestuurslid Dutch Hypo/hyper parathyroid Study Group (onbetaald) | - | Geen |
Prof dr. J. Morreau | patholoog, werkzaam in Leids Universitair Medisch Centrum | Adviseur Genome Scan BV Leiden | - | Geen |
Dr. M. de Ridder | radiotherapeut, werkzaam in Universitair Medisch Centrum Utrecht | Lid algemeen bestuur NWHHT - onbetaald Lid bestuur UWHHT - onbetaald | - | Geen |
Drs. H. Ahmad | radioloog, werkzaam in Erasmus Medisch Centrum | - | - | Geen |
Dr. ir. J.J.G. Hillebrand | klinische chemicus, werkzaam in Amsterdam Universitair Medisch Centrum | trekker NVE commissie harmoniseren functietesten, tijdelijk betaald via SKMS gelden | - | Geen |
Prof. Dr. F.A. Verburg | nucleair geneeskundige, werkzaam in Erasmus Medisch Centrum | Algemeen directeur Cyclotron Rotterdam B.V. ; gedetacheerd vanuit Erasmus MC; management; 0,2 FTE, betaald" | Adviseur: GE healthcare (honoraria betaald aan werkgever) Spreker: AstraZenica (honoraria betaald aan werkgever), Sanofi (honoraria betaald aan werkgever. KWF/Alpe d'Huzes: TFB PET/CT bij schildkliercarcinoom FDA: radionuclide beeldvorming Daniel den Hoedstichting | |
Dr. B. de Keizer | nucleair geneeskundige, werkzaam in Universitair Medisch Centrum Utrecht | - | - Sentinel node imaging bij mondholte ca -FDG PET voor lymfeklierstadiering bij patiënten met klinisch negatieve hals -TFB PET voor schildklierkanker beeldvorming KIKA -MFBG PET-CT voor neuroblastoma beeldvorming HANART FONDS -Al op FDG PET- CT voor voorspellen van respons op immuun therapie bij patiënten met gemetastaseerd niercelkanker | Geen |
Mw. M. Porrey | patiëntvertegenwoordiger | - | - | Geen |
Inbreng patiëntenperspectief
Er werd aandacht besteed aan het patiëntenperspectief door het uitnodigen van patiëntvertegenwoordigers voor de invitational conference en deelname in de expertisegroep. Het verslag van de invitational conference is besproken in de expertisegroep. De verkregen input is meegenomen bij het opstellen van de uitgangsvragen, de keuze voor de uitkomstmaten en bij het opstellen van de overwegingen. De conceptrichtlijn is tevens voor commentaar voorgelegd aan de patiëntenverenigingen en de eventueel aangeleverde commentaren zijn bekeken en verwerkt.
Wkkgz & Kwalitatieve raming van mogelijke substantiële financiële gevolgen
Kwalitatieve raming van mogelijke financiële gevolgen in het kader van de Wkkgz
Bij de richtlijn is conform de Wet kwaliteit, klachten en geschillen zorg (Wkkgz) een kwalitatieve raming uitgevoerd of de aanbevelingen mogelijk leiden tot substantiële financiële gevolgen. Bij het uitvoeren van deze beoordeling zijn richtlijnmodules op verschillende domeinen getoetst (zie het stroomschema op de Richtlijnendatabase).
Uit de kwalitatieve raming blijkt dat er waarschijnlijk geen substantiële financiële gevolgen zijn, zie onderstaande tabel.
Module | Uitkomst raming | Toelichting |
Module follow-up – beeldvorming | Geen substantiële financiële gevolgen | Uit de toetsing volgt dat de aanbeveling(en) niet breed toepasbaar zijn (<5.000 patiënten) en zal daarom naar verwachting geen substantiële financiële gevolgen hebben voor de collectieve uitgaven. |
Methode ontwikkeling
Evidence based
Werkwijze
AGREE
Deze richtlijnmodule is opgesteld conform de eisen vermeld in het rapport Medisch Specialistische Richtlijnen 2.0 van de adviescommissie Richtlijnen van de Raad Kwaliteit. Dit rapport is gebaseerd op het AGREE II instrument (Appraisal of Guidelines for Research & Evaluation II; Brouwers, 2010).
Knelpuntenanalyse en uitgangsvragen
Tijdens de voorbereidende fase inventariseerde de expertisegroep de knelpunten in de zorg voor patiënten met (verdenking op) goed gedifferentieerd schildkliercarcinoom. Tevens zijn er knelpunten aangedragen door IKNL, NAPA, DTCG, NVD, NVNG, NVVP, NVvR, NVRO, SON, NIV via een invitational conference. Een beknopt verslag hiervan is opgenomen onder bijlage.
De werkgroep beoordeelde de aanbeveling(en) uit de eerdere richtlijnmodule op noodzaak tot revisie. Tevens zijn er knelpunten aangedragen tijdens de invitational conference.
Op basis van de uitkomsten van de knelpuntenanalyse zijn door de werkgroep concept-uitgangsvragen opgesteld en definitief vastgesteld.
Uitkomstmaten
Na het opstellen van de zoekvraag behorende bij de uitgangsvraag inventariseerde de werkgroep welke uitkomstmaten voor de patiënt relevant zijn, waarbij zowel naar gewenste als ongewenste effecten werd gekeken. Hierbij werd een maximum van acht uitkomstmaten gehanteerd. De werkgroep waardeerde deze uitkomstmaten volgens hun relatieve belang bij de besluitvorming rondom aanbevelingen, als cruciaal (kritiek voor de besluitvorming), belangrijk (maar niet cruciaal) en onbelangrijk. Tevens definieerde de werkgroep tenminste voor de cruciale uitkomstmaten welke verschillen zij klinisch (patiënt) relevant vonden.
Methode literatuursamenvatting
Een uitgebreide beschrijving van de strategie voor zoeken en selecteren van literatuur is te vinden onder ‘Zoeken en selecteren’ onder Onderbouwing. Indien mogelijk werd de data uit verschillende studies gepoold in een random-effects model. Review Manager 5.4 werd gebruikt voor de statistische analyses. De beoordeling van de kracht van het wetenschappelijke bewijs wordt hieronder toegelicht.
Beoordelen van de kracht van het wetenschappelijke bewijs
De kracht van het wetenschappelijke bewijs werd bepaald volgens de GRADE-methode. GRADE staat voor ‘Grading Recommendations Assessment, Development and Evaluation’ (zie http://www.gradeworkinggroup.org/). De basisprincipes van de GRADE-methodiek zijn: het benoemen en prioriteren van de klinisch (patiënt) relevante uitkomstmaten, een systematische review per uitkomstmaat, en een beoordeling van de bewijskracht per uitkomstmaat op basis van de acht GRADE-domeinen (domeinen voor downgraden: risk of bias, inconsistentie, indirectheid, imprecisie, en publicatiebias; domeinen voor upgraden: dosis-effect relatie, groot effect, en residuele plausibele confounding).
GRADE onderscheidt vier gradaties voor de kwaliteit van het wetenschappelijk bewijs: hoog, redelijk, laag en zeer laag. Deze gradaties verwijzen naar de mate van zekerheid die er bestaat over de literatuurconclusie, in het bijzonder de mate van zekerheid dat de literatuurconclusie de aanbeveling adequaat ondersteunt (Schünemann, 2013; Hultcrantz, 2017).
GRADE | Definitie |
Hoog |
|
Redelijk |
|
Laag |
|
Zeer laag |
|
Bij het beoordelen (graderen) van de kracht van het wetenschappelijk bewijs in richtlijnen volgens de GRADE-methodiek spelen grenzen voor klinische besluitvorming een belangrijke rol (Hultcrantz, 2017). Dit zijn de grenzen die bij overschrijding aanleiding zouden geven tot een aanpassing van de aanbeveling. Om de grenzen voor klinische besluitvorming te bepalen moeten alle relevante uitkomstmaten en overwegingen worden meegewogen. De grenzen voor klinische besluitvorming zijn daarmee niet één op één vergelijkbaar met het minimaal klinisch relevant verschil (Minimal Clinically Important Difference, MCID). Met name in situaties waarin een interventie geen belangrijke nadelen heeft en de kosten relatief laag zijn, kan de grens voor klinische besluitvorming met betrekking tot de effectiviteit van de interventie bij een lagere waarde (dichter bij het nuleffect) liggen dan de MCID (Hultcrantz, 2017).
Overwegingen (van bewijs naar aanbeveling)
Om te komen tot een aanbeveling zijn naast (de kwaliteit van) het wetenschappelijke bewijs ook andere aspecten belangrijk en worden meegewogen, zoals aanvullende argumenten uit bijvoorbeeld de biomechanica of fysiologie, waarden en voorkeuren van patiënten, kosten (middelenbeslag), aanvaardbaarheid, haalbaarheid en implementatie. Deze aspecten zijn systematisch vermeld en beoordeeld (gewogen) onder het kopje ‘Overwegingen’ en kunnen (mede) gebaseerd zijn op expert opinion. Hierbij is gebruik gemaakt van een gestructureerd format gebaseerd op het evidence-to-decision framework van de internationale GRADE Working Group (Alonso-Coello, 2016a; Alonso-Coello 2016b). Dit evidence-to-decision framework is een integraal onderdeel van de GRADE methodiek.
Formuleren van aanbevelingen
De aanbevelingen geven antwoord op de uitgangsvraag en zijn gebaseerd op het beschikbare wetenschappelijke bewijs en de belangrijkste overwegingen, en een weging van de gunstige en ongunstige effecten van de relevante interventies. De kracht van het wetenschappelijk bewijs en het gewicht dat door de werkgroep wordt toegekend aan de overwegingen, bepalen samen de sterkte van de aanbeveling. Conform de GRADE-methodiek sluit een lage bewijskracht van conclusies in de systematische literatuuranalyse een sterke aanbeveling niet a priori uit, en zijn bij een hoge bewijskracht ook zwakke aanbevelingen mogelijk (Agoritsas, 2017; Neumann, 2016). De sterkte van de aanbeveling wordt altijd bepaald door weging van alle relevante argumenten tezamen. De werkgroep heeft bij elke aanbeveling opgenomen hoe zij tot de richting en sterkte van de aanbeveling zijn gekomen.
In de GRADE-methodiek wordt onderscheid gemaakt tussen sterke en zwakke (of conditionele) aanbevelingen. De sterkte van een aanbeveling verwijst naar de mate van zekerheid dat de voordelen van de interventie opwegen tegen de nadelen (of vice versa), gezien over het hele spectrum van patiënten waarvoor de aanbeveling is bedoeld. De sterkte van een aanbeveling heeft duidelijke implicaties voor patiënten, behandelaars en beleidsmakers (zie onderstaande tabel). Een aanbeveling is geen dictaat, zelfs een sterke aanbeveling gebaseerd op bewijs van hoge kwaliteit (GRADE gradering HOOG) zal niet altijd van toepassing zijn, onder alle mogelijke omstandigheden en voor elke individuele patiënt.
Implicaties van sterke en zwakke aanbevelingen voor verschillende richtlijngebruikers | ||
Sterke aanbeveling | Zwakke (conditionele) aanbeveling | |
Voor patiënten | De meeste patiënten zouden de aanbevolen interventie of aanpak kiezen en slechts een klein aantal niet. | Een aanzienlijk deel van de patiënten zouden de aanbevolen interventie of aanpak kiezen, maar veel patiënten ook niet. |
Voor behandelaars | De meeste patiënten zouden de aanbevolen interventie of aanpak moeten ontvangen. | Er zijn meerdere geschikte interventies of aanpakken. De patiënt moet worden ondersteund bij de keuze voor de interventie of aanpak die het beste aansluit bij zijn of haar waarden en voorkeuren. |
Voor beleidsmakers | De aanbevolen interventie of aanpak kan worden gezien als standaardbeleid. | Beleidsbepaling vereist uitvoerige discussie met betrokkenheid van veel stakeholders. Er is een grotere kans op lokale beleidsverschillen. |
Organisatie van zorg
In de knelpuntenanalyse en bij de ontwikkeling van de richtlijnmodule is expliciet aandacht geweest voor de organisatie van zorg: alle aspecten die randvoorwaardelijk zijn voor het verlenen van zorg (zoals coördinatie, communicatie, (financiële) middelen, mankracht en infrastructuur). Randvoorwaarden die relevant zijn voor het beantwoorden van deze specifieke uitgangsvraag zijn genoemd bij de overwegingen. Meer algemene, overkoepelende, of bijkomende aspecten van de organisatie van zorg (zoals centralisatie) worden behandeld in de module Organisatie van zorg.
Commentaar- en autorisatiefase
De conceptrichtlijnmodule werd aan de betrokken (wetenschappelijke) verenigingen en (patiënt) organisaties voorgelegd ter commentaar. De commentaren werden verzameld en besproken met de werkgroep. Naar aanleiding van de commentaren werd de conceptrichtlijnmodule aangepast en definitief vastgesteld door de werkgroep. De definitieve richtlijnmodule werd aan de deelnemende (wetenschappelijke) verenigingen en (patiënt) organisaties voorgelegd voor autorisatie en door hen geautoriseerd dan wel geaccordeerd.
Literatuur
Agoritsas T, Merglen A, Heen AF, Kristiansen A, Neumann I, Brito JP, Brignardello-Petersen R, Alexander PE, Rind DM, Vandvik PO, Guyatt GH. UpToDate adherence to GRADE criteria for strong recommendations: an analytical survey. BMJ Open. 2017 Nov 16;7(11):e018593. doi: 10.1136/bmjopen-2017-018593. PubMed PMID: 29150475; PubMed Central PMCID: PMC5701989.
Alonso-Coello P, Schünemann HJ, Moberg J, Brignardello-Petersen R, Akl EA, Davoli M, Treweek S, Mustafa RA, Rada G, Rosenbaum S, Morelli A, Guyatt GH, Oxman AD; GRADE Working Group. GRADE Evidence to Decision (EtD) frameworks: a systematic and transparent approach to making well informed healthcare choices. 1: Introduction. BMJ. 2016 Jun 28;353:i2016. doi: 10.1136/bmj.i2016. PubMed PMID: 27353417.
Alonso-Coello P, Oxman AD, Moberg J, Brignardello-Petersen R, Akl EA, Davoli M, Treweek S, Mustafa RA, Vandvik PO, Meerpohl J, Guyatt GH, Schünemann HJ; GRADE Working Group. GRADE Evidence to Decision (EtD) frameworks: a systematic and transparent approach to making well informed healthcare choices. 2: Clinical practice guidelines. BMJ. 2016 Jun 30;353:i2089. doi: 10.1136/bmj.i2089. PubMed PMID: 27365494.
Brouwers MC, Kho ME, Browman GP, Burgers JS, Cluzeau F, Feder G, Fervers B, Graham ID, Grimshaw J, Hanna SE, Littlejohns P, Makarski J, Zitzelsberger L; AGREE Next Steps Consortium. AGREE II: advancing guideline development, reporting and evaluation in health care. CMAJ. 2010 Dec 14;182(18):E839-42. doi: 10.1503/cmaj.090449. Epub 2010 Jul 5. Review. PubMed PMID: 20603348; PubMed Central PMCID: PMC3001530.
Hultcrantz M, Rind D, Akl EA, Treweek S, Mustafa RA, Iorio A, Alper BS, Meerpohl JJ, Murad MH, Ansari MT, Katikireddi SV, Östlund P, Tranæus S, Christensen R, Gartlehner G, Brozek J, Izcovich A, Schünemann H, Guyatt G. The GRADE Working Group clarifies the construct of certainty of evidence. J Clin Epidemiol. 2017 Jul;87:4-13. doi: 10.1016/j.jclinepi.2017.05.006. Epub 2017 May 18. PubMed PMID: 28529184; PubMed Central PMCID: PMC6542664.
Medisch Specialistische Richtlijnen 2.0 (2012). Adviescommissie Richtlijnen van de Raad Kwaliteit. http://richtlijnendatabase.nl/over_deze_site/over_richtlijnontwikkeling.html
Neumann I, Santesso N, Akl EA, Rind DM, Vandvik PO, Alonso-Coello P, Agoritsas T, Mustafa RA, Alexander PE, Schünemann H, Guyatt GH. A guide for health professionals to interpret and use recommendations in guidelines developed with the GRADE approach. J Clin Epidemiol. 2016 Apr;72:45-55. doi: 10.1016/j.jclinepi.2015.11.017. Epub 2016 Jan 6. Review. PubMed PMID: 26772609.
Schünemann H, Brożek J, Guyatt G, et al. GRADE handbook for grading quality of evidence and strength of recommendations. Updated October 2013. The GRADE Working Group, 2013. Available from http://gdt.guidelinedevelopment.org/central_prod/_design/client/handbook/handbook.html.
Zoekverantwoording
Zoekacties zijn opvraagbaar. Neem hiervoor contact op met de Richtlijnendatabase.
Bijlagen
- Achtergrond en definities
- Terminologielijst
- Toepassen
- Implementatieplan
- Presentatie voor implementatie
- Stroomschema Behandeling
- Stroomschema Diagnostiek
- Stroomschema Follow-up
- Stroomschema TSH
- Onderzoek
- Kennislacunes
- Overige
- Beknopt verslag invitational conference