Recursive Self Improvement: de motor achter exponentiële AI
Een AI-systeem dat zichzelf verbetert, waardoor het nóg beter zichzelf kan verbeteren — en zo verder. Dit is geen sciencefiction meer. Het is de centrale dynamiek achter de projecten waar wij vandaag aan bouwen.
In 1965 formuleerde de Britse wiskundige I.J. Good een gedachte die decennialang als speculatief werd beschouwd: zodra een machine intelligent genoeg is om haar eigen ontwerp te verbeteren, volgt een cascade van steeds snellere verbeteringen — een intelligence explosion. Vijf decennia later bouwen wij systemen waarbij dit principe niet langer hypothetisch is, maar operationeel.
Recursive Self Improvement (RSI) is de eigenschap van een systeem om zijn eigen capaciteiten te vergroten, waarbij elke verbetering de volgende verbetering vergemakkelijkt. Het is een feedbacklus waarbij intelligentie zichzelf als hefboom gebruikt.
"An ultraintelligent machine could design even better machines; there would then unquestionably be an intelligence explosion." — I.J. Good, 1965
Wat RSI concreet betekent
In de praktijk verschijnt RSI niet als één dramatische sprong, maar als een architectuur van terugkoppelende loops. Een taalmodel dat wordt ingezet voor codeergeneratie kan zijn eigen trainingsdatasets aanvullen. Een planningssysteem kan zijn eigen evaluatiecriteria bijstellen op basis van resultaten. Een onderzoeksassistent kan zijn zoekstrategie aanpassen terwijl hij werkt.
Huidig systeem → Analyseert eigen zwaktes → Verbeterd systeem → Analyseert eigen zwaktes → Nóg sterker systeem → …
De sleutel is dat elke iteratie van het systeem beter uitgerust is om de volgende iteratie te maken dan de vorige versie was. Dit is wat RSI onderscheidt van gewone softwareontwikkeling: niet wij verbeteren het systeem, het systeem levert input voor zijn eigen verbetering.
Waarom dit nu relevant is
Tot voor kort was RSI een theoretische grenswaarde — iets dat misschien ooit zou gelden voor fictieve superintelligente systemen. Maar met de komst van frontier-modellen als Claude en GPT-4, gecombineerd met agentic architecturen, verschuift dit debat naar het heden.
Huidige grote taalmodellen kunnen code schrijven, redeneren over hun eigen output, en worden ingezet in pipelines waarbij die output gebruikt wordt om vervolgstappen aan te sturen. Systemen als AlphaCode, AlphaProof en experimentele multi-agent frameworks laten zien dat de kloof tussen "tool die helpt verbeteren" en "systeem dat zichzelf verbetert" snel kleiner wordt.
Context voor onze projecten: Bij Triade Tech bouwen we systemen waarbij AI niet alleen uitvoert, maar ook evalueert, bijstuurt en optimaliseert. De vraag is niet meer óf RSI-mechanismen een rol spelen in onze architecturen — de vraag is hoe we die bewust ontwerpen, begrenzen en sturen.
Drie niveaus van RSI in de praktijk
RSI manifesteert zich in onze projecten op drie niveaus die we van elkaar moeten onderscheiden.
Niveau 1 — Lerende systemen. Een model dat via reinforcement learning of fine-tuning verbetert op basis van feedback. De iteratiecyclus is lang (weken tot maanden), en de verbetering wordt gestuurd door mensen. Dit is goed begrepen terrein.
Niveau 2 — Agentische loops. Een systeem dat in realtime zijn eigen aanpak bijstelt: het beoordeelt zijn tussenresultaten, kiest een andere strategie, en voert opnieuw uit. De iteratiecyclus is kort (minuten tot uren). Dit is waar wij nu mee werken in onze agent-frameworks.
Niveau 3 — Architecturele zelfmodificatie. Een systeem dat zijn eigen infrastructuur, trainingsprocedures of hyperparameters aanpast. Dit niveau is experimenteel en buiten gecontroleerde onderzoeksomgevingen nauwelijks operationeel — maar het nadert.
De kansen voor onze klanten
RSI-principes maken het mogelijk om systemen te bouwen die beter worden naarmate ze worden ingezet, in plaats van te degraderen of statisch te blijven. Voor klanten betekent dit concreet:
- Procesautomatisering die leert van uitzonderingen en die exceptions op termijn zelf afhandelt
- Kennissystemen die hun eigen hiaten identificeren en gerichte aanvulling signaleren
- Code-assistenten die per ontwikkelaar patronen leren en daarmee de productiviteit exponentieel vergroten
- Klantgerichte systemen die hun tone-of-voice en strategie verfijnen op basis van interactie-data
De gemeenschappelijke noemer: de waarde van het systeem neemt toe met gebruik, in plaats van lineair mee te schalen met de investering.
De randvoorwaarden om het goed te doen
RSI zonder begrenzing is een risico. Systemen die zichzelf ongecontroleerd optimaliseren, kunnen doelen versterken die niet langer aansluiten op de oorspronkelijke intentie — een fenomeen dat in de AI-literatuur bekend staat als goal misgeneralization. Hoe krachtiger het zelflerende mechanisme, hoe belangrijker de architecturele keuzes rondom drie thema's.
Evaluatiecriteria. Wat optimaliseert het systeem precies? Proxy-metrics die werken op kleine schaal falen vaak bij schaling. Wij definiëren evaluatiecriteria altijd in termen van het uiteindelijke doel, niet de tussenliggende maatstaf.
Human-in-the-loop checkpoints. Op welke beslissingspunten blijft een mens in de loop? Wij ontwerpen agentische systemen met expliciete escalatiedrempels: acties boven een bepaald impact-niveau worden altijd ter goedkeuring voorgelegd.
Observability. Kun je begrijpen waarom het systeem de keuzes maakt die het maakt? Zelflerende systemen moeten transparante audit trails genereren, zodat verbetering traceerbaar is en afwijkingen vroeg zichtbaar worden.
Wat dit vraagt van onze aanpak
RSI verandert de architectuurvragen die wij stellen. Vroeger: "Hoe bouwen we een systeem dat taak X uitvoert?" Nu: "Hoe bouwen we een systeem dat leert taak X steeds beter uit te voeren, op een manier die wij kunnen begrijpen, controleren en bijsturen?"
Dit verschuift het gewicht van initiële implementatie naar systeemontwerp op langere termijn. De kwaliteit van een RSI-systeem wordt niet alleen bepaald door de prestaties op dag één, maar door de richting en het tempo van de verbetering. Dat vereist een andere relatie met technologie — minder "bouwen en opleveren", meer "ontwerpen en cultiveren".
RSI maakt technologie tot een levend systeem. Onze rol als ontwikkelaars verschuift van bouwer naar tuinier.
Waarom dit de kern is van wat we doen
Bij Triade Tech werken we niet aan AI-systemen als geïsoleerde tools. We werken aan systemen die leren, aanpassen en verbeteren — in interactie met de mensen en processen van onze klanten.
Recursive Self Improvement is de theoretische grondslag die verklaart waarom dit zo krachtig is, en tegelijk de lens waarmee wij de risico's en kansen beoordelen van elke architecturele keuze.
Het begrijpen van RSI is niet een academische exercitie. Het is de voorwaarde om goede AI-systemen te bouwen — systemen die waarde blijven leveren, veilig schalen, en de intenties van gebruikers en klanten structureel respecteren.

