Wie denkt dat de verkeerde formule is gebruikt in het artikel "Bandwidths for dummies" kan even zelf Googlen of de verantwoording hieronder lezen.
Click on the link below for Google results.
https://www.google.com/search?q=kleine+steekproef+uit+een+grote+populatie+opvatten+als+met+of+zonder+terugleggen
Accountability
The formula we used for summing is used for uncorrelated probabilities. Compare it to a vase with 8 red and 8 black balls. If you have to take a ball out of there blindly 10 times, it is important whether you do that with a return or without a return. Every time you take out a red one, the chance of red decreases and the chance of white increases. For example, if you draw red 8 times, the chance of white balls in the last two draws becomes 100%. Then the events are correlated: each result affects the next opportunity.
If, on the other hand, you put the ball back in the vase after each draw, the starting situation remains the same for each draw: these are non-correlated probabilities. You can draw balls of any color endlessly, and with every draw, there is always an equal chance of both outcomes.
De formule die in dit artikel wordt gehanteerd om de curve te maken (het sommeren van kansen) is inderdaad altijd goed voor “met terugleggen” maar niet altijd voor "zonder terugleggen". Toch hebben we voor deze formule gekozen, ondanks dat mensen maar 1x doodgaan en er geen sprake kan zijn van herstel van de beginsituatie. Strikt genomen zou je kunnen stellen dat met elk sterfgeval de volgende kansen worden beïnvloed. Overleden mensen doen immers niet meer mee voor de volgende kans, net zoals de bal die niet wordt teruggelegd in de vaas. Er zou dus een andere, complexere formule kunnen worden gebruikt, die het “zonder terugleggen” effect meecalculeert. Althans, volgens enkele statistici die hun reputatie hiermee in de waagschaal leggen want volgens mij is dit echt elementaire statistiek. Een voorbeeld van woo-woo: pure bluf om gezond redeneren af te stoppen met het claimen van superieure kennis. Die er dus ofwel niet is, ofwel opzettelijk wordt verzwegen. Het belangrijkste is dat er termen worden gebruikt waardoor anderen denken "dat zal dan wel, hij heeft er verstand van, dat zegt hij tenminste zelf de hele tijd".
Hieronder verklaren we onze keuze voor de formule zonder teruglegging. Allereerst is er een basisregel in de statistiek maar we hebben meer overwegingen - want ook van een regel moet je begrijpen waarom en wanneer je die toepast.
- Bij kleine steekproeven uit grote populaties wordt aanbevolen om "met teruglegging" te gebruiken. Dit vinden we terug in elk handboek voor statistiek. Zie onderstaande passage uit een syllabus van de VU.

If you take 10 balls out of a vase with ten thousand balls, how much effect will that have on the next chance? Or 300 balls from a vase with 17 million balls? This has a negligible impact on the chances of follow-up.
- The population decreases with every (excess) mortality and we do not take that into account. In this objection, the population is therefore seen as that vase with a finite number of balls. But the opposite is true: the population is actually growing, so the increase due to births and immigration is greater than the loss of mortality. Even if this effect were to be settled, any differences will only become visible far beyond the decimal point.
- Our bandwidth now shows a situation in which people COULD die more often. This makes the band around the expected mortality (one microfraction) wider. So the band is theoretically a bit too wide. If we make the bandwidth narrower, the excess mortality will only increase. In any case, the differences between the two methods will be negligible.
Kortom: de methode is correct toegepast. De statistici die hiermee proberen "zolderkamerrekenaars" onderuit te halen zouden inhoudelijker argumenten moeten kunnen aanvoeren dan alleen "Laat dit nou maar over aan echte statistici" op basis van een regel die niet van toepassing is.