Dit whitepaper onderzoekt de uitdagingen en oplossingen voor het integreren van gezondheidsdata uit verschillende domeinen in Nederland. Het document bespreekt fundamentele ontwerpkeuzes, zoals de data-architectuur (centraal versus gefedereerd), het aggregatieniveau (individueel versus geaggregeerd) en de benodigde data-integratie (horizontaal versus verticaal onderzoek). Zes (technische) mogelijkheden die toepasbaar zijn als (onderdeel van) een geïntegreerde regionale data-infrastructuur worden geanalyseerd: nationaal datalake, regionaal datalake, FAIR data stations, datavirtualisatie, Federated Learning en Multi Party Computation (MPC). Op basis van de uitgangspunten van GERDA wordt geconcludeerd dat een gefedereerde data-architectuur met een aggregatieniveau op individueel niveau, gebruikmakend van MPC in combinatie met datavirtualisatie, het meest geschikt is voor een duurzame regionale data-infrastructuur.