Nadat ambtenaren miljoenen pagina’s met documenten met betrekking tot de overleden zedendelinquent Jeffrey Epstein hadden vrijgegeven, hebben onthullingen in e-mails en andere bestanden geleid tot ontslag van diverse bedrijfsleiders, nieuw onderzoek tot wangedrag door Epstein en zijn potentiële handlangers, en zelfs arresteren voormalige prins Andrew van Engeland.
Voor degenen die Epstein’s uitgebreide correspondentie en netwerk van verbindingen binnen de industrie, de overheid en de academische wereld willen onderzoeken: enkele van de meest effectieve tools zijn niet gebouwd door federale onderzoekers of grote nieuwsorganisaties, maar door slordige teams van vrijwillige ontwikkelaars.
Te beginnen met een website genaamd Jmaildie de openbaar gemaakte e-mails van Epstein doorzoekbaar maakten via een interface die slim uit Gmail was gekopieerd, hebben ze een reeks webapplicaties gemaakt die bekende sites als Google Drive, Wikipedia, Amazon en YouTube nabootsen. Het doel: rommelige pdf’s en andere bestanden die massaal door federale functionarissen worden vrijgegeven, omzetten in iets dat het publiek (inclusief journalisten) gemakkelijker kan doorzoeken en begrijpen.
De sleutel tot het snelle succes van het project was het technische talent van een team van ongeveer vijftien medewerkers. Maar net zo belangrijk, zeggen ze, is de huidige golf van het coronavirus AI tools waarmee ze snel code kunnen genereren en grote hoeveelheden gegevens kunnen verwerken.
“We hebben dus niet alleen een app die we heel snel kunnen bouwen, we hebben ook gegevens waarmee we die app kunnen vullen met echte inhoud”, zegt Luke Igel, een van de oorspronkelijke makers van het project. “Die twee dingen moeten samenkomen; een paar jaar geleden was geen van beide mogelijk.”
Igel, afgestudeerd aan MIT en mede-oprichter en CEO van een videosoftwarebedrijf Misdaadzei dat de inspiratie voor het project kwam nadat hij en een vriend de vroege stadia van documenten met betrekking tot Epstein hadden besproken vrijgegeven door leden van het Congres in november. Ze waren verrast door de omvang van Epsteins banden met politieke figuren over de partijgrenzen heen en over de hele wereld heen, maar ze vroegen zich af of het publiek het verhaal volledig kon begrijpen toen de gegevens voor het eerst werden gepresenteerd.
Igel stak toen zijn hand uit Riley Walzeen ontwikkelaar en ondernemer die bekend staat om creatieve internetprojecten (waaronder a nieuwste parodie Apple’s “Find Me”-interface die parkeerwachters in San Francisco volgt) over het verzamelen van e-mails in een Gmail-achtige interface.
Dankzij AI-ontwikkeltools zoals Cursor en model Claude Anthropic, kon het paar binnen een paar uur de eerste versie van Jmail maken, zei Igel. “We hebben Gmail gekloond, behalve dat je bent ingelogd als Epstein en zijn e-mails kunt zien”, Walz maakte de aankondiging in november in een virale X-post.
Toen Justitie in december aanvullende dossiers vrijgaf, was dat naar aanleiding van Epstein dient de Transparantiewet in Met toestemming van het Congres vorige maand kwam een groep van ongeveer tien medewerkers bijeen in het huis van Igel in San Francisco en via een videoconferentie om de volgende versie van de software te bouwen.
Het team kreeg ook hulp van een bedrijf genaamd Vesting– makers van software die rommelige pdf’s en andere complexe documenten omzet in gestructureerde gegevens – om nieuw uitgebrachte bestanden te parseren die te complex zijn geworden om betrouwbaar te worden geparseerd door algemene AI-tools.
“Veel van deze pdf’s zijn gedrukte of handgeschreven scans”, zegt Adel Wu, die bij Reducto aan groei werkt. “Het is eigenlijk best rommelig.”
Het bedrijf – dat in hetzelfde gebouw is gevestigd als Kino – had overwogen iets met de Epstein-bestanden te doen en besloot snel de inspanningen van Jmail te steunen nadat het erover had gehoord, zei oprichter Omar Alhait, en merkte op: “We hebben snel alle documenten doorgenomen en alle relevante e-mailinformatie daaruit geparseerd.”
De software van Reducto hielp bij het nauwkeurig weergeven van documentredacties en stelde het team zelfs in staat complexe informatie te extraheren, zoals de vluchtgegevens van Epstein, die beschikbaar was in een interface in Google Flights-stijl genaamd Vlucht J. Nogmaals, AI, inclusief Antropisch het nieuwe Claude Opus 4.5-model—hielp het Jmail-team snel nieuwe functies en toepassingen te ontwikkelen en duizenden code-updates in recordtijd te integreren.
“Veel van de dingen waarvan ik denk dat ze de kern vormen van software-engineering, zijn eigenlijk dingen waarmee dit model je kan helpen en waarmee je heel snel kunt oplossen”, zegt Igel.
De investering van het team in infrastructuur stelde hen in staat snel aanvullende documenten te importeren, verwerken en delen die vlak voor Kerstmis werden vrijgegeven, hoewel het project meer aandacht trok na de massale vrijgave door de DOJ van miljoenen Epstein-gerelateerde bestanden op 30 januari. Het afhandelen van de vrijgave vereiste niet alleen het verwerken van nieuwe documenten – Alhait zei dat Reducto ongeveer drie dagen nodig had om de gegevens te verwerken – maar ook het versterken van de infrastructuur van het project om de toestroom van verkeer aan te kunnen naarmate de publieke belangstelling voor de bestanden groeide.
“Er kwamen weer zoveel mensen naar het huis, en deze keer moesten we echt uitbreiden”, zei Igel. “Alles ging kapot. Veel van de schaalproblemen die we dachten opgelost te hebben, zoals databasestoringen en cachefouten, kwamen terug.”
Met behulp van AI-tools heeft het team de site gestabiliseerd, die nu meer dan 500 miljoen paginaverzoeken heeft ontvangen voor meer dan 50 miljoen unieke bezoekers. Het project is ook uitgebreid tot buiten Jmail en J Flights en omvat een AI-wizard voor bestanden genaamd Jemini, een videorepository genaamd JeffTube, een bestandsrepository bekend als JDrive, en zelfs Epsteins doorzoekbare Amazon-bestellogboek genaamd Jamazon.
Het team zorgt ervoor dat informatie in bestanden op de juiste manier wordt geredigeerd om gevoelige details te beschermen, en werkt het beschikbare sitemateriaal bij om eventuele nieuwe bewerkingen door federale functionarissen weer te geven. “Het is belangrijk dat we verantwoordelijk zijn bij het presenteren van informatie aan het publiek”, zegt Melissa Du, een AI-onderzoeksingenieur die aan het project werkt. “We willen het redactionele werk uiteraard niet overdrijven, maar ook de privacy van de slachtoffers is van het grootste belang.”
Du, een andere MIT-afgestudeerde, zei dat hij “volledig overdonderd” was door de eerste reeks bestanden die op Jmail werden vrijgegeven, inclusief documenten die verwijzen naar aan het MIT verbonden academici zoals voormalig Media Lab-directeur Joi Ito en emeritus professor Noam Chomsky. Sindsdien heeft hij aan verschillende aspecten van projecten gewerkt, zoals JDrive voor databeheer en Jwiki in Wikipedia-stijldie eerst werd gevuld met door AI gegenereerde geschriften van sleutelfiguren die verband hielden met Epstein en vervolgens zorgvuldig werd doorgelicht vóór publicatie.
Het meest opvallende aan dit project is misschien wel dat een kleine groep ontwikkelaars in staat was te doen wat grote mediaorganisaties eerder hebben gedaan bij het organiseren van opslagplaatsen voor virale gegevens, zoals voormalig inlichtingencontractant Edward Snowden. onthullingen over overheidstoezicht of dat buitenlandse financiële lekken bekend als de Panama Papers.
Het team heeft geaccepteerd ongeveer $ 32.000 aan donaties om verschillende kosten te dekken, samen met donaties aan technische diensten van Reducto, Kino en cloudprovider Vercel. Maar het kernwerk is gedaan door ontwikkelaars met dagelijkse banen en hun eigen startups.
Hoewel Igel zich soms afvraagt of het project effectief zal worden overgenomen door grote nieuwsorganisaties die hun eigen Epstein-dataverkenners bouwen, zijn gegevens uit het Jmail-project feitelijk aangehaald door Nieuwskanalen inbegrepen De Econoom. Het team heeft ook contact opgenomen met stafmedewerkers van het Congres om verzoeken te crowdsourcen om potentieel zwaar geredigeerde bestanden vrij te geven.
En er worden aanvullende functies overwogen, waaronder een interface in Google Agenda-stijl voor het verkennen van agendagegevens in de repository, zei Igel, die opmerkte dat de onderliggende code van het project in de toekomst waarschijnlijk ook als open source zal worden vrijgegeven.
Dit project is een voorbeeld geworden van wat mogelijk is met een getalenteerd team dat is uitgerust met de nieuwste AI-ontwikkelings- en gegevensverwerkingstools. “We zijn sterk afhankelijk van nieuwe AI-modellen,” zei Du. “En we hebben ook een zeer hoog niveau van vertrouwen binnen het team.”



