Codeeragenten kunnen binnen enkele minuten duizenden regels code genereren. Het probleem: het meeste ervan is niet van toepassing. Dit is in strijd met interne normen, voldoet niet aan nalevingscontroles of zorgt voor meer opruimwerk dan het bespaart.
“Je kunt heel veel code produceren, maar dat betekent toch niets? Het moet integreerbaar en compliant zijn, en je wilt niet meer werk aan de back-end creëren alleen maar omdat je het codegeneratieproces aan de voorkant versnelt”, zegt Stephen Newman, EY Global CTO Engineering Leader.
De productontwikkelingsteams van EY lossen dit probleem op door codeerbureaus te verbinden met hun technische standaarden, coderepository’s en compliance-frameworks. Het resultaat: een 4x tot 5x hogere productiviteit bij de teams die bouwen aan de reeks audit-, belasting- en financiële platforms van EY.
Maar de voordelen komen niet voort uit het alleen maar inschakelen van het apparaat. Het team van Newman heeft 18 tot 24 maanden besteed aan het bouwen van de culturele basis en de technische integratie die semi-autonoom coderen op schaal mogelijk maakt.
De eerste stap is cultuur. EY begon met een tool in GitHub Copilot-stijl, waarmee ingenieurs vertrouwd konden raken met snelle engineering en ondersteunende AI. Newman zei dat zijn belangrijkste leerproces was om de adoptie van AI organisch te maken, in plaats van gedwongen door leiderschap. “Het is belangrijk om van AI-mogelijkheden een organische adoptie te maken, en deze niet aan gebruikers op te dringen”, zegt hij.
Ontwikkelaars willen overstappen van coderen naar bouwen, implementeren en operationeel maken. De productiviteitsgroei zal echter niet toenemen als er geen diepere integratie plaatsvindt.
Newman besefte dat bureaus toegang nodig hadden tot EY-coderepository’s, technische standaarden en broncatalogi om inzetbare code te produceren. Zonder een ‘wereld van context’, zoals Newman het noemde, zouden agenten generieke resultaten produceren die uitgebreide herwerking zouden vergen.
EY heeft meerdere agentplatforms geëvalueerd: Lovable, Replit en Factory-based Droid. In plaats van een tool verplicht te stellen, heeft het team van Newman de adoptie, het gebruik en de productiviteit van alle drie de tools gemeten.
“We willen geen leiderschapsteam zijn dat te prescriptief is in het identificeren van een instrument en het afzwakken ervan”, aldus Newman. Ontwikkelaars zijn “echt geïnteresseerd in en navigeren” naar Factory, wat een signaal is dat Factory echte waarde biedt.
De implementatie in de fabriek “verliep als een lopend vuurtje” nadat deze was opgewaardeerd van evaluatie naar pilot. EY moet het verkeer naar Factory en Droid beperken en beperken met welke repo’s verbinding kan worden gemaakt voordat nalevings- en beveiligingsgoedkeuring wordt verkregen.
Kader voor classificatie van werklast
Het enthousiasme van de ontwikkelaars maakt duidelijk dat EY discipline vereist bij het bepalen van de werklast die aan agenten moet worden gedelegeerd. Het team van Newman verdeelt taken in twee categorieën:
Taken met hoge autonomie agent handelt goed:
-
Codebeoordeling
-
Documentatie
-
Defecte oplossing
-
Groene veldkenmerken
Complexe taak die nog steeds menselijk toezicht vereisen:
EY verschuift ook de rol van ontwikkelaar. In plaats van alle code zelf te schrijven, worden engineers orkestrators die agenten naar de juiste databases en opslagplaatsen leiden.
Met beveiligingsmaatregelen en integratie in een voltooide coderepository heeft EY efficiëntieverbeteringen gemeten variërend van 15% tot 60% voor alle persona’s in de vroege adoptiefase.
“Er is een sprong gemaakt in veel van onze producten door te doen wat ik de ontwikkeling van horizonmodellen noem, waarbij we semi-autonome agentuitvoering op schaal hebben, teams die orkestrators en niet-uitvoerders zijn, en we integratie hebben in de contextwereld”, aldus Newman.
Newman geeft toe dat het moeilijk is om een 4x tot 5x hogere productiviteit alleen aan codeerbureaus toe te schrijven. Deze verbeteringen komen voort uit vallen en opstaan, gecombineerd met culturele en gedragsveranderingen binnen het ontwikkelteam.
