Home Nieuws Het AI-beveiligingsteam van Microsoft onthult hoe een verborgen achterdeur voor trainingen stilletjes...

Het AI-beveiligingsteam van Microsoft onthult hoe een verborgen achterdeur voor trainingen stilletjes kan overleven binnen de taalmodellen van het bedrijf

2
0
Het AI-beveiligingsteam van Microsoft onthult hoe een verborgen achterdeur voor trainingen stilletjes kan overleven binnen de taalmodellen van het bedrijf


  • Microsoft heeft een scanner gelanceerd om giftige taalmodellen te detecteren voordat ze worden geïmplementeerd
  • Backdoor LLM’s kunnen kwaadaardig gedrag verbergen totdat bepaalde triggerzinnen verschijnen
  • De scanner identificeert abnormale aandachtspatronen die verband houden met verborgen achterdeurtriggers

Microsoft heeft de ontwikkeling aangekondigd van een nieuwe scanner die is ontworpen om verborgen achterdeurtjes te detecteren in grote open taalmodellen die in bedrijfsomgevingen worden gebruikt.

Het bedrijf zegt dat zijn tool tot doel heeft gevallen van modelvergiftiging te identificeren, een vorm van knoeien waarbij kwaadaardig gedrag tijdens de training rechtstreeks in de gewichten van het model wordt ingebed.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in