WMDP misst und reduziert die böswillige Nutzung von LLM mit Unlearning
Forscher veröffentlichten einen Maßstab, um zu messen, ob ein LLM potenziell gefährliches Wissen enthält, und eine neuartige Technik, um gefährliches Wissen zu verlernen...