Anthropic zeigt, dass Claude LLMs außergewöhnlich überzeugend geworden sind

9. April 2024

  • Anthropologische Forscher haben die Überzeugungskraft der Claude-Modellfamilie untersucht
  • Jede Generation von Claude produzierte überzeugendere Inhalte als die vorherige
  • Claude 3 Opus war in den meisten Tests mindestens so überzeugend wie Menschen
AI-Überredung

Die Anthropic-Forschung hat gezeigt, dass ihr neuestes KI-Modell, Claude 3 Opus, ebenso überzeugende Argumente liefern kann wie die von Menschen erstellten. 

Die Forschungunter der Leitung von Esin Durmus untersucht die Beziehung zwischen Modellumfang und Überzeugungskraft in verschiedenen Generationen von anthropischen Sprachmodellen.

Sie konzentrierte sich auf 28 komplexe und neu aufkommende Themen, wie z. B. die Moderation von Online-Inhalten und ethische Leitlinien für die Weltraumforschung, zu denen die Menschen wahrscheinlich keine konkreten oder seit langem etablierten Ansichten haben. 

Die Forscher verglichen die Überzeugungskraft von Argumenten, die von verschiedenen anthropischen Modellen, darunter Claude 1, 2 und 3, erzeugt wurden, mit denen, die von menschlichen Teilnehmern geschrieben wurden.

Zu den wichtigsten Ergebnissen der Studie gehören:

  • In der Studie wurden vier verschiedene Aufforderungen zur Generierung von KI-generierten Argumenten verwendet, um ein breiteres Spektrum an überzeugenden Schreibstilen und -techniken zu erfassen.
  • Claude 3 Opus, das am weitesten fortgeschrittene Modell von Anthropic, lieferte Argumente, die sich in ihrer Überzeugungskraft statistisch nicht von von Menschen geschriebenen Argumenten unterscheiden ließen.
  • Über die Modellgenerationen hinweg war ein klarer Aufwärtstrend zu beobachten, wobei jede nachfolgende Generation sowohl bei den Kompakt- als auch bei den Grenzmodellen eine höhere Überzeugungskraft aufwies.
Anthropische KI
Die Claude-Modelle von Anthropic haben im Laufe der Zeit an Überzeugungskraft gewonnen. Quelle: Anthropisch.

Das Anthropic-Team räumt Einschränkungen ein und schreibt: "Überredung ist im Labor schwer zu untersuchen - unsere Ergebnisse lassen sich möglicherweise nicht auf die reale Welt übertragen". 

Dennoch ist die Überzeugungskraft von Claude offensichtlich beeindruckend, und dies ist nicht die einzige Studie, die dies belegt.

Im März 2024 fand ein Team der EPFL in der Schweiz und des Bruno-Kessler-Instituts in Italien heraus, dass GPT-4, wenn es Zugang zu persönlichen Informationen über seinen Debattengegner hatte, 81,7% eher wahrscheinlich seinen Gegner zu überzeugen als ein Mensch. 

Die Forscher kamen zu dem Schluss, dass "diese Ergebnisse belegen, dass LLM-basiertes Microtargeting sowohl normale LLMs als auch menschliches Microtargeting deutlich übertrifft, wobei GPT-4 in der Lage ist, persönliche Informationen viel effektiver zu nutzen als Menschen".

Persuasive KI für Social Engineering

Die offensichtlichsten Risiken überzeugender LLMs sind Zwang und Social Engineering. 

Anthropic erklärt: "Die Überzeugungskraft von Sprachmodellen wirft berechtigte gesellschaftliche Bedenken hinsichtlich des sicheren Einsatzes und möglichen Missbrauchs auf. Die Fähigkeit, diese Risiken zu bewerten und zu quantifizieren, ist entscheidend für die Entwicklung verantwortungsvoller Schutzmaßnahmen".

Wir müssen uns auch darüber im Klaren sein, wie sich die wachsende Überzeugungskraft von KI-Sprachmodellen mit modernster Technologie zum Klonen von Stimmen wie der Voice Engine von OpenAI verbinden könnte, die OpenAI hielt es für riskant, die

VoiceEngine benötigt nur 15 Sekunden, um eine Stimme realistisch zu klonen, die für fast alles verwendet werden kann, einschließlich ausgeklügelter Betrugs- oder Social-Engineering-Methoden. 

Tiefgreifende Betrügereien sind bereits weit verbreitet und wird sich noch verstärken, wenn Bedrohungsakteure die Technologie des Stimmenklonens mit den beängstigend kompetenten Überzeugungstechniken der KI kombinieren.

Join The Future


HEUTE ABONNIEREN

Klar, prägnant, umfassend. Behalten Sie den Überblick über KI-Entwicklungen mit DailyAI

Sam Jeans

Sam ist ein Wissenschafts- und Technologiewissenschaftler, der in verschiedenen KI-Startups gearbeitet hat. Wenn er nicht gerade schreibt, liest er medizinische Fachzeitschriften oder kramt in Kisten mit Schallplatten.

×

KOSTENLOSES PDF EXKLUSIV
Mit DailyAI immer einen Schritt voraus

Melden Sie sich für unseren wöchentlichen Newsletter an und erhalten Sie exklusiven Zugang zum neuesten eBook von DailyAI: 'Mastering AI Tools: Ihr Leitfaden für mehr Produktivität im Jahr 2024".

*Mit der Anmeldung zu unserem Newsletter akzeptieren Sie unsere Datenschutzbestimmungen und unsere Bedingungen und Konditionen