Anthropic zeigt, dass Claude LLMs außergewöhnlich überzeugend geworden sind

Die Anthropic-Forschung hat gezeigt, dass ihr neuestes KI-Modell, Claude 3 Opus, ebenso überzeugende Argumente liefern kann wie die von Menschen erstellten.

Die Forschungunter der Leitung von Esin Durmus untersucht die Beziehung zwischen Modellumfang und Überzeugungskraft in verschiedenen Generationen von anthropischen Sprachmodellen.

Sie konzentrierte sich auf 28 komplexe und neu aufkommende Themen, wie z. B. die Moderation von Online-Inhalten und ethische Leitlinien für die Weltraumforschung, zu denen die Menschen wahrscheinlich keine konkreten oder seit langem etablierten Ansichten haben.

Die Forscher verglichen die Überzeugungskraft von Argumenten, die von verschiedenen anthropischen Modellen, darunter Claude 1, 2 und 3, erzeugt wurden, mit denen, die von menschlichen Teilnehmern geschrieben wurden.

Zu den wichtigsten Ergebnissen der Studie gehören:

In der Studie wurden vier verschiedene Aufforderungen zur Generierung von KI-generierten Argumenten verwendet, um ein breiteres Spektrum an überzeugenden Schreibstilen und -techniken zu erfassen.
Claude 3 Opus, das am weitesten fortgeschrittene Modell von Anthropic, lieferte Argumente, die sich in ihrer Überzeugungskraft statistisch nicht von von Menschen geschriebenen Argumenten unterscheiden ließen.
Über die Modellgenerationen hinweg war ein klarer Aufwärtstrend zu beobachten, wobei jede nachfolgende Generation sowohl bei den Kompakt- als auch bei den Grenzmodellen eine höhere Überzeugungskraft aufwies.

Anthropische KI — Die Claude-Modelle von Anthropic haben im Laufe der Zeit an Überzeugungskraft gewonnen. Quelle: Anthropisch.

Das Anthropic-Team räumt Einschränkungen ein und schreibt: "Überredung ist im Labor schwer zu untersuchen - unsere Ergebnisse lassen sich möglicherweise nicht auf die reale Welt übertragen".

Dennoch ist die Überzeugungskraft von Claude offensichtlich beeindruckend, und dies ist nicht die einzige Studie, die dies belegt.

Im März 2024 fand ein Team der EPFL in der Schweiz und des Bruno-Kessler-Instituts in Italien heraus, dass GPT-4, wenn es Zugang zu persönlichen Informationen über seinen Debattengegner hatte, 81,7% eher wahrscheinlich seinen Gegner zu überzeugen als ein Mensch.

Die Forscher kamen zu dem Schluss, dass "diese Ergebnisse belegen, dass LLM-basiertes Microtargeting sowohl normale LLMs als auch menschliches Microtargeting deutlich übertrifft, wobei GPT-4 in der Lage ist, persönliche Informationen viel effektiver zu nutzen als Menschen".

Persuasive KI für Social Engineering

Die offensichtlichsten Risiken überzeugender LLMs sind Zwang und Social Engineering.

Anthropic erklärt: "Die Überzeugungskraft von Sprachmodellen wirft berechtigte gesellschaftliche Bedenken hinsichtlich des sicheren Einsatzes und möglichen Missbrauchs auf. Die Fähigkeit, diese Risiken zu bewerten und zu quantifizieren, ist entscheidend für die Entwicklung verantwortungsvoller Schutzmaßnahmen".

Wir müssen uns auch darüber im Klaren sein, wie sich die wachsende Überzeugungskraft von KI-Sprachmodellen mit modernster Technologie zum Klonen von Stimmen wie der Voice Engine von OpenAI verbinden könnte, die OpenAI hielt es für riskant, die.

VoiceEngine benötigt nur 15 Sekunden, um eine Stimme realistisch zu klonen, die für fast alles verwendet werden kann, einschließlich ausgeklügelter Betrugs- oder Social-Engineering-Methoden.

Tiefgreifende Betrügereien sind bereits weit verbreitet und wird sich noch verstärken, wenn Bedrohungsakteure die Technologie des Stimmenklonens mit den beängstigend kompetenten Überzeugungstechniken der KI kombinieren.

Anthropic zeigt, dass Claude LLMs außergewöhnlich überzeugend geworden sind

Persuasive KI für Social Engineering

Join The Future

Sam Jeans

VERWANDTE ARTIKEL

This AI Startup Is Making an Anime Series and Giving Away $1 Million to Creators

Visa and Mastercard Just Gave AI the Power to Shop and Pay for You

Natasha Lyonne to Direct AI-Powered Sci-Fi Film That Could Redefine Hollywood

Singapore Airlines Is Using ChatGPT to Make Flying Way Smarter

Anthropic zeigt, dass Claude LLMs außergewöhnlich überzeugend geworden sind

Persuasive KI für Social Engineering

Join The Future

Sam Jeans

VERWANDTE ARTIKEL

This AI Startup Is Making an Anime Series and Giving Away $1 Million to Creators

Visa and Mastercard Just Gave AI the Power to Shop and Pay for You

Natasha Lyonne to Direct AI-Powered Sci-Fi Film That Could Redefine Hollywood

Singapore Airlines Is Using ChatGPT to Make Flying Way Smarter

KOSTENLOSES PDF EXKLUSIVMit DailyAI immer einen Schritt voraus

KOSTENLOSES PDF EXKLUSIV
Mit DailyAI immer einen Schritt voraus