Meta hat mit CodeCompose ein neues KI-Tool vorgestellt, das die Fähigkeiten des Copilot von GitHub widerspiegeln soll.
Das Tool wurde auf einer Veranstaltung vorgestellt, auf der die aktuelle KI-Strategie von Meta vorgestellt wurde. Dabei ging es auch um speziell angefertigte Chips für das Training von KI-Modellen.
CodeCompose ist derzeit nicht öffentlich zugänglich, aber Meta gab bekannt, dass seine internen Entwicklungsteams das Tool bereits einsetzen.
Meta hat auch veröffentlichte ein Papier CodeCompose beschreibt: "CodeCompose basiert auf dem InCoder LLM, das generative Fähigkeiten mit Bidirektionalität verbindet. Wir haben CodeCompose skaliert, um Zehntausende von Entwicklern bei Meta zu unterstützen, und zwar für mehr als 10 Programmiersprachen und verschiedene Coding-Oberflächen."
CodeCompose wird auf Metas eigener Code-Datenbank trainiert, getestet und validiert.
Dazu gehören Frameworks und Bibliotheken, die in Hack, der Programmiersprache von Meta, entwickelt wurden, um sicherzustellen, dass das KI-Tool diese Komponenten in seine Kodierungsempfehlungen integriert.
Michael Bolin, ein Software-Ingenieur bei Meta, beschreibt: "Die Grundlage für das Modell basiert auf öffentlichen Forschungsarbeiten von Meta. Wir haben es verfeinert, um es speziell an unsere eigenen internen Bedürfnisse und Codierungsdatenbanken anzupassen."
CodeCompose verfügt über 6,7 Milliarden Parameter, die Hälfte davon wird von Copilot angeboten, einem ähnlichen Tool, das GitHub in Zusammenarbeit mit OpenAI anbietet. Mehr Parameter sind jedoch nicht immer eine Garantie für mehr Leistung. Laut Meta werden die grundlegenden Trainingsdaten sorgfältig bereinigt, was die Wahrscheinlichkeit, dass das Modell fehlerhaften Code vorschlägt, erheblich verringert.
Da CodeCompose auf internen Code trainiert wird, wird es die Derzeit anhängige Gerichtsverfahren gegen die möglicherweise unrechtmäßige Nutzung des Codes der Nutzer durch OpenAI?
Bislang ist Metas Haltung zu der Frage, ob CodeCompose lizenzierten oder urheberrechtlich geschützten Code aufnimmt, nebulös.
Sie haben jedoch zugegeben, dass "InCoder's Training das Sammeln von öffentlichem Code mit spezifischer Lizenzierung von Plattformen wie GitHub und GitLab und auch von StackOverflow beinhaltete."
Meta stellt sich weiterhin gegen andere KI-Unternehmen, indem es Open-Source-Modelle anbietet, die es Einzelpersonen und Unternehmen ermöglichen, ihre Modelle ohne Kosten zu erstellen. Die Monetarisierung von KI erweist sich bereits als schwierig genug - und die Veröffentlichung jedes Open-Source-Modells schmälert die potenziellen Gewinne.