Alibaba hat auf seiner Cloud-Computing-Plattform zwei Open-Source-Großsprachenmodelle veröffentlicht, die mit der kleinsten Version des Llama-2-Modells von Meta konkurrieren sollen.
Das chinesische Technologieunternehmen hat sein Tongyi Qiawen-Modell Anfang des Jahres veröffentlicht und sagt, dass die neuen Versionen, Qwen-7B und Qwen-7B-Chat, abgespeckte Versionen dieses LLM sind. Das "7B" in den Modellnamen bezieht sich darauf, dass sie mit 7 Milliarden Parametern trainiert wurden. Das ist die gleiche Menge, mit der die kleinste Version von Metas Llama 2 trainiert wurde.
Vorgefertigte Modelle sind eine enorme Zeit- und Kostenersparnis für Unternehmen, die KI-Modelle in ihren Anwendungen einsetzen möchten.
Alibaba hat einen ähnlichen Ansatz gewählt, um Metas Veröffentlichung von Llama 2 indem es seine kleineren Modelle als Open Source zur Verfügung stellt, so dass sie von Drittentwicklern kostenlos implementiert werden können. Das Unternehmen hofft, dass dies zu einer größeren Akzeptanz und realen Erprobung seiner Modelle führen wird.
Wie Meta bezeichnet Alibaba die Modelle als "quelloffen", obwohl das nicht ganz richtig ist. Es hat ähnliche Nutzungsanforderungen wie Llama 2, wobei Unternehmen mit 100 Millionen Nutzern pro Monat eine Lizenz von Alibaba benötigen.
Während die Modelle den meisten Nutzern kostenlos zur Verfügung stehen, profitiert Alibaba finanziell, indem es den Nutzern seiner Cloud-Computing-Plattform Gebühren für den Betrieb der Modelle berechnet. Alibaba hat bisher keine Pläne, sein größeres Modell kostenlos oder als Open-Source zu veröffentlichen. Alibaba macht auch Llama 2 Es wird also interessant sein zu sehen, wie die Annahme dieser konkurrierenden Modelle verläuft.
Die Nachricht über die Freigabe kommt etwa 2 Wochen nach der Ankündigung von Alibaba, seine Cloud-Computing-Plattform aufzurüsten.
Sie aktualisierte ihre Vektor-Engine für den Data-Warehousing-Dienst AnalyticDB die nach Angaben des Unternehmens die Erstellung von generativen KI-Anwendungen erheblich beschleunigen wird. Es behauptet, dass vorkonfigurierte KI-Anwendungen in weniger als 30 Minuten erstellt werden können.
Der Schritt von Alibaba ist bezeichnend für den sich verschärfenden KI-Wettlauf zwischen China und den USA. Andere chinesische Tech-Giganten, Huawei und Tencent, arbeiten ebenfalls an eigenen Modellen, deren Ankündigungen in Kürze erwartet werden.
Trotz des unstillbaren Appetits auf KI-Anwendungen sind die US-Chip-Exportbeschränkungen und globaler Mangel an High-End-GPUs verlangsamen das Tempo der chinesischen KI-Entwicklung etwas.
Die Chinesische AI-Vorschriften die nächste Woche in Kraft treten, werden auch das Tempo der Entwickler generativer KI verlangsamen, da sie sich durch den bürokratischen Prozess zur Erlangung von KI-Lizenzen bei den Behörden kämpfen müssen.
Chinesische Technologieunternehmen wie Alibaba werden hoffen, dass sie einige dieser Herausforderungen überwinden und auch außerhalb ihres Heimatmarktes eine größere Akzeptanz erreichen können. Das könnte wesentlich einfacher sein als für Entwickler von kostenpflichtigen Modellen wie OpenAI und Google, die in China Fuß fassen wollen.