Alibaba startet Qwen3-Embedding und Qwen3-Reranker für mehrsprachige Texteinbettung

EditorLuke Juricic
Veröffentlicht am 06.06.2025, 15:14
© Reuters.

Investing.com -- Alibaba (NYSE:BABA) hat die Qwen3-Embedding- und Qwen3-Reranker-Serie eingeführt, die neue Maßstäbe in der mehrsprachigen Texteinbettung und Relevanzrangfolge setzt. Die Serie, die Modelle für Texteinbettung, Abruf und Neuordnung umfasst, unterstützt 119 Sprachen und ist in den Versionen 0,6B, 4B und 8B verfügbar.

Die Qwen3-Embedding- und Qwen3-Reranker-Serie basieren auf dem Qwen3-Basismodell, das über robuste mehrsprachige Textverständnisfähigkeiten verfügt. Diese neuen Modelle haben in mehreren Benchmarks für Texteinbettungs- und Neuordnungsaufgaben Spitzenleistungen erzielt. Sie werden unter der Apache 2.0-Lizenz auf Hugging Face, GitHub und ModelScope als Open Source angeboten und können über API auf Alibaba Cloud genutzt werden.

Die Qwen3-Embedding-Serie bietet verschiedene Größen für Embedding- und Reranking-Modelle und bedient damit verschiedene Anwendungsfälle, bei denen Effizienz und Effektivität im Vordergrund stehen. Das Embedding-Modell der Größe 8B belegt mit einer Punktzahl von 70,58 den ersten Platz in der MTEB-mehrsprachigen Rangliste (Stand: 05.06.2025). Die Reranking-Modelle überzeugen in Textabrufszenarien und verbessern die Suchrelevanz erheblich.

Die Qwen3-Embedding-Serie unterstützt über 100 Sprachen, einschließlich verschiedener Programmiersprachen, und bietet robuste mehrsprachige, sprachübergreifende und Code-Abruffunktionen. Die Modelle wurden mit Dual-Encoder- und Cross-Encoder-Architekturen entwickelt und zielen darauf ab, die Textverständnisfähigkeiten des Basismodells vollständig zu bewahren und zu verbessern.

Das Trainingsframework für die Qwen3-Embedding-Serie folgt dem mehrstufigen Trainingsparadigma der GTE-Qwen-Serie. Dies umfasst eine dreistufige Trainingsstruktur für das Embedding-Modell und eine direkte Verwendung hochwertiger gekennzeichneter Daten für das überwachte Training des Reranking-Modells, was die Trainingseffizienz verbessert.

Im Rahmen zukünftiger Arbeiten plant Alibaba, das Qwen-Basismodell weiter zu optimieren, um die Trainingseffizienz von Texteinbettungen und Reranking-Modellen zu verbessern. Dies wird die Einsatzleistung in verschiedenen Szenarien verbessern. Darüber hinaus plant das Unternehmen, sein multimodales Repräsentationssystem zu erweitern, um modalitätsübergreifende semantische Verständnisfähigkeiten zu etablieren.

Diese Übersetzung wurde mithilfe künstlicher Intelligenz erstellt. Weitere Informationen entnehmen Sie bitte unseren Nutzungsbedingungen.

Aktuelle Kommentare

Installieren Sie unsere App
Risikohinweis: Beim Handel mit Finanzinstrumenten und/oder Kryptowährungen bestehen erhebliche Risiken, die zum vollständigen oder teilweisen Verlust Ihres investierten Kapitals führen können. Die Kurse von Kryptowährungen unterliegen extremen Schwankungen und können durch externe Einflüsse wie finanzielle, regulatorische oder politische Ereignisse beeinflusst werden. Durch den Einsatz von Margin-Trading wird das finanzielle Risiko erhöht.
Vor Beginn des Handels mit Finanzinstrumenten und/oder Kryptowährungen ist es wichtig, die damit verbundenen Risiken vollständig zu verstehen. Es wird empfohlen, sich gegebenenfalls von einer unabhängigen und sachkundigen Person oder Institution beraten zu lassen.
Fusion Media weist darauf hin, dass die auf dieser Website bereitgestellten Kurse und Daten möglicherweise nicht in Echtzeit oder vollständig genau sind. Diese Informationen werden nicht unbedingt von Börsen, sondern von Market Makern zur Verfügung gestellt, was bedeutet, dass sie indikativ und nicht für Handelszwecke geeignet sein können. Fusion Media und andere Datenanbieter übernehmen daher keine Verantwortung für Handelsverluste, die durch die Verwendung dieser Daten entstehen können.
Die Nutzung, Speicherung, Vervielfältigung, Anzeige, Änderung, Übertragung oder Verbreitung der auf dieser Website enthaltenen Daten ohne vorherige schriftliche Zustimmung von Fusion Media und/oder des Datenproviders ist untersagt. Alle Rechte am geistigen Eigentum liegen bei den Anbietern und/oder der Börse, die die Daten auf dieser Website bereitstellen.
Fusion Media kann von Werbetreibenden auf der Website aufgrund Ihrer Interaktion mit Anzeigen oder Werbetreibenden vergütet werden.
Im Falle von Auslegungsunterschieden zwischen der englischen und der deutschen Version dieser Vereinbarung ist die englische Version maßgeblich.
© 2007-2025 - Fusion Media Limited. Alle Rechte vorbehalten.