Alibaba Cloud Qwen ist die LLM-/Multimodal-Modellfamilie von Alibaba Cloud. Über Model Studio / DashScope können Entwickler Qwen-Modelle per API nutzen, darunter Textmodelle, multimodale Modelle, Reasoning-Modelle, Coding-Modelle, Übersetzungsmodelle und Open-Source-/Open-Weight-Varianten. Die API ist OpenAI-kompatibel und kann je nach Region über unterschiedliche Endpoints genutzt werden. Alibaba Cloud Qwen API
LLM „one-stop model service platform“,
Standort: China ⓘ Alibaba Group: 699 Wang Shang Road, Binjiang District, Hangzhou 310052, Zhejiang Province, China.
Batch Calls Separate Verarbeitung großer Workloads; nicht durch Free Quota abgedeckt.
Context Cache Cache-Funktion zur Reduktion wiederholter Kontextkosten; nicht durch Free Quota abgedeckt.
Fine-Tuning / Deployment / Custom Models Modellanpassung und Deployment eigener bzw. feinabgestimmter Modelle; separat abgerechnet und nicht über Free Quota abgedeckt.
OpenAI-/Responses-kompatible API Qwen-Modelle unterstützen OpenAI-kompatible Schnittstellen und Responses API für agentische Anwendungen.
Zielgruppe
Alibaba Cloud Qwen richtet sich an Entwickler, Start-ups, Softwareteams, Agenturen, Data-/AI-Teams, KMU und größere Unternehmen, die LLM-Funktionen per API in eigene Anwendungen integrieren möchten. Besonders interessant ist Qwen für mehrsprachige Anwendungen, China-/APAC-nahe Geschäftsmodelle, Coding-Agenten, Dokumentenverarbeitung, Übersetzung, multimodale Assistenzsysteme und lange Kontextverarbeitung. Für EU-Unternehmen ist Qwen vor allem dann relevant, wenn der Germany/Frankfurt EU Deployment Mode genutzt und vertraglich sauber geprüft wird.
Herausragende Funktionen
Herausragend ist die Breite der Modellfamilie: Qwen deckt General-Purpose-LLMs, Reasoning, Agenten, Coding, Vision, Audio/Video, OCR, Übersetzung und Open-Source-Modelle ab. Model Studio stellt offizielle Qwen APIs und OpenAI-kompatible APIs bereit, sodass bestehende OpenAI-Integrationen relativ leicht migriert werden können. Besonders stark sind die langen Kontextfenster von bis zu 1 Mio. Tokens bei Qwen3.5-Plus, Qwen3.5-Flash, Qwen-Plus, Qwen-Flash und Qwen3-Coder.
Wichtigste Anwendungsfelder
Typische Einsatzfelder sind Chatbots, interne Wissensassistenten, RAG-Systeme, Dokumenten-QA, Langtextanalyse, Codegenerierung, autonome Coding-Agenten, Tool-Calling, Übersetzung, mehrsprachiger Kundenservice, OCR-nahe Dokumentenextraktion, Bild-/Video-Verständnis, Voice-/Audio-Workflows und semantische Automatisierungen. Qwen3-Max ist für komplexe mehrstufige Aufgaben gedacht, Qwen3.5-Plus für die Balance aus Leistung, Geschwindigkeit und Kosten, Qwen3.5-Flash für schnelle und günstige Standardaufgaben und Qwen3-Coder für Softwareentwicklung.
Nutzung & Hinweise
Die Nutzung erfolgt über Alibaba Cloud Model Studio, API-Key und regionalspezifische Endpoints. Für internationale Nutzung gibt es u. a. Singapore, US Virginia, China Beijing, China Hong Kong und Germany Frankfurt; API-Keys sind regionalspezifisch und nicht austauschbar. Für DSGVO-relevante Workloads sollte nicht pauschal der International Mode genutzt werden, sondern gezielt der EU Deployment Mode, da nur dieser Datenhaltung in Frankfurt und EU-beschränkte Inferenz dokumentiert. Für vertrauliche Daten sollten Logging, Model Monitoring, Zugriffskontrollen, RAM/IAM, DPA, Subprozessoren, Löschkonzepte und Datenflüsse geprüft werden.
| Zielgruppe | Einschätzung |
|---|---|
| Entwickler / Produktteams | Sehr geeignet – für Qwen-basierte Chat-, Coding-, Reasoning-, Tool-Calling-, multimodale und OpenAI-kompatible Anwendungen. |
| Coding-Teams | Sehr geeignet – besonders durch Qwen-Coder, Coding Plan, OpenAI-/Anthropic-kompatible Endpunkte und IDE-/Agenten-Tool-Unterstützung. |
| Asien-/China-nahe Unternehmen | Sehr geeignet – wenn Alibaba Cloud, China-/Hongkong-/Singapur-Regionen oder lokaler Marktzugang wichtig sind. |
| Kostenbewusste KI-Teams | Geeignet – durch Pay-as-you-go, Free Quotas in bestimmten Modi und spezialisierte Modelle. |
| EU-Unternehmen | Bedingt geeignet – EU-Deployment ist vorhanden, aber Anbieter, Subprozessoren, Rechtsrahmen und globale Verarbeitungsmodi müssen sorgfältig geprüft werden. |
| Privatpersonen ohne Technikbezug | Eher nicht für die API geeignet – Qwen Studio ist einfacher; die Alibaba Cloud Qwen API ist technisch und Cloud-orientiert. |
Berechnung der Token und Kosten mit KIFOX-Tokenizer
| Modell | Besonders geeignet für |
|---|---|
| qwen3-max | komplexe Aufgaben, mehrstufiges Reasoning, Agenten, Tool Calling, anspruchsvolle Enterprise-Workflows |
| qwen3.5-plus | Allrounder, multimodale Business-Apps, lange Kontexte, RAG, Code, Agenten, gutes Preis-Leistungs-Verhältnis |
| qwen3.5-flash | schnelle Standardaufgaben, hohe Anfragevolumen, einfache Chatbots, Klassifikation, kosteneffiziente Workloads |
| qwen-plus | ausgewogener Generalist, lange Kontexte, produktive Chatbots, RAG, Standard-Business-Aufgaben |
| qwen-flash | sehr günstige/schnelle Antworten, einfache Aufgaben, Routing, Klassifikation, Skalierung |
| qwen-turbo | leichte Textaufgaben, kurze Antworten, einfache Zusammenfassungen, kostensensitive Anwendungen |
| qwq-plus | Reasoning, Mathematik, Code, Logik, anspruchsvolle Problemlösung |
| qwen3-coder-plus | autonome Coding-Agenten, komplexe Codebases, Tool Calling, Multi-Step-Softwareentwicklung |
| qwen3-coder-flash | schnelle Coding-Hilfe, Code Completion, einfache Refactorings, kostengünstige Developer-Workflows |
| qwen-coder-plus | klassische Codegenerierung, längere Codekontexte, Developer-Assistenz |
| qwen-coder-turbo | schnelle Coding-Tasks, einfache Codevorschläge, niedrige Kosten |
| qwen3.5-omni-plus | multimodale High-End-Workflows, Text/Bild/Video/Audio-Verständnis, komplexe Assistenten |
| qwen3.5-omni-flash | günstige multimodale Anwendungen, Audio-/Bild-/Video-Verständnis, schnelle Multimodal-Assistenz |
| qwen3-omni-flash | multimodale Inputs, Text+Audio-Ausgabe, Voice-/Media-Assistenten |
| qwen-omni-turbo | einfache multimodale Workflows, Voice-nahe Assistenten, kostengünstige Audio/Bild/Video-Verarbeitung |
| qwen3-vl-plus | starkes Vision-Language-Modell, Dokumente, Bilder, Charts, Screenshots, visuelles Reasoning |
| qwen3-vl-flash | günstige Vision-Language-Workloads, Visual QA, Dokumenten-/Bildanalyse mit hoher Skalierung |
| qwen-vl-max | Bild-/Videoverständnis, visuelles Reasoning, Objektlokalisierung, komplexere multimodale Analyse |
| qwen-vl-plus | kostengünstigere Vision-Language-Anwendungen, Dokumente, Bilder, Videos, mehrsprachige visuelle QA |
| qwen-vl-ocr | OCR, Dokumentenextraktion, Tabellen, Formeln, Textlokalisierung, strukturierte Dokumentenverarbeitung |
| qwen-mt-plus | hochwertige Übersetzung, Terminologie, Format-Erhalt, domänenspezifische Übersetzung |
| qwen-mt-flash | schnelle/günstige Übersetzung, hohe Volumina, Standardlokalisierung |
| qwen-mt-lite | sehr kostengünstige Übersetzung, einfache mehrsprachige Workflows |
| qwen-mt-turbo | schnelle Übersetzung, geringe Latenz, operative Lokalisierung |
| qwen-math-plus | Mathematik, Formeln, strukturierte Rechenaufgaben, mathematische Problemlösung |
| qwen-math-turbo | günstigere Mathematikaufgaben, schnelle Rechen-/Formelhilfe |
| qwen3.5-397b-a17b | sehr starke Open-Weight-/API-Variante, komplexe allgemeine Aufgaben, Agenten, High-End-Reasoning |
| qwen3.5-122b-a10b | leistungsstarker Generalist, gute Balance aus Qualität und Kosten |
| qwen3.5-27b | effiziente General-Purpose-Workloads, Self-Hosting-nahe Szenarien, skalierbare Apps |
| qwen3.5-35b-a3b | effizientes MoE-Modell, schnelle produktive Workloads, gute Kosten-/Leistungsbalance |
| qwen3-next-80b-a3b-thinking | Thinking-only, Reasoning, präzisere Zusammenfassungen, komplexe Schlussfolgerungen |
| qwen3-next-80b-a3b-instruct | Non-thinking, Instruktionsbefolgung, Chinesisch-Verständnis, schnelle Textgenerierung |
| qwen3-235b-a22b-thinking-2507 | sehr starkes Reasoning, Mathematik, Code, komplexe Agentenaufgaben |
| qwen3-235b-a22b-instruct-2507 | starke allgemeine Text-/Instruktionsaufgaben ohne Thinking-Modus |
| qwen3-30b-a3b-thinking-2507 | effizientes Reasoning, kostengünstigere komplexe Aufgaben |
| qwen3-30b-a3b-instruct-2507 | effiziente Non-thinking-Instruktionsaufgaben, Chatbots, Textgenerierung |
| qwen3-32b | starker Dense-Generalist, Coding, Reasoning, mehrsprachige Aufgaben |
| qwen3-30b-a3b | effizientes MoE-Modell, gute Qualität bei niedrigerem aktiven Parameterbudget |
| qwen3-14b | mittelgroße Workloads, Self-Hosting, Chatbots, Klassifikation, gute Kostenkontrolle |
| qwen3-8b | leichte produktive Workloads, Edge-/Self-Hosting-nahe Nutzung, Routing, einfache Assistenten |
| qwen3-4b | lokale/kleine Deployments, Klassifikation, einfache Q&A, niedrige Ressourcen |
| qwen3-1.7b | sehr leichte lokale Aufgaben, Embedded/Edge, einfache Textklassifikation |
| qwen3-0.6b | minimale Ressourcen, On-device/Edge-Experimente, einfache Automatisierung |
| qwen2.5-72b-instruct | weiterhin API-geführt, ältere starke Open-Source-Textvariante, allgemeine Textaufgaben |
| qwen2.5-32b-instruct | mittlere Open-Source-Workloads, Chat, RAG, Self-Hosting |
| qwen2.5-14b-instruct / qwen2.5-14b-instruct-1m | lange Kontexte, kosteneffiziente Textanalyse, Self-Hosting |
| qwen2.5-7b-instruct / qwen2.5-7b-instruct-1m | leichte Textaufgaben, lokale Nutzung, lange Kontext-Experimente |
| qwen2.5-3b-instruct | kleine Deployments, einfache Assistenz, Klassifikation |
| qwen2.5-1.5b-instruct | sehr kleine lokale Workloads, einfache Automatisierung |
| qwen2.5-0.5b-instruct | Edge-/Experimentiermodell, sehr einfache Aufgaben |
Hosting & Daten
1) On-Prem / lokales Hosting
Bedeutung: Die Firma betreibt die Lösung auf eigener Hardware oder in der eigenen Infrastruktur. Im strengsten Sinn läuft dabei nicht nur die Anwendung, sondern idealerweise auch das Modell lokal.
2) Private Cloud / RZ
Bedeutung: Die Lösung läuft in einer dedizierten oder stärker abgegrenzten Cloud-Umgebung, oft bei einem Hosting-Anbieter oder Hyperscaler, aber in einem deutschen Rechenzentrum oder in einer besonders kontrollierten Umgebung.
3) EU-SaaS / Managed
Bedeutung: Der Anbieter betreibt die Lösung selbst als Dienst. Die Firma nutzt das Tool als fertigen Cloud-Service, idealerweise mit EU-Datenresidenz.
4) Hybrid
Bedeutung: Ein Teil der Verarbeitung bleibt intern / lokal / in privater Cloud, ein anderer Teil läuft in einer externen Cloud oder EU-SaaS.
5) AVV / DPA
Bedeutung: Das ist der Auftragsverarbeitungsvertrag bzw. Data Processing Addendum.
Er regelt, dass der Anbieter personenbezogene Daten im Auftrag verarbeitet und an die Weisungen des Kunden gebunden ist.
6) Kein Training
Bedeutung: Der Anbieter nutzt deine Prompts, Uploads, Anhänge, Chatverläufe oder Outputs nicht zum Training oder zur Verbesserung des allgemeinen Modells — idealerweise vertraglich ausgeschlossen.
7) Open-Source-/Transparenz-Pfad
Bedeutung: Es gibt einen Weg zu mehr technischer Transparenz und Souveränität, etwa durch:
- offene Modelle
- dokumentierte Komponenten
- self-hostbare Teile
- nachvollziehbare Architektur
- Export-/Wechselmöglichkeiten
| On-prem / local hosting | ❓ |
| Private cloud / data center | ⚠️ |
| EU SaaS / Managed | ✅ |
| Hybrid | ❓ |
| DPA / AVV | ✅ |
| No training on customer data | ✅ |
| Open source / transparency path | ⚠️ |
On-Prem / lokales Hosting: indirekt / nicht verfuegbar
Fuer die Alibaba-Cloud-Qwen-API bzw. Model Studio wurde auf den gefundenen Anbieter-Seiten keine On-Prem-/lokale Bereitstellung der kommerziellen API dokumentiert. Open-Source-Qwen-Modelle werden erwaehnt, aber eine konkrete self-hostbare Produktoption fuer dieses Tool wurde auf der Website nicht angegeben.
Private Cloud / RZ: teilweise
Es gibt einen expliziten EU-Deployment-Modus mit gebundener Datenregion Deutschland (Frankfurt) und auf die EU begrenzter Inferenz. Das spricht fuer eine kontrolliertere regionale Umgebung, aber eine dedizierte Private-Cloud- oder Single-Tenant-Zusicherung fuer dieses Produkt wurde auf den gefundenen Seiten nicht belegt.
EU-SaaS / Managed: abgedeckt
Die Website dokumentiert einen 'European Union'-Deployment-Modus. Dabei sind Datenhaltung und Endpunkte in Deutschland (Frankfurt), und die Inferenz ist laut Dokumentation auf die EU beschraenkt. Das ist eine klar dokumentierte EU-SaaS-/Managed-Option fuer Nutzer im EU/EWR-Raum.
Hybrid: unklar
Ein Hybrid-Betriebsmodell aus intern/lokal plus externer SaaS-Verarbeitung wurde fuer dieses Tool auf der Website nicht konkret beschrieben.
AVV / DPA: abgedeckt
Auf der Website ist ein 'Data Processing Addendum' veroeffentlicht. Es beschreibt Alibaba Cloud als Processor, Verarbeitung nur auf dokumentierte Weisungen, Vertraulichkeit, TOMs und verweist fuer GDPR auf die EU-Standardvertragsklauseln.
Kein Training: abgedeckt
Die Model-Studio-Privacy-Seite sagt ausdruecklich, Alibaba Cloud werde Kundendaten niemals fuer Modelltraining verwenden. Fuer direkte API-Aufrufe steht zudem dort, dass keine Gespraechsdaten gespeichert werden; beim Assistant-API-Pfad wird jedoch Verlaufsspeicherung genannt, was man bei der Implementierung beachten muss.
Open-Source / Transparenz-Pfad: teilweise
Die Website nennt offene Modelle wie 'Qwen3' bzw. weitere Open-Source-Qwen-Varianten innerhalb Model Studio. Das schafft einen Transparenz-/Souveraenitaetspfad. Allerdings wurde auf den gefundenen Seiten keine konkrete Self-Hosting-Anleitung oder ein vollstaendiger Transparenzpfad fuer die kommerzielle API dokumentiert.
Datenverarbeitung
Laut Anbieter-Dokumentation haengt die Datenverarbeitung vom Zugriffsweg ab. Bei direkten API-Aufrufen speichert Model Studio keine Gespraechsdaten, sondern nur desensibilisierte Statusinformationen. Beim Assistant-API-Pfad wird der Gespraechsverlauf gespeichert und hat laut Website derzeit kein Ablaufdatum. Unabhaengig vom Deployment-Modus soll statische Datenhaltung in der gewaehlt gebundenen Region erfolgen; fuer den EU-Modus ist dies Deutschland (Frankfurt), waehrend Global/International grenzueberschreitende Rechenpfade nutzen koennen.
Fazit
Fuer ein EU-/EWR-Verzeichnis ist Alibaba Cloud Qwen API nicht pauschal als vollumfaenglich DSGVO-konform dokumentiert, aber es gibt einen klaren bedingten Compliance-Pfad: Nutzung von Model Studio im 'European Union'-Deployment-Modus, moeglichst ueber direkte API-Aufrufe statt Assistant-API, plus Abschluss des veroeffentlichten DPA und eigene Pruefung der grenzueberschreitenden Risiken bzw. der fehlend dokumentierten Subprozessoren. Ohne diese Konfigurationen bzw. bei Nutzung von Global/International ist die Lage aus EU-/EWR-Sicht deutlich kritischer.
Quellen
- https://www.alibabacloud.com/help/en/model-studio/model-pricing
- https://www.alibabacloud.com/help/en/model-studio/billing/
- https://www.alibabacloud.com/help/en/model-studio/regions/
- https://www.alibabacloud.com/help/en/model-studio/models
- https://www.alibabacloud.com/help/en/model-studio/privacy-notice
- https://www.alibabacloud.com/help/en/legal/latest/alibaba-cloud-international-website-privacy-policy
- https://www.alibabacloud.com/help/en/legal/latest/fe2cxg
| On-prem / local hosting | ❓ |
| Private cloud / data center | ⚠️ |
| EU SaaS / Managed | ✅ |
| Hybrid | ❓ |
| DPA / AVV | ✅ |
| No training on customer data | ✅ |
| Open source / transparency path | ⚠️ |
On-Prem / lokales Hosting: indirekt / nicht verfuegbar
Fuer die Alibaba-Cloud-Qwen-API bzw. Model Studio wurde auf den gefundenen Anbieter-Seiten keine On-Prem-/lokale Bereitstellung der kommerziellen API dokumentiert. Open-Source-Qwen-Modelle werden erwaehnt, aber eine konkrete self-hostbare Produktoption fuer dieses Tool wurde auf der Website nicht angegeben.
Private Cloud / RZ: teilweise
Es gibt einen expliziten EU-Deployment-Modus mit gebundener Datenregion Deutschland (Frankfurt) und auf die EU begrenzter Inferenz. Das spricht fuer eine kontrolliertere regionale Umgebung, aber eine dedizierte Private-Cloud- oder Single-Tenant-Zusicherung fuer dieses Produkt wurde auf den gefundenen Seiten nicht belegt.
EU-SaaS / Managed: abgedeckt
Die Website dokumentiert einen 'European Union'-Deployment-Modus. Dabei sind Datenhaltung und Endpunkte in Deutschland (Frankfurt), und die Inferenz ist laut Dokumentation auf die EU beschraenkt. Das ist eine klar dokumentierte EU-SaaS-/Managed-Option fuer Nutzer im EU/EWR-Raum.
Hybrid: unklar
Ein Hybrid-Betriebsmodell aus intern/lokal plus externer SaaS-Verarbeitung wurde fuer dieses Tool auf der Website nicht konkret beschrieben.
AVV / DPA: abgedeckt
Auf der Website ist ein 'Data Processing Addendum' veroeffentlicht. Es beschreibt Alibaba Cloud als Processor, Verarbeitung nur auf dokumentierte Weisungen, Vertraulichkeit, TOMs und verweist fuer GDPR auf die EU-Standardvertragsklauseln.
Kein Training: abgedeckt
Die Model-Studio-Privacy-Seite sagt ausdruecklich, Alibaba Cloud werde Kundendaten niemals fuer Modelltraining verwenden. Fuer direkte API-Aufrufe steht zudem dort, dass keine Gespraechsdaten gespeichert werden; beim Assistant-API-Pfad wird jedoch Verlaufsspeicherung genannt, was man bei der Implementierung beachten muss.
Open-Source / Transparenz-Pfad: teilweise
Die Website nennt offene Modelle wie 'Qwen3' bzw. weitere Open-Source-Qwen-Varianten innerhalb Model Studio. Das schafft einen Transparenz-/Souveraenitaetspfad. Allerdings wurde auf den gefundenen Seiten keine konkrete Self-Hosting-Anleitung oder ein vollstaendiger Transparenzpfad fuer die kommerzielle API dokumentiert.
Datenverarbeitung
Laut Anbieter-Dokumentation haengt die Datenverarbeitung vom Zugriffsweg ab. Bei direkten API-Aufrufen speichert Model Studio keine Gespraechsdaten, sondern nur desensibilisierte Statusinformationen. Beim Assistant-API-Pfad wird der Gespraechsverlauf gespeichert und hat laut Website derzeit kein Ablaufdatum. Unabhaengig vom Deployment-Modus soll statische Datenhaltung in der gewaehlt gebundenen Region erfolgen; fuer den EU-Modus ist dies Deutschland (Frankfurt), waehrend Global/International grenzueberschreitende Rechenpfade nutzen koennen.
Fazit
Fuer ein EU-/EWR-Verzeichnis ist Alibaba Cloud Qwen API nicht pauschal als vollumfaenglich DSGVO-konform dokumentiert, aber es gibt einen klaren bedingten Compliance-Pfad: Nutzung von Model Studio im 'European Union'-Deployment-Modus, moeglichst ueber direkte API-Aufrufe statt Assistant-API, plus Abschluss des veroeffentlichten DPA und eigene Pruefung der grenzueberschreitenden Risiken bzw. der fehlend dokumentierten Subprozessoren. Ohne diese Konfigurationen bzw. bei Nutzung von Global/International ist die Lage aus EU-/EWR-Sicht deutlich kritischer.
Quellen
- https://www.alibabacloud.com/help/en/model-studio/model-pricing
- https://www.alibabacloud.com/help/en/model-studio/billing/
- https://www.alibabacloud.com/help/en/model-studio/regions/
- https://www.alibabacloud.com/help/en/model-studio/models
- https://www.alibabacloud.com/help/en/model-studio/privacy-notice
- https://www.alibabacloud.com/help/en/legal/latest/alibaba-cloud-international-website-privacy-policy
- https://www.alibabacloud.com/help/en/legal/latest/fe2cxg
Stärken & Schwächen im Überblick
| Stärken | Schwächen |
|---|---|
| • Sehr breite Modellpalette: Text, Vision, Audio, Video, Code, Reasoning, Translation, OCR und Embeddings. | • Alibaba Cloud ist ein chinesischer Anbieter; für EU-Unternehmen können geopolitische, datenschutzrechtliche und Beschaffungsrisiken höher sein als bei EU-Anbietern. |
| • OpenAI-kompatible API. | • Nicht alle Modelle sind in allen Regionen verfügbar. |
| • Offizielle EU-Deployment-Option in Frankfurt mit EU-begrenzter Inferenz. | • International Mode nutzt Singapore als Endpoint/Data-Storage-Region, aber Inferenz wird global dynamisch verteilt, außer Chinese Mainland. |
| • Kein Training mit Kundendaten laut Model-Studio-FAQ. | • Global Mode kann US Virginia oder Germany Frankfurt als Datenregion haben, nutzt aber globale dynamische Scheduling-Ressourcen. |
| • Viele Qwen-Modelle haben Open-Weight-/Open-Source-Pfade. | • Nur der EU Deployment Mode beschränkt Inferenz offiziell auf die EU. |
| • Gute Eignung für asiatische, chinesische und mehrsprachige Szenarien. | • Kommerzielle Qwen-Modelle sind nicht automatisch selbst hostbar; Self-Hosting gilt nur für verfügbare Open-Weight-Varianten. |
| • Lange Kontextfenster bis 1 Mio. Tokens bei mehreren Modellen. |
Bewertungen
0 Bewertungen insgesamt
Für dieses Tool liegen noch keine bestätigten Bewertungen vor.
Bewertung absenden
Deine Bewertung wird erst nach der Bestätigung per E-Mail sichtbar. Damit schützen wir das Portal vor Missbrauch.
Bewertung melden
Bitte wähle den Grund aus, warum diese Bewertung geprüft werden soll.
DSGVO-konforme Nutzung möglich?
Fuer eine Nutzung im EU-/EWR-Raum gibt es auf der Anbieter-Website klare Bausteine fuer eine moeglicherweise DSGVO-tauglichere Konfiguration: Model Studio bietet einen expliziten 'European Union'-Deployment-Modus, bei dem Datenhaltung an die Region Deutschland (Frankfurt) gebunden ist und die Inferenz laut Dokumentation auf die EU begrenzt wird. Zusaetzlich gibt es eine veroeffentlichte Datenschutzerklaerung und ein Data Processing Addendum mit Bezug auf GDPR und EU-Standardvertragsklauseln. Gleichzeitig ist die Dokumentation fuer eine vollumfaengliche positive Bewertung nicht stark genug: Eine verifizierbare Liste von Subprozessoren wurde auf der Website nicht gefunden, eine explizite ISO-27001-Angabe fuer Model Studio wurde auf den gefundenen Seiten nicht belegt, und der Dienst bietet nach den gefundenen Produktseiten keine klar dokumentierte On-Prem-/Self-Hosting-Option fuer die kommerzielle API. Deshalb erscheint fuer den gesamten EU/EWR-Raum am ehesten 'bedingt'.
Positiv
Positiv belegt sind eine eigene Datenschutzerklaerung fuer Alibaba Cloud International, ein veroeffentlichtes DPA, ein ausdruecklicher EU-Deployment-Modus fuer Model Studio mit Datenhaltung in Deutschland (Frankfurt) und EU-beschraenkter Inferenz sowie die Aussage, dass Kundendaten nicht fuer Modelltraining verwendet werden. Zudem nennt die Produktdokumentation SOC 2 fuer Model Studio und beschreibt bei direkten API-Aufrufen, dass keine Gespraechsdaten gespeichert werden.
Negativ
Negativ bzw. einschraenkend ist, dass in der Privacy- und Produktdokumentation zwar grenzueberschreitende Verarbeitung adressiert wird, aber fuer den konkret gesuchten Punkt 'Subprozessoren' auf der Website keine belastbare Unterseite mit einer Liste gefunden wurde. Fuer den Assistant-API-Pfad wird ausserdem eine Speicherung des Gespraechsverlaufs ohne derzeitiges Ablaufdatum genannt. Eine klare On-Prem-/Self-Hosting-Option fuer die kommerzielle API wurde auf der Website nicht angegeben.
Serverstandort
Auf der Website ist fuer den 'European Union'-Deployment-Modus angegeben, dass die gebundene Datenregion Deutschland (Frankfurt) ist und die Modellinferenz auf die EU begrenzt ist. In der Modell- und Pricing-Dokumentation steht ebenfalls, dass im EU-Modus Endpunkte und Datenspeicherung in Deutschland (Frankfurt) liegen. Fuer Global/International werden dagegen grenzueberschreitende Rechenpfade beschrieben.