Ihre eigene DSGVO-konforme Dedicated
AI Server-Lösung

Setzen Sie mit unseren Dedicated Servern auf maximale Flexibilität und Kontrolle – perfekt, wenn Sie Ihre eigene KI-Umgebung hosten oder vorhandene Lösungen nahtlos in Ihre bestehende IT-Infrastruktur integrieren möchten. Unsere Server bieten modernste Hardware, die exakt auf Ihre Anforderungen zugeschnitten ist, und gewährleisten dabei höchste Sicherheitsstandards sowie strikte DSGVO-Konformität.

Aktuelle Angebote im Bereich AI Server

Wir erweitern unser Sortiment kontinuierlich, um Ihnen stets die besten AI-Serverlösungen anbieten zu können. Sollte aktuell kein passender Server dabei sein, kontaktieren Sie uns gerne direkt.

Nvidia Dedicated GPU Server Starter

Geeignet für 1-5 User

249 € / p.M.*

CPU: AMD EPYC 7413
GPU: RTX 3090 24 GB
Kerne: 24
Taktfrequenz: 2.65 GHz
RAM: 128GB DDR4 ECC
Speicherplatz: 2x 1 TB M.2 Datacenter SSD
RAID 1

Nvidia Dedicated GPU Server Standard

Geeignet für 5-20 User

499 € / p.M.*

CPU: AMD EPYC 7413
GPU: RTX 4090 24 GB
Kerne: 24
Taktfrequenz: 2.65 GHz
RAM: 128GB DDR4 ECC
Speicherplatz: 2x 1 TB M.2 Datacenter SSD
RAID 1

Nvidia Dedicated GPU Server Bronze

Geeignet für 20-50 User

699 € / p.M.*

CPU: AMD Epyc 7543P
GPU: 2x RTX 4090 24 GB
Kerne: 32
Taktfrequenz: 2.80 GHz
RAM: 256GB DDR4 ECC
Speicherplatz: 2x 1 TB M.2 Datacenter SSD
RAID 1

Sprechen Sie jetzt mit uns

Wir freuen uns, dass wir Ihr Interesse wecken konnten. Um Ihre Anforderungen genau zu verstehen und Ihnen die ideale DSGVO-konforme KI-Lösung anbieten zu können, benötigen wir nur einige wenige Informationen von Ihnen.

Unternehmen

Branche

Website

Unternehmensgröße

Was benutzen Sie im Unternehmen bissher?

Was würden Sie gerne DSGVO konform Nutzen?

Erzählen Sie uns wie Sie Ai in Ihrem Unternehmen gerne nutzen würden.

Kontaktperson

Vorname

Nachnahme

E-Mail

Warteliste

Ich bin damit einverstanden, in die Warteliste aufgenommen zu werden und regelmäßig Neuigkeiten sowie Updates zu ucepts AI zu erhalten. Weitere Informationen finden Sie in unserer Datenschutzerklärung

Datenschutzerkärung

Ich erkläre mich damit einverstanden, dass meine E-Mail-Adresse ausschließlich zur Beantwortung meiner Anfrage verwendet wird. Weitere Informationen finden Sie in unserer Datenschutzerklärung.

GPU Peformance

GPU	VRAM	Generation	SDXL: 16Bilder*	LLM 8b**
RTX 4090	24 GB / 48 GBi	Ada	1:18 Minuten	87 r_t/s
RTX 3090	24 GB	Ampere	2:24 Minuten	69 r_t/s
A100	40 GB	Ampere	1:19 Minuten	104 r_t/s
Tesla V100	16 GB / 32 GB	Volta	2:36 Minuten	62 r_t/s
RTX 4000 Ada	20 GB	Ada	3:06 Minuten	39 r_t/s
RTX A4000	16 GBB	Ampere	3:37 Minuten	39 r_t/s

*Was ist SDXL 1.0?

SDXL 1.0 ist die fortschrittlichste Entwicklung in der Reihe der Stable-Diffusion-Text-zu-Bild-Modelle, die von Stability AI eingeführt wurden. In der Tabelle sehen sie einen Benchmark der durchgeführt wurde. Es wir Angegeben wie viele Bilder pro Minute generiert werden konnten.

*Was ist LLM 8b?

Das LLM steht für Large Language Model (LLM) ist ein Deep-Learning-Algorithmus. Das „b“ steht für eine Milliarde Parameter. 8b bedeutet, dass das Modell 8 Milliarden Parameter hat.

*Was ist r_t/s

Die Abkürzung r_t/s steht für Requests-Tokens pro Sekunde (oder Requests per Token per Second). Diese Metrik kombiniert zwei zentrale Leistungsparameter. Anfragenrate (Requests) & Token-Generierungsgeschwindigkeit (Tokens pro Sekunde) das heißt Sie quantifiziert, wie viele Anfragen ein LLM gleichzeitig bearbeiten kann und wie effizient es dabei Tokens generiert. Ein Wert wie 87 r_t/s bedeutet, dass das Modell pro Sekunde durchschnittlich 87 Token im Rahmen paralleler Anfragen verarbeitet

Was sind Tokens

Ein Token ist eine Grundeinheit, in die Texte von Sprachmodellen zerlegt werden. Anstatt jeden einzelnen Buchstaben zu verarbeiten, „teilt“ das Modell den Text in sinnvolle Abschnitte auf – das können ganze Wörter, Wortteile oder auch einzelne Satzzeichen sein. Man kann sich das so vorstellen, als würde man einen Satz in seine Bestandteile zerlegen, um ihn besser analysieren zu können. Wenn du sagst, dass du eine Rate von 87 Tokens pro Sekunde (r_t/s) hast und du im Durchschnitt mit etwa 4 Zeichen pro Token rechnest, dann kannst du die Zeichenrate folgendermaßen abschätzen: Zeichen pro Sekunde ≈ 87 Tokens/s × 4 Zeichen/Token = 348 Zeichen/s Zeichen pro Sekunde≈87Tokens/s×4Zeichen/Token=348Zeichen/s Das heißt, bei einer Verarbeitung von 87 Tokens pro Sekunde werden etwa 348 Zeichen pro Sekunde bearbeitet – dies ist allerdings nur ein Näherungswert, da der genaue Wert von der Beschaffenheit des Textes abhängt.

Ihre Vorteile auf einen Blick

1. Individuelle Konfiguration

Passen Sie Ihren Server exakt an Ihre Bedürfnisse an – von der Hardwareauswahl bis zur Netzwerkarchitektur.

2. Maximale Datensicherheit

Profitieren Sie von einer Infrastruktur, die den strengen Vorgaben der DSGVO entspricht und Ihre Daten optimal schützt.

3. Höchste Performance

Nutzen Sie leistungsstarke Komponenten, die speziell für rechenintensive KI-Anwendungen entwickelt wurden.

4. Volle Kontrolle

Behalten Sie den uneingeschränkten Zugriff auf Ihr System, um Ihre KI-Lösungen flexibel zu verwalten und zu skalieren.

Ganz gleich, ob Sie einen DSGVO-konformen KI-Server für spezifische Anwendungen wie Ollama benötigen oder umfassende Kontrolle über Ihre KI-Projekte wünschen: Bei uns finden Sie eine Dedicated Server-Lösung, die Ihnen ein erstklassiges Preis-Leistungs-Verhältnis bietet. Starten Sie jetzt Ihre KI-Zukunft – entdecken Sie unsere flexiblen Konfigurationsoptionen und mieten Sie noch heute Ihren Dedicated Server. Mit ucepts AI legen Sie das Fundament für eine leistungsfähige, sichere und individuell anpassbare Serverarchitektur.

Ihre eigene DSGVO-konforme Dedicated AI Server-Lösung