Nebius neemt voor 643 miljoen dollar het Amerikaanse Eigen AI over. Dit heeft Nederlands grootste ai-cloudbedrijf aangekondigd. Een vestiging voor engineering en onderzoek wordt opgezet in de buurt van San Francisco.
Onderzoekers van Eigen AI die optimalisatietechnieken en -tools hebben ontwikkeld voor ai-infrastructuur zullen zich bij Nebius voegen. De kern bestaat uit een team van wetenschappers afkomstig van het MIT HAN Lab. De acquisitie moet leiden tot een snellere implementatietijd van ai-projecten, aanzienlijk betere kostenefficiëntie en de mogelijkheid om sneller nieuwe modellen te implementeren.
Nebius heeft zijn hoofdkantoor aan de Amsterdamse Zuidas. Dankzij contracten met Meta en Microsoft ten bedrage van 46 miljard dollar kan het techbedrijf een enorme financiële armslag maken. Nvidia investeerde tweemiljard dollar in het bedrijf dat veel computerwetenschappers kent die uit Rusland zijn geëmigreerd.
Russische wortels
Het snelgroeiende Nebius komt voort uit Yandex N.V., de Nederlandse moeder van het Russische Yandex. In 2024 werden alle Russische activiteiten uit de Nederlandse vennootschap gehaald. Het bedrijf werd afgesplitst van Yandex, het ‘Russische Google’.
Eigen AI bestaat uit vooraanstaande onderzoekers op het gebied van ai-computing en optimalisatie van modellen. Ze zijn gespecialiseerd in inferentie, de fase in een ai-systeem waarin een getraind model beslissingen neemt of voorspellingen doet op basis van nieuwe, onbekende data. Wat een systeem dat is getraind op grote datasets eerder heeft geleerd, gaat het in de inferentie-fase toepassen op binnenkomende data.
De overname zorgt ervoor dat Nebius Token Factory een sterker en completer platform wordt voor het draaien van ai‑modellen. Eigen AI combineert zijn bestaande optimalisatietechniek met de wereldwijde rekenkracht en ai‑cloud van Nebius dat meerdere datacenters bezit. Nebius haalt met de overname extra topexperts in huis, waardoor hun eigen ai‑onderzoek en ontwikkeling een flinke boost krijgt.
Inferentie
Het is de bedoeling om de inferentie- en optimalisatielagen (post-training) van Eigen AI direct te integreren in Nebius Token Factory. Dit platform biedt bedrijfsbrede, automatisch schaalbare endpoints en ‘fine-tuning pipelines’ voor alle belangrijke open-source modellen. De twee bedrijven hebben al gezamenlijk geoptimaliseerde implementaties van toonaangevende opensource-modellen geleverd die tot de snelste behoren als het gaat om ‘artificial analysis’.
Inferentie is momenteel het snelst groeiende segment van ai. Naar verwachting zal dit later dit jaar ongeveer twee derde van de rekenkracht voor zijn rekening nemen. Het gebruik van opensource-modellen neemt eveneens toe. Nu steeds meer workloads in productie worden genomen, wordt de systeem-optimalisatielaag een cruciale infrastructuur.
Grenzen verleggen
Roman Chernin, medeoprichter Nebius, wijst op de beperkte rekencapaciteit voor ai. Geoptimaliseerde inferentie en schaalbare infrastructuur zijn daardoor hard nodig. Ryan Hanrui Wang, medeoprichter van Eigen AI, wil de grenzen van inferentie-prestaties verleggen. ‘Samen met Nebius nemen we de frictie weg bij het aanpassen en implementeren van ai-modellen, zodat ontwikkelaars modellen betrouwbaar in productie kunnen draaien zonder de onderliggende infrastructuur te hoeven beheren.’
Het efficiënt uitvoeren van inferentie in productie is inherent complex. Volgens Nebius vereist dit diepgaande expertise over de gehele uitvoeringsstack, van hoe modellen worden weergegeven tot hoe gpu-kernels ze uitvoeren en hoe workloads in realtime worden gepland.
Full-stack optimalisatie
Open-sourcemodellen worden doorgaans niet geoptimaliseerd geleverd, en nieuwere architecturen zoals Mixture-of-Experts (MoE), Compressed Sparse Attention (CSA), redeneermodellen en modellen met een lange context introduceren extra uitdagingen op het gebied van geheugen, routing en rekenkracht. De meeste teams hebben niet de capaciteit om deze problemen intern op te lossen, stelt Nebius.
Eigen AI pakt deze uitdaging aan met een full-stack optimalisatie-aanpak die de gehele levenscyclus van het model omvat. Van post-training en finetuning tot optimalisatie van inferentie in productie, voor alle belangrijke opensource-modellen die in productie worden gebruikt, waaronder GPT-OSS, Gemma, Qwen, Llama, Nemotron, DeepSeek, GLM, Kimi en MiniMax.
computable
04-05-2026 09:53