DeepSeek-V3 overkomt uitdagingen van Mixture of Experts-techniek

DeepSeek brengt de derde versie van zijn model uit als open-source product. Het model telt 671 miljard parameters, maar zet deze niet allemaal tegelijk in om een antwoord te geven. DeepSeek is een AI-ontwikkelaar van Chinese oorsprong die via open-source-producten de concurrentie aangaat met commerciële ontwikkelaars. Het bedrijf is daar regelmatig succesvol in. Net als […]
techzine
27-12-2024 13:52