CriticGPT vindt fouten in output van AI-modellen

OpenAI heeft het nieuwe model CriticGPT ontwikkeld om fouten in door ChatGPT gegenereerde code te identificeren. Dit moet bijdragen aan het accurater maken van de output van large language models (LLM’s). Normaliter wordt voor het verbeteren van de output Reinforcement Learning from Human Feedback (RLHF) gebruikt. Hierbij beoordeelt een mens de uitkomst van het model […]
techzine
28-06-2024 13:03