A combine harvester (combine) includes any number of components to harvest plants as the combine travels through a plant field. The components take actions to harvest plants or facilitate harvesting plants. The combine includes any number of sensors to measure the state of the combine as the combine harvests plants. The combine includes a control system to generate actions for the components to harvest plants in the field. The control system includes an agent executing a model that functions to improve the performance of the combine harvesting plants. Performance improvement can be measured by the sensors of the combine. The model is an artificial neural network that receives measurements as inputs and generates actions that improve performance as outputs. The artificial neural network is trained using actor-critic reinforcement learning techniques.L'invention concerne une moissonneuse-batteuse qui comprend un nombre quelconque de composants pour récolter des plantes lorsque la moissonneuse-batteuse se déplace à travers un champ cultivé. Les composants interviennent pour récolter des plantes ou faciliter la récolte de plantes. La moissonneuse-batteuse comprend un nombre quelconque de capteurs destinés à mesurer l'état de la moissonneuse-batteuse pendant que la moissonneuse-batteuse récole des plantes. La moissonneuse-batteuse comprend un système de commande pour produire des actions afin que les composants récoltent des plantes dans le champ. Le système de commande comprend un agent exécutant un modèle qui fonctionne pour améliorer les performances de la moissonneuse-batteuse récoltant des plantes. L'amélioration des performances peut être mesurée par les capteurs de la moissonneuse-batteuse. Le modèle est un réseau neuronal artificiel qui reçoit des mesures en tant qu'entrées et produit des actions qui améliorent les performances en tant que sorties. Le réseau neuronal artificiel est entraîné à l'aide de techniques d'apprentissage par renforcement acteur-critique.