overcookedExperiments

Multi-Agent PPO (MAPPO) in Overcooked-AI 🍳🤝

This repository contains my implementation of Multi-Agent Proximal Policy Optimization (MAPPO) with a Centralized Training and Decentralized Execution (CTDE) architecture, applied to the Overcooked-AI environment.

The goal is to study how MAPPO enables emergent collaboration between agents in cooperative cooking tasks, and how training on multiple layouts improves generalization compared to single-layout training.

🚀 Features

MAPPO implementation with shared policy and centralized critic
CTDE architecture to address non-stationarity and credit assignment
Support for multiple layouts (e.g., cramped_room, asymmetric_advantages, bottleneck, forced_coordination)
GIF rollout generation for qualitative behavior visualization
Evaluation pipeline with mean ± std reward reporting

...

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
__pycache__		__pycache__
gifs		gifs
logs		logs
saved_models		saved_models
src		src
.gitattributes		.gitattributes
OvercookedExperiments.pptx		OvercookedExperiments.pptx
README.md		README.md
report.pdf		report.pdf

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

overcookedExperiments

Multi-Agent PPO (MAPPO) in Overcooked-AI 🍳🤝

🚀 Features

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

overcookedExperiments

Multi-Agent PPO (MAPPO) in Overcooked-AI 🍳🤝

🚀 Features

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages