KaiP-598

Follow

Kai Wu KaiP-598

Follow

3 followers · 2 following

Achievements

Achievements

Pinned Loading

grpo-from-scratch grpo-from-scratch Public

GRPO (Group Relative Policy Optimization) implemented from scratch in PyTorch. 10 ablation experiments.

Python
filing-sense filing-sense Public

AI analyst for SEC 10-K filings. RAG + LangGraph agent + GRPO fine-tuning on FinQA. 11.5% → 20.5% accuracy progression.

Python