WildEval

non-profit

wild_eval

WildEval

Activity Feed Request to join this org

AI & ML interests

None defined yet.

Recent Activity

ChengsongHuang authored a paper 8 days ago

Guided Self-Evolving LLMs with Minimal Human Supervision

faezeb authored a paper about 1 month ago

DR Tulu: Reinforcement Learning with Evolving Rubrics for Deep Research

ChengsongHuang authored a paper about 1 month ago

VisPlay: Self-Evolving Vision-Language Models from Images

View all activity

WildEval 's datasets 9

WildEval/ZebraLogic

Viewer • Updated Feb 4 • 4.26k • 1.24k • 14

WildEval/G-PlanET

Viewer • Updated Aug 1, 2024 • 1.42k • 97 • 1

WildEval/ZeroEval

Viewer • Updated Jul 23, 2024 • 4.61k • 780

WildEval/WildBench-V2

Viewer • Updated May 22, 2024 • 2.05k • 65

WildEval/WildBench-Results-v2-internal

Viewer • Updated May 21, 2024 • 30k • 181

WildEval/WildBench-Results-V2

Viewer • Updated May 20, 2024 • 10.2k • 96

WildEval/WildBench-v2-dev

Viewer • Updated Apr 19, 2024 • 5.99k • 5

WildEval/WildBench-dev

Viewer • Updated Apr 19, 2024 • 14.1k • 5 • 1

WildEval/NaturalChats

Viewer • Updated Apr 18, 2024 • 641k • 8