Daily Papers - a kaitou951 Collection

kaitou951 's Collections

A Survey on LLM-as-a-Judge

Daily Papers

updated Jul 31

Robust Multimodal Large Language Models Against Modality Conflict

Paper • 2507.07151 • Published Jul 9 • 5
One Token to Fool LLM-as-a-Judge

Paper • 2507.08794 • Published Jul 11 • 31
Test-Time Scaling with Reflective Generative Model

Paper • 2507.01951 • Published Jul 2 • 106
KV Cache Steering for Inducing Reasoning in Small Language Models

Paper • 2507.08799 • Published Jul 11 • 40
Does Math Reasoning Improve General LLM Capabilities? Understanding Transferability of LLM Reasoning

Paper • 2507.00432 • Published Jul 1 • 79
REASONING GYM: Reasoning Environments for Reinforcement Learning with Verifiable Rewards

Paper • 2505.24760 • Published May 30 • 73
From Virtual Games to Real-World Play

Paper • 2506.18901 • Published Jun 23 • 10
UniWorld: High-Resolution Semantic Encoders for Unified Visual Understanding and Generation

Paper • 2506.03147 • Published Jun 3 • 58
VisionThink: Smart and Efficient Vision Language Model via Reinforcement Learning

Paper • 2507.13348 • Published Jul 17 • 75
VisionReasoner: Unified Visual Perception and Reasoning via Reinforcement Learning

Paper • 2505.12081 • Published May 17 • 18
Seg-Zero: Reasoning-Chain Guided Segmentation via Cognitive Reinforcement

Paper • 2503.06520 • Published Mar 9 • 11
VisionZip: Longer is Better but Not Necessary in Vision Language Models

Paper • 2412.04467 • Published Dec 5, 2024 • 118
SegDT: A Diffusion Transformer-Based Segmentation Model for Medical Imaging

Paper • 2507.15595 • Published Jul 21 • 4
Deep Researcher with Test-Time Diffusion

Paper • 2507.16075 • Published Jul 21 • 64