4 12 1

Yi Yang (SII)

Yysrc

Yysrc

AI & ML interests

None yet

Recent Activity

authored a paper 5 days ago

Mantis: A Versatile Vision-Language-Action Model with Disentangled Visual Foresight

updated a model 5 days ago

Yysrc/LIBERO-Long

updated a model 5 days ago

Yysrc/LIBERO-Goal

View all activity

Organizations

upvoted a paper 3 months ago

VLA-Adapter: An Effective Paradigm for Tiny-Scale Vision-Language-Action Model

Paper • 2509.09372 • Published Sep 11 • 237

upvoted 3 papers 4 months ago

OpenVLA: An Open-Source Vision-Language-Action Model

Paper • 2406.09246 • Published Jun 13, 2024 • 41

VLABench: A Large-Scale Benchmark for Language-Conditioned Robotics Manipulation with Long-Horizon Reasoning Tasks

Paper • 2412.18194 • Published Dec 24, 2024 • 1

Diffusion LLMs Can Do Faster-Than-AR Inference via Discrete Diffusion Forcing

Paper • 2508.09192 • Published Aug 8 • 30

upvoted 2 papers 5 months ago

WorldVLA: Towards Autoregressive Action World Model

Paper • 2506.21539 • Published Jun 26 • 40

OneTwoVLA: A Unified Vision-Language-Action Model with Adaptive Reasoning

Paper • 2505.11917 • Published May 17 • 1

upvoted 2 articles 7 months ago

Article

PaliGemma – Google's Cutting-Edge Open Vision Language Model

May 14, 2024

•

277

Article

Parameter-Efficient Fine-Tuning using 🤗 PEFT

Feb 10, 2023

•

108

upvoted 2 papers 8 months ago

World Modeling Makes a Better Planner: Dual Preference Optimization for Embodied Task Planning

Paper • 2503.10480 • Published Mar 13 • 55

Improved Visual-Spatial Reasoning via R1-Zero-Like Training

Paper • 2504.00883 • Published Apr 1 • 66

upvoted 2 papers 9 months ago

Show-o Turbo: Towards Accelerated Unified Multimodal Understanding and Generation

Paper • 2502.05415 • Published Feb 8 • 22

SIFT: Grounding LLM Reasoning in Contexts via Stickers

Paper • 2502.14922 • Published Feb 19 • 32