1 22 135

Dario Clavijo

daedalus2027

daedalus

AI & ML interests

None yet

Recent Activity

upvoted a paper about 7 hours ago

Titans: Learning to Memorize at Test Time

liked a model 5 days ago

Qwen/Qwen3-VL-2B-Instruct-FP8

liked a model 5 days ago

Qwen/Qwen3-VL-235B-A22B-Thinking

View all activity

Organizations

None yet

upvoted a paper about 7 hours ago

Titans: Learning to Memorize at Test Time

Paper • 2501.00663 • Published Dec 31, 2024 • 29

upvoted a collection 5 days ago

Qwen3-VL

Collection

37 items • Updated Nov 1 • 492

upvoted a paper 16 days ago

TiDAR: Think in Diffusion, Talk in Autoregression

Paper • 2511.08923 • Published 27 days ago • 111

upvoted an article 2 months ago

Article

StackLLaMA: A hands-on guide to train LLaMA with RLHF

Apr 5, 2023

•

upvoted a paper 2 months ago

OpenRLHF: An Easy-to-use, Scalable and High-performance RLHF Framework

Paper • 2405.11143 • Published May 20, 2024 • 41

upvoted an article 2 months ago

Article

StarCoder: A State-of-the-Art LLM for Code

May 4, 2023

•

upvoted a collection 3 months ago

Qwen3-Omni

Collection

6 items • Updated Oct 9 • 168

upvoted 4 papers 4 months ago

upvoted an article 5 months ago

Article

SmolLM3: smol, multilingual, long-context reasoner

Jul 8

•

735

upvoted a paper 5 months ago

Mercury: Ultra-Fast Language Models Based on Diffusion

Paper • 2506.17298 • Published Jun 17 • 6

upvoted a paper 6 months ago

3D Gaussian Splatting for Real-Time Radiance Field Rendering

Paper • 2308.04079 • Published Aug 8, 2023 • 192

upvoted an article 7 months ago

Article

Bamba-9B-v2 - Fast and powerful!

Apr 29

•

upvoted a paper 8 months ago

LLMZip: Lossless Text Compression using Large Language Models

Paper • 2306.04050 • Published Jun 6, 2023 • 5

upvoted an article 8 months ago

Article

Introducing SynthID Text

Oct 23, 2024

•

upvoted a paper 8 months ago

Qwen2.5-Omni Technical Report

Paper • 2503.20215 • Published Mar 26 • 166

upvoted a collection 9 months ago

Qwen2.5-VL

Collection

Vision-language model series based on Qwen2.5 • 11 items • Updated Jul 21 • 549

upvoted a paper about 2 years ago

Break-A-Scene: Extracting Multiple Concepts from a Single Image

Paper • 2305.16311 • Published May 25, 2023 • 7

Dario Clavijo

AI & ML interests

Recent Activity

Organizations

daedalus2027's activity

StackLLaMA: A hands-on guide to train LLaMA with RLHF

StarCoder: A State-of-the-Art LLM for Code

SmolLM3: smol, multilingual, long-context reasoner

Bamba-9B-v2 - Fast and powerful!

Introducing SynthID Text