new

Get trending papers in your email inbox once a day!

Get trending papers in your email inbox!

Daily Papers

byAK and the research community

Jul 10

Submitted by

jt-zhang

Vidu S1: A Real-Time Interactive Video Generation Model

Tsinghua University

Submitted by

geuntaek

Video-Oasis: Rethinking Evaluation of Video Understanding

naver

Submitted by

ahnGeo

Why Can't I Open My Drawer? Mitigating Object-Driven Shortcuts in Zero-Shot Compositional Action Recognition

naver

Submitted by

Azily

UniClawBench: A Universal Benchmark for Proactive Agents on Real-World Tasks

hkuhk

The University of Hong Kong

Submitted by

taesiri

Ideas Have Genomes: Benchmarking Scientific Lineage Reasoning and Lineage-Grounded Idea Generation

SJTU

Shanghai Jiao Tong University

Submitted by

yulunliu

LongE2V: Long-Horizon Event-based Video Reconstruction, Prediction, and Frame Interpolation with Video Diffusion Models

NYCU

National Yang Ming Chiao Tung University

Submitted by

fenghora

Enhancing In-context Panoramic Generation via Geometric-aware Pretraining

Submitted by

alimotahharynia

DrugGen 2: A disease-aware language model for enhancing drug discovery

·
7 authors

Submitted by

taesiri

OpenCoF: Learning to Reason Through Video Generation

ByteDance-Seed

Submitted by

taesiri

Jet-Long: Efficient Long-Context Extension with Dynamic Bifocal RoPE

nvidia

Submitted by

ElysiaTrue

CineMobile: On-Device Image-to-Video Diffusion for Cinematic Camera Motion Generation

SJTU-DENG-Lab

DENG Lab @ SJTU

Submitted by

Cerru02

Linear Attention Architectures: Mechanisms, Trade-offs, and Cross-Layer Routing

ethz

Submitted by

yfwu

Remember When It Matters: Proactive Memory Agent for Long-Horizon Agents

metaresearch

Submitted by

a-F1

UP: Unbounded Positive Asymmetric Optimization for Breaking the Exploration-Stability Dilemma

ByteDance-Seed

Submitted by

gong97

PhyMRI-SR: Toward Physics-Aware MRI Image Super-Resolution

ShanghaiTech

ShanghaiTech University

Submitted by

sayakpaul

Flash-BoN: Instant Drafts for Inference-Time Scaling in Diffusion Models

tomg-group-umd

Tom Goldstein's Lab at University of Maryland, College Park

Submitted by

HenghuiDing

SAM-MT: Real-Time Interactive Multi-Target Video Segmentation

FudanCVL

Submitted by

matteospanio

A Quantized Native Runtime for On-Device Semantic Audio Generation

csc-unipd

Centro di Sonologia Computazionale

Submitted by

andleb

CausalDS: Benchmarking Causal Reasoning in Data-Science Agents

umich

University of Michigan

Submitted by

taesiri

ARDY: Autoregressive Diffusion with Hybrid Representation for Interactive Human Motion Generation

nvidia

Submitted by

diogo4u

A Sparse and Truncated State Vector Simulator for Peaked Circuits

IST-UL

Instituto Superior Técnico - Universidade de Lisboa

Submitted by

mr3haque

PAST-TIDE: Prototype-Anchored Statement Tuning with Topic-Invariant Normalization for Stance Detection

·
5 authors

Submitted by

elozeiri

Can Dialects Be Steered Like Languages? Sparse Neurons and Distributed Directions in Arabic LLMs

MBZUAI

Mohamed Bin Zayed University of Artificial Intelligence