new

Get trending papers in your email inbox once a day!

Get trending papers in your email inbox!

Daily Papers

byAK and the research community

Jul 10

Submitted by

jt-zhang

Vidu S1: A Real-Time Interactive Video Generation Model

Tsinghua University

Submitted by

geuntaek

Video-Oasis: Rethinking Evaluation of Video Understanding

naver

Submitted by

ahnGeo

Why Can't I Open My Drawer? Mitigating Object-Driven Shortcuts in Zero-Shot Compositional Action Recognition

naver

Submitted by

taesiri

Ideas Have Genomes: Benchmarking Scientific Lineage Reasoning and Lineage-Grounded Idea Generation

SJTU

Shanghai Jiao Tong University

Submitted by

yulunliu

LongE2V: Long-Horizon Event-based Video Reconstruction, Prediction, and Frame Interpolation with Video Diffusion Models

NYCU

National Yang Ming Chiao Tung University

Submitted by

Azily

UniClawBench: A Universal Benchmark for Proactive Agents on Real-World Tasks

hkuhk

The University of Hong Kong

Submitted by

fenghora

Enhancing In-context Panoramic Generation via Geometric-aware Pretraining

Submitted by

alimotahharynia

DrugGen 2: A disease-aware language model for enhancing drug discovery

·
7 authors

Submitted by

taesiri

Jet-Long: Efficient Long-Context Extension with Dynamic Bifocal RoPE

nvidia

Submitted by

taesiri

OpenCoF: Learning to Reason Through Video Generation

ByteDance-Seed

Submitted by

ElysiaTrue

CineMobile: On-Device Image-to-Video Diffusion for Cinematic Camera Motion Generation

SJTU-DENG-Lab

DENG Lab @ SJTU

Submitted by

Cerru02

Linear Attention Architectures: Mechanisms, Trade-offs, and Cross-Layer Routing

ethz

Submitted by

yfwu

Remember When It Matters: Proactive Memory Agent for Long-Horizon Agents

metaresearch

Submitted by

a-F1

UP: Unbounded Positive Asymmetric Optimization for Breaking the Exploration-Stability Dilemma

ByteDance-Seed

Submitted by

taesiri

ARDY: Autoregressive Diffusion with Hybrid Representation for Interactive Human Motion Generation

nvidia

Submitted by

HenghuiDing

SAM-MT: Real-Time Interactive Multi-Target Video Segmentation

FudanCVL

Submitted by

diogo4u

A Sparse and Truncated State Vector Simulator for Peaked Circuits

IST-UL

Instituto Superior Técnico - Universidade de Lisboa

Submitted by

gong97

PhyMRI-SR: Toward Physics-Aware MRI Image Super-Resolution

ShanghaiTech

ShanghaiTech University

Submitted by

sayakpaul

Flash-BoN: Instant Drafts for Inference-Time Scaling in Diffusion Models

tomg-group-umd

Tom Goldstein's Lab at University of Maryland, College Park

Submitted by

matteospanio

A Quantized Native Runtime for On-Device Semantic Audio Generation

csc-unipd

Centro di Sonologia Computazionale

Submitted by

andleb

CausalDS: Benchmarking Causal Reasoning in Data-Science Agents

umich

University of Michigan

Submitted by

elozeiri

Can Dialects Be Steered Like Languages? Sparse Neurons and Distributed Directions in Arabic LLMs

MBZUAI

Mohamed Bin Zayed University of Artificial Intelligence

Submitted by

mr3haque

PAST-TIDE: Prototype-Anchored Statement Tuning with Topic-Invariant Normalization for Stance Detection

·
5 authors