Research-Papers - a atifsal Collection

atifsal 's Collections

ComfyUI-Models-Workflows

Text-to-Video_Models

Graph-Learning_Models

Image-to-Image_Models

Audio-Text-to-Text_Models

Video-Text_to_Text_Models

Text-Gen_Models

Image-to-Video_Models

Any-to-Any_Models

Embedding-Models

Prompt-Engineering

Research-Papers

Research-Papers

updated 12 days ago

MiniGPT4-Video: Advancing Multimodal LLMs for Video Understanding with Interleaved Visual-Textual Tokens

Paper • 2404.03413 • Published Apr 4, 2024 • 28
RepVideo: Rethinking Cross-Layer Representation for Video Generation

Paper • 2501.08994 • Published Jan 15 • 15
Hierarchical Cross-modal Prompt Learning for Vision-Language Models

Paper • 2507.14976 • Published Jul 20 • 2