Aduc-sdr-cinematic-video

Runtime error

App Files Files Community

Carlex22222 commited on Sep 11

Commit

44cbdba

verified ·

1 Parent(s): a1db91a

Update app.py

Browse files

Files changed (1) hide show

app.py +14 -16

app.py CHANGED Viewed

@@ -2,11 +2,11 @@
 #
 # Copyright (C) August 4, 2025  Carlos Rodrigues dos Santos
 #
-# Versão 7.0.0 (Llama Scout Integration)
 #
-# Esta versão substitui o especialista VQA pelo Llama-4-Scout, um MLLM
-# mais poderoso, e ajusta a UI para focar na análise de movimento de vídeo,
-# consolidando a interface final da aplicação.
 import gradio as gr
 import yaml
@@ -21,7 +21,7 @@ import json
 import aduc_framework
 from aduc_framework.types import PreProductionParams, ProductionParams
 # Importamos o novo e final especialista de visão
-from aduc_framework.managers.llama_scout_manager import llama_scout_manager_singleton
 # --- CONFIGURAÇÃO DE TEMA E LOGGING ---
 cinematic_theme = gr.themes.Base(
@@ -136,15 +136,15 @@ def run_audio_wrapper(source_video, audio_prompt, global_prompt, progress=gr.Pro
 def analyze_video_wrapper(source_video):
     if not source_video: raise gr.Error("Nenhum vídeo final foi gerado para ser analisado.")
-    yield "Analisando o movimento do vídeo com Llama Scout... (Isso pode levar um momento)"
-    analysis = llama_scout_manager_singleton.analyze_video_movement(video_path=source_video)
     yield analysis
 def answer_images_wrapper(image_paths, question):
-    if not image_paths: raise gr.Error("Nenhuma imagem de referência foi carregada para ser analisada.")
     if not question or not question.strip(): raise gr.Error("Por favor, digite uma pergunta.")
-    yield "Analisando as imagens de referência com Llama Scout..."
-    all_answers = [f"--- Imagem {i+1} ---\nResposta: {llama_scout_manager_singleton.answer_on_image(path, question)}\n" for i, path in enumerate(image_paths)]
     yield "\n".join(all_answers)
 def get_log_content():
@@ -194,18 +194,16 @@ with gr.Blocks(theme=cinematic_theme, css="style.css") as demo:
             audio_prompt_input = gr.Textbox(label="Prompt de Áudio Detalhado (Opcional)", lines=2, placeholder="Descreva os sons, efeitos e música.")
             run_audio_button = gr.Button("Gerar Áudio", variant="secondary")
-    with gr.Accordion("📸 Grupo das Keyframes", open=True):
-        keyframe_gallery = gr.Gallery(label="Keyframes Gerados", visible=True, object_fit="contain", height="auto", type="filepath")
-    final_video_output = gr.Video(label="Filme Final (Resultado da Última Etapa)", visible=True, interactive=False)
     with gr.Accordion("🧬 DNA Digital da Geração (JSON)", open=False):
         storyboard_output = gr.JSON(label="Roteiro Gerado (Storyboard)")
         generation_data_output = gr.JSON(label="Estado de Geração Completo")
-    with gr.Accordion("🔬 Etapa de Análise Multimodal (Llama Scout)", open=False):
         with gr.Blocks():
             gr.Markdown("### Analisar Movimento do Vídeo Final")
             gr.Markdown("Peça ao especialista para descrever a ação, movimento e narrativa que se desenrolam através dos frames do vídeo.")

 #
 # Copyright (C) August 4, 2025  Carlos Rodrigues dos Santos
 #
+# Versão 7.1.0 (Qwen2-VL Integration)
 #
+# Esta versão substitui o especialista de visão anterior pelo Qwen2-VL, um
+# MLLM de código aberto, e ajusta a UI e as chamadas de função para refletir
+# essa nova integração.
 import gradio as gr
 import yaml
 import aduc_framework
 from aduc_framework.types import PreProductionParams, ProductionParams
 # Importamos o novo e final especialista de visão
+from aduc_framework.managers.qwen_vl_manager import qwen_vl_manager_singleton
 # --- CONFIGURAÇÃO DE TEMA E LOGGING ---
 cinematic_theme = gr.themes.Base(
 def analyze_video_wrapper(source_video):
     if not source_video: raise gr.Error("Nenhum vídeo final foi gerado para ser analisado.")
+    yield "Analisando o movimento do vídeo com Qwen2-VL... (Isso pode levar um momento)"
+    analysis = qwen_vl_manager_singleton.analyze_video_movement(video_path=source_video)
     yield analysis
 def answer_images_wrapper(image_paths, question):
+    if not image_paths: raise gr.Error("Nenhuma imagem de referência foi carregada.")
     if not question or not question.strip(): raise gr.Error("Por favor, digite uma pergunta.")
+    yield "Analisando as imagens de referência com Qwen2-VL..."
+    all_answers = [f"--- Imagem {i+1} ---\nResposta: {qwen_vl_manager_singleton.answer_on_image(path, question)}\n" for i, path in enumerate(image_paths)]
     yield "\n".join(all_answers)
 def get_log_content():
             audio_prompt_input = gr.Textbox(label="Prompt de Áudio Detalhado (Opcional)", lines=2, placeholder="Descreva os sons, efeitos e música.")
             run_audio_button = gr.Button("Gerar Áudio", variant="secondary")
+    final_video_output = gr.Video(label="Filme Final (Resultado da Última Etapa)", visible=False, interactive=False)
+    with gr.Accordion("Grupo das Keyframes", open=False):
+        keyframe_gallery = gr.Gallery(label="Keyframes Gerados", visible=True, object_fit="contain", height="auto", type="filepath")
     with gr.Accordion("🧬 DNA Digital da Geração (JSON)", open=False):
         storyboard_output = gr.JSON(label="Roteiro Gerado (Storyboard)")
         generation_data_output = gr.JSON(label="Estado de Geração Completo")
+    with gr.Accordion("🔬 Etapa de Análise Multimodal (Qwen2-VL)", open=False):
         with gr.Blocks():
             gr.Markdown("### Analisar Movimento do Vídeo Final")
             gr.Markdown("Peça ao especialista para descrever a ação, movimento e narrativa que se desenrolam através dos frames do vídeo.")