TIẾN TRÌNH XỬ LÝ OMNI
HƯỚNG DẪN
Hệ thống sẽ tải video Shorts trực tiếp, gửi file nhị phân vào Gemini 2.5 Flash API để phân tích đa phương thức (hình ảnh, âm thanh, bối cảnh) rồi viết lại kịch bản theo yêu cầu.
Cơ chế dự phòng (Fallback): Nếu tải video bị lỗi (do giới hạn mạng, bản quyền), hệ thống sẽ tự động chuyển sang phân tích tiêu đề, mô tả và transcript của video để remix.
MULTIMODAL TESTING AREA
Khu vực thử nghiệm khả năng phân tích đa phương thức của Gemini 2.5 Flash. Bạn có thể:
- Tải lên Ảnh chụp hoặc sơ đồ thiết kế và hỏi đáp chi tiết.
- Tải lên file Âm thanh (mp3/wav) để bóc băng lời thoại hoặc tóm tắt.
- Tải lên file Video (mp4) ngắn để hỏi về diễn biến, cảnh quay.
- Tải lên tài liệu PDF để trích xuất cấu trúc dữ liệu hoặc dịch thuật.
B-ROLL PLANNER
Tạo nhanh bảng Storyboard hình ảnh chi tiết theo giây. Thích hợp cho khâu tiền kỳ và dựng phim:
- Lời đọc Voiceover tối ưu độ cuốn hút cho Shorts.
- Mô tả cảnh quay B-roll khớp từng câu thoại.
- Từ khóa tiếng Anh để tải video miễn phí trên Pexels/Pixabay nhanh chóng.
- Gợi ý SFX/Nhạc nền để đẩy cảm xúc người xem.