Alibaba Cloud Rilis AI Video dengan Input Teks, Gambar, Audio

Alibaba Cloud luncurkan Wan2.7-Video, model AI generasi video multimodal dengan kontrol kreatif presisi, edit via instruksi, dan roadmap Wan 3.0.

AI - Aaf Afiatna

April 4, 2026April 4, 2026

Tongyi Lab, unit riset Alibaba Cloud, resmi meluncurkan Wan2.7-Video pada 3 April. Model generasi video ini menerima input multimodal: teks, gambar, video, dan audio. Peluncuran ini memperluas portofolio alat kreatif AI Alibaba.

Fitur sinkronisasi bibir juga memungkinkan penyesuaian audio di tahap pasca-produksi. Ini mengurangi kebutuhan pengambilan ulang. Menghemat waktu produksi.

Adopsi Cepat dan Evolusi Model Wan

Ekosistem Wan menunjukkan pertumbuhan yang agresif. Sejak peluncuran Wan2.1 sebagai open-source pada Februari 2025, model ini telah diunduh lebih dari 2,2 juta kali melalui Hugging Face dan ModelScope.

Setelah versi awal, Alibaba merilis iterasi lanjutan: 2.2, 2.5, dan 2.6. Masing-masing membawa peningkatan spesifik.

Versi 2.2 memperkenalkan penceritaan multi-shot. Versi 2.5 menambahkan sinkronisasi audio-visual native. Sementara 2.6 meningkatkan kualitas output hingga resolusi 1080p dengan durasi maksimum 15 detik.

Persaingan Ketat dalam Generasi Video AI

Baik dari komunitas open-source maupun platform proprietary, pengembangan berfokus pada tiga hal utama: kualitas visual, durasi video, dan tingkat kontrol pengguna.

Wan2.7-Video masuk ke arena ini dengan diferensiasi pada fleksibilitas input dan kontrol granular. Strateginya jelas.

Peta Jalan Pengembangan Selanjutnya

Alibaba telah mengisyaratkan tahap berikutnya dalam pengembangan model Wan. Versi Wan2.8 dijadwalkan hadir pada kuartal kedua 2026.

Setelah itu, perusahaan menargetkan peluncuran awal arsitektur terpadu video-gambar dalam kerangka Wan 3.0 pada akhir tahun yang sama. Ini akan menjadi langkah menuju sistem generatif yang lebih terintegrasi.

Sebelumnya Berikutnya

Aaf Afiatna

Aaf Afiatna (Aura OS) adalah seorang WordPress Developer, Administrator IT, dan penggerak di balik infrastruktur berbagai portal media digital PT Arina Duta Sehati. Ia memiliki ketertarikan mendalam pada rekayasa sistem tingkat rendah, implementasi AI on-device, dan pengembangan proyek open-source seperti Neural Standby Kernel (NSK). Saat tidak sedang berurusan dengan server atau kode, ia aktif mengeksplorasi ekosistem Web3 dan berbagi wawasan melalui channel YouTube CryptoFansWorld.