Arsip  

Alibaba Cloud Rilis AI Video dengan Input Teks, Gambar, Audio

Alibaba Cloud luncurkan Wan2.7-Video, model AI generasi video multimodal dengan kontrol kreatif presisi, edit via instruksi, dan roadmap Wan 3.0.

Tongyi Lab, unit riset Alibaba Cloud, resmi meluncurkan Wan2.7-Video pada 3 April. Model generasi video ini menerima input multimodal: teks, gambar, video, dan audio. Peluncuran ini memperluas portofolio alat kreatif AI Alibaba.
Tongyi Lab, unit riset Alibaba Cloud, resmi meluncurkan Wan2.7-Video pada 3 April. Model generasi video ini menerima input multimodal: teks, gambar, video, dan audio. Peluncuran ini memperluas portofolio alat kreatif AI Alibaba.

Fitur sinkronisasi bibir juga memungkinkan penyesuaian audio di tahap pasca-produksi. Ini mengurangi kebutuhan pengambilan ulang. Menghemat waktu produksi.

Adopsi Cepat dan Evolusi Model Wan

Ekosistem Wan menunjukkan pertumbuhan yang agresif. Sejak peluncuran Wan2.1 sebagai open-source pada Februari 2025, model ini telah diunduh lebih dari 2,2 juta kali melalui Hugging Face dan ModelScope.

Setelah versi awal, Alibaba merilis iterasi lanjutan: 2.2, 2.5, dan 2.6. Masing-masing membawa peningkatan spesifik.

Versi 2.2 memperkenalkan penceritaan multi-shot. Versi 2.5 menambahkan sinkronisasi audio-visual native. Sementara 2.6 meningkatkan kualitas output hingga resolusi 1080p dengan durasi maksimum 15 detik.

Persaingan Ketat dalam Generasi Video AI

Baik dari komunitas open-source maupun platform proprietary, pengembangan berfokus pada tiga hal utama: kualitas visual, durasi video, dan tingkat kontrol pengguna.

Baca Juga  Home Companion: Evolusi Samsung Bespoke AI 2026 Menuju Rumah Pintar yang Lebih Cerdas

Wan2.7-Video masuk ke arena ini dengan diferensiasi pada fleksibilitas input dan kontrol granular. Strateginya jelas.

Peta Jalan Pengembangan Selanjutnya

Alibaba telah mengisyaratkan tahap berikutnya dalam pengembangan model Wan. Versi Wan2.8 dijadwalkan hadir pada kuartal kedua 2026.

Setelah itu, perusahaan menargetkan peluncuran awal arsitektur terpadu video-gambar dalam kerangka Wan 3.0 pada akhir tahun yang sama. Ini akan menjadi langkah menuju sistem generatif yang lebih terintegrasi.

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *