Veo 3.1 adalah model AI video generation terbaru dari Google yang bisa membuat klip 8 detik beresolusi hingga 4K lengkap dengan audio otomatis. Anda bisa membuat video UGC langsung di Google AI Studio dengan menulis prompt deskriptif, mengatur rasio 9:16 untuk format vertikal, lalu generate dan download hasilnya hanya dalam beberapa menit.

Video UGC (User Generated Content) sekarang jadi format favorit di TikTok, Instagram Reels, dan YouTube Shorts karena terasa autentik dan dekat dengan penonton. Sayangnya, bikin video UGC secara manual butuh talent, lokasi syuting, dan waktu edit yang tidak sedikit.

Veo 3.1 hadir sebagai solusi karena bisa menghasilkan video dengan dialog, suara latar, dan gerakan kamera sinematik hanya dari teks atau gambar, lengkap dengan audio yang dibuat secara native.

Artikel ini membahas cara pakai Veo 3.1 di Google AI Studio langkah demi langkah, mulai dari setup awal sampai mengatur parameter video agar hasilnya maksimal untuk konten UGC. Olakses secara rutin mengulas tutorial tools AI seperti ini agar pengelola brand dan tim marketing lebih mudah beradaptasi dengan teknologi terbaru.

Table of Contents show

Apa Itu Veo 3.1 dan Kenapa Cocok untuk Bikin Video UGC?

Veo 3.1 adalah model AI generatif video paling canggih dari Google saat ini, mampu membuat klip berdurasi 8 detik dengan resolusi 720p, 1080p, atau 4K, plus audio yang dihasilkan secara native. Model ini cocok untuk video UGC karena hasilnya terasa sinematik, tapi tetap natural seperti video buatan kreator asli.

Spesifikasi Utama yang Perlu Anda Tahu

Veo 3.1 dan Veo 3.1 Fast mendukung output 24 fps dengan durasi 4, 6, atau 8 detik, dan fitur audio selalu aktif di setiap video yang dihasilkan menurut dokumentasi resmi Gemini API. Khusus resolusi 1080p dan 4K, durasi video wajib 8 detik.

Empat Kemampuan Baru di Veo 3.1

Dibanding versi sebelumnya, Veo 3.1 menambahkan empat kemampuan baru sekaligus: video potret rasio 9:16, ekstensi durasi video, pembuatan dari frame pertama dan terakhir, serta arahan dari hingga tiga gambar referensi. Kombinasi ini membuat Veo 3.1 jauh lebih fleksibel untuk kebutuhan konten media sosial dibanding Veo 3 biasa.

Insight dari Olakses: Empat fitur baru ini, yaitu video potret, ekstensi video, frame pertama-terakhir, dan gambar referensi, adalah pembeda utama Veo 3.1 dari Veo 3 standar.

Yang Harus Disiapkan Sebelum Mulai di Google AI Studio

Sebelum membuat video UGC dengan Veo 3.1, Anda perlu akses ke Google AI Studio dan API key Gemini yang aktif. Selain itu, siapkan ide konsep video secara singkat agar prompt yang Anda tulis nanti lebih terarah.

Akses dan API Key Gemini

Anda bisa mendapatkan API key gratis melalui halaman API key Google AI Studio. API key ini dibutuhkan baik untuk akses lewat antarmuka AI Studio maupun lewat kode menggunakan Gemini API.

Menyusun Ide dan Skrip Singkat untuk UGC

Tulis dulu skenario singkat, misalnya testimoni produk, demo penggunaan, atau cerita keseharian yang relevan dengan brand Anda. Skrip ini menjadi dasar prompt sehingga hasil video lebih konsisten dengan tujuan konten Anda.

Baca juga: Cara Pakai Gemini Pro Gratis

Cara Menulis Prompt Veo 3.1 agar Video UGC Terasa Natural

Prompt yang baik untuk Veo 3.1 menggabungkan lima elemen sekaligus, yaitu cinematography, subject, action, context, dan style and ambiance, seperti yang direkomendasikan dalam panduan prompting Veo 3.1 dari Google Cloud. Formula ini membantu Veo 3.1 memahami suasana video yang Anda inginkan secara detail.

Formula 5 Elemen dari Google Cloud

Cinematography menentukan gaya pengambilan gambar seperti close-up atau tracking shot, subject adalah karakter utama, action adalah aktivitas yang dilakukan, context adalah latar tempat dan waktu, sedangkan style and ambiance mengatur mood serta pencahayaan. Contoh penerapannya: medium shot, seorang content creator wanita sedang unboxing produk skincare, di kamar tidur minimalis dengan cahaya pagi, gaya video natural dan hangat.

Trik Menambahkan Dialog dan Suara Ambient

Veo 3.1 bisa menghasilkan dialog jika Anda menulis kalimat dalam tanda kutip, efek suara dengan deskripsi yang jelas, dan suara latar lewat penjelasan suasana ruangan, sesuai panduan perintah Veo di Gemini API. Detail audio seperti ini penting untuk video UGC karena membuat hasilnya terasa seperti rekaman asli, bukan video AI generik.

Insight dari Olakses: Prompt yang menyertakan dialog dalam tanda kutip membuat Veo 3.1 menghasilkan suara sekaligus gerakan bibir yang sinkron pada karakter di video.

Teknik Prompting	Fungsi	Sumber
Formula 5 Elemen	Cinematography, Subject, Action, Context, Style and Ambiance dalam satu prompt	Google Cloud Blog, 2025
First and Last Frame	Transisi otomatis antara gambar awal dan gambar akhir video	Gemini API Docs
Ingredients to Video	Gambar referensi untuk menjaga konsistensi karakter atau produk plus audio	Google Cloud Blog, 2025
Timestamp Prompting	Mengatur beberapa shot dengan rentang waktu dalam satu kali generate	Google Cloud Blog, 2025
Negative Prompt	Mendeskripsikan secara positif elemen yang ingin dihindari dari scene	Google Cloud Blog, 2025

Langkah-Langkah Membuat Video UGC dengan Veo 3.1 di Google AI Studio

Berikut langkah praktis membuat video UGC dengan Veo 3.1 melalui Google AI Studio atau Gemini API, berdasarkan dokumentasi resmi Google AI for Developers:

Buka Google AI Studio, lalu pilih model Veo 3.1 (veo-3.1-generate-preview).
Tulis prompt sesuai formula 5 elemen di atas, lengkap dengan dialog atau suara jika diperlukan.
Atur parameter aspectRatio, resolution, dan durationSeconds sesuai kebutuhan platform target Anda.
Klik generate. Proses ini bersifat asinkron sehingga sistem akan membuat operation atau job berjalan panjang.
Tunggu sampai status done berubah menjadi true, biasanya butuh waktu 11 detik hingga beberapa menit saat jam sibuk.
Download video dalam format mp4 sebelum masa retensi 2 hari di server berakhir.

Generate Video dari Teks ke Video

Untuk video UGC dari nol, gunakan mode teks ke video dengan menulis prompt deskriptif langsung tanpa gambar pendukung. Mode ini paling cocok untuk konten yang sepenuhnya dibuat AI, misalnya iklan pendek atau cerita singkat untuk feed media sosial.

Generate Video dari Gambar untuk Konsistensi Karakter

Jika Anda ingin karakter atau produk tertentu konsisten, buat gambar awal dengan Gemini 3.1 Flash Image atau Nano Banana 2, lalu gunakan gambar itu sebagai frame awal di Veo 3.1 sesuai contoh pada dokumentasi pembuatan video dari gambar. Cara ini sering dipakai untuk video UGC yang menampilkan produk fisik secara detail.

Mengatur Rasio Aspek, Resolusi, dan Durasi untuk Konten UGC

Rasio aspek, resolusi, dan durasi video Veo 3.1 saling berkaitan dan mempengaruhi hasil akhir video UGC Anda. Pengaturan yang tepat akan membuat video lebih sesuai dengan platform target tanpa perlu edit ulang.

Pilih Rasio 9:16 untuk Format Vertikal

Untuk TikTok, Instagram Reels, atau YouTube Shorts, pilih aspectRatio 9:16, karena Veo 3.1 mendukung format potret selain rasio default 16:9. Format vertikal ini termasuk salah satu kemampuan baru yang hanya ada di Veo 3.1, bukan di Veo 3 biasa.

Trade-off Resolusi dan Durasi

Resolusi 720p adalah setelan default dan paling cepat diproses, sementara 1080p dan 4K hanya tersedia untuk durasi 8 detik dengan latensi lebih tinggi. Semakin tinggi resolusi, semakin mahal pula biaya generate-nya, jadi sesuaikan dengan kebutuhan platform Anda.

Insight dari Olakses: Pilih durasi 8 detik jika Anda ingin resolusi 1080p atau 4K, karena dua resolusi ini hanya didukung pada durasi tersebut.

Parameter	Detail Veo 3.1	Sumber
Resolusi	720p (default), 1080p, 4K untuk durasi 8 detik	Gemini API Docs
Rasio Aspek	16:9 (default) dan 9:16	Gemini API Docs
Durasi Klip	4, 6, atau 8 detik	Gemini API Docs
Frame Rate	24 fps	Gemini API Docs
Audio Native	Selalu aktif pada setiap video yang dihasilkan	Gemini API Docs
Gambar Referensi	Hingga 3 gambar untuk konsistensi subjek	Gemini API Docs
Retensi Video	Disimpan 2 hari di server sejak dibuat	Gemini API Docs

Fitur Lanjutan dan Hal yang Perlu Diperhatikan

Selain fitur dasar, Veo 3.1 punya beberapa fitur lanjutan yang berguna untuk produksi video UGC dalam skala lebih besar. Memahami batasannya juga penting agar proses produksi Anda tidak terhambat di tengah jalan.

Reference Images dan Extend Video

Anda bisa memasukkan hingga tiga gambar referensi orang, karakter, atau produk agar tampilannya konsisten di video output, sesuai panduan gambar referensi Veo 3.1. Selain itu, video yang sudah dibuat Veo 3.1 bisa diperpanjang hingga 7 detik per proses, sampai 20 kali, dengan video asli maksimal berdurasi 141 detik.

Watermark SynthID dan Masa Simpan Video

Setiap video hasil Veo 3.1 otomatis diberi watermark SynthID untuk menandai konten buatan AI. Video disimpan di server selama 2 hari, jadi pastikan Anda mengunduhnya sebelum masa retensi berakhir agar tidak perlu generate ulang.

Aspek	Detail	Sumber
Latensi Generate	Minimal 11 detik, maksimal 6 menit saat jam sibuk	Gemini API Docs
Ekstensi Video	Tambahan maksimal 7 detik per proses, hingga 20 kali, video asli maksimal 141 detik	Gemini API Docs
Watermark	SynthID otomatis pada semua video hasil Veo	Google DeepMind, SynthID
Person Generation (UE, UK, Swiss, MENA)	Hanya allow_adult untuk Veo 3 dan Veo 3.1	Gemini API Docs
Error Audio atau Filter Keamanan	Tidak dikenakan biaya jika video diblokir saat proses generate	Gemini API Docs

Veo 3.1 di Google AI Studio memberi Anda kontrol penuh atas gaya, suara, dan format video UGC hanya dari teks atau gambar. Dengan memahami formula prompt dan parameter teknis di atas, Anda bisa memproduksi konten video berkualitas sinematik tanpa kamera dan talent.

Key Takeaway: Veo 3.1 adalah Langkah Awal Produksi Video UGC Berbasis AI

Veo 3.1 penting dipahami karena jadi salah satu tools AI video paling lengkap untuk kebutuhan konten UGC saat ini, mulai dari audio native sampai kontrol kamera sinematik. Pola yang muncul dari spesifikasi di atas menunjukkan bahwa kombinasi prompt 5 elemen plus pengaturan rasio 9:16 adalah cara paling efektif untuk hasil video media sosial. Pendekatan terbaiknya adalah mulai dari prompt sederhana, lalu tambahkan detail dialog dan suara secara bertahap. Jika Anda butuh bantuan menyusun strategi konten video berbasis AI untuk brand atau bisnis Anda, tim Olakses siap membantu lewat konsultasi gratis.

FAQ: Pertanyaan yang Sering Diajukan

Q1: Apa itu Veo 3.1?
A1: Veo 3.1 adalah model AI video generation dari Google yang menghasilkan klip 8 detik beresolusi hingga 4K dengan audio native. Model ini tersedia melalui Google AI Studio dan Gemini API.

Q2: Apakah Veo 3.1 di Google AI Studio gratis?
A2: Akses ke Veo 3.1 memerlukan API key Gemini, dan penggunaannya dikenakan biaya sesuai skema harga Gemini API. Anda tetap bisa membuat API key gratis terlebih dahulu untuk mulai mencoba fitur dasarnya.

Q3: Berapa lama durasi video yang bisa dibuat Veo 3.1?
A3: Veo 3.1 bisa membuat video berdurasi 4, 6, atau 8 detik, dengan catatan resolusi 1080p dan 4K hanya tersedia untuk durasi 8 detik.

Q4: Apakah Veo 3.1 bisa membuat video vertikal untuk Reels dan TikTok?
A4: Bisa. Veo 3.1 mendukung rasio aspek 9:16 untuk video potret, selain rasio default 16:9. Fitur video potret ini baru tersedia mulai Veo 3.1.

Q5: Apa fungsi watermark SynthID pada video Veo?
A5: SynthID adalah watermark digital dari Google yang ditanamkan otomatis pada setiap video hasil Veo untuk menandai konten buatan AI, dan keasliannya bisa diverifikasi lewat platform SynthID.

Q6: Berapa lama video hasil Veo 3.1 tersimpan di server Google?
A6: Video yang dihasilkan Veo 3.1 disimpan di server selama 2 hari sejak dibuat. Setelah itu video otomatis dihapus, jadi Anda perlu mengunduhnya lebih dulu.

Q7: Apa beda Veo 3.1 dengan Veo 3.1 Lite?
A7: Veo 3.1 mendukung resolusi hingga 4K, ekstensi video, dan tiga gambar referensi, sementara Veo 3.1 Lite hanya mendukung resolusi hingga 1080p tanpa fitur ekstensi video dan gambar referensi.

Q8: Bagaimana cara menambahkan dialog di video Veo 3.1?
A8: Tulis dialog dalam tanda kutip di dalam prompt Anda, misalnya saat seorang karakter mengucapkan sesuatu, dan Veo 3.1 akan menghasilkan suara sekaligus gerakan bibir yang sesuai.

Butuh Strategi Konten Video AI untuk Bisnis Anda?

Olakses membantu pengelola brand dan tim marketing merancang strategi konten video berbasis AI, mulai dari ide, prompt, sampai distribusi ke platform yang tepat. Konsultasikan kebutuhan Anda sekarang secara gratis.

Konsultasi Gratis Sekarang

Muhammad Dwiki Septianto

Muhammad Dwiki Septianto is an SEO Specialist at Olakses with a background in Informatics Engineering from UIN Bandung. Certified in Digital Marketing (BNSP), he specializes in on-page and technical SEO, content optimization, and cross-functional coordination between content and development teams.

Cara Menggunakan Veo 3.1 di Google AI Studio untuk Membuat Video UGC