GeekAlerts

جایی برای گیک‌ها

·

راهنمای پرامپت‌نویسی با مدل هوش‌مصنوعی Veo 3 گوگل

راهنمای پرامپت‌نویسی با مدل هوش‌مصنوعی Veo 3 گوگل

اگه تا حالا به این فکر کردی که چجوری میشه فقط با نوشتن چند خط متن، یه ویدیوی خفن و سینمایی ساخت، باید با گوگل Veo 3 آشنا بشی. این مدل هوش مصنوعی یکی از پیشرفته‌ترین ابزارهای تبدیل متن به ویدیو تو دنیاست که میتونه ویدیوهایی با کیفیت سینمایی، صدای هماهنگ، فیزیک واقع‌گرایانه و جلوه‌های ویژه در حد حرفه‌ای تولید کنه. Veo 3 یه جورایی یه جهش بزرگ تو این تکنولوژیه و به تولیدکننده‌های محتوا اجازه میده فقط با توصیف کردن چیزی که تو ذهنشون هست، ویدیوهای باکیفیت بسازن. یکی از ویژگی‌های مهمش اینه که ویدیو و صدا رو همزمان تولید میکنه و این باعث میشه همه چیز کاملا با هم هماهنگ باشه.

ویژگی‌های جدید و خفن Veo 3

این مدل یه سری قابلیت‌های جدید و بهبودیافته داره که کار رو خیلی حرفه‌ای‌تر میکنه. اینجا یه نگاهی بهشون میندازیم:

ویژگیوضعیتتوضیحات
موقعیت‌یابی حیاتی دوربینجدیدیه دستور نوشتاری انقلابی به اسم «(thats where the camera is)»
استادی در ویدیوی سلفیجدیدفرمول‌های تست شده برای رفتار طبیعی تو ویدیوهای سلفی
دسته‌بندی صداجدیدکتابخانه‌های صوتی حرفه‌ای و کنترل کیفیت صدا
کنترل کیفیت حرکتجدیدکلمات کلیدی دقیق برای حرکت‌های طبیعی، پرانرژی و زیبا
عیب‌یابی تخصصیجدیدراه‌حل‌های تست شده برای مشکلات رایج موقع ساخت ویدیو
راه‌حل ویدیوی عمودیجدیدیه راهکار حرفه‌ای برای ساخت ویدیو با فرمت ۹:۱۶
ترکیب‌بندی پیشرفتهجدیدافکت‌های لنز، پالت‌های رنگی و درجه‌بندی سینمایی رنگ
بهینه‌سازی روند کاریجدیدابزارهای حرفه‌ای برای افزایش کیفیت و تبدیل فرمت ویدیو
موتور تولید پرامپت متابهبودیافتهمعماری شناختی سطح بالا برای تولید پرامپت (دستور)

از کجا میشه به Veo 3 دسترسی داشت؟

این مدل از طریق پلتفرم‌های مختلفی در دسترسه که هر کدوم برای یه گروه از کاربرا طراحی شدن:

پلتفرمسطح دسترسیویژگی‌ها
Vertex AIسازمانی (Enterprise)دسترسی کامل به API، پردازش دسته‌ای، پیش‌نمایش عمومی
Google Vidsمصرف‌کننده (Consumer)رابط کاربری ساده، قالب‌های آماده
Gemini Appعمومی (General)تولید ویدیوی پایه، سازگار با موبایل

قابلیت‌های اصلی Veo 3 در یک نگاه

این هوش مصنوعی یه مجموعه کامل از ابزارها رو در اختیارت میذاره:

  • تولید سریع (Fast Generate): برای وقتی که میخوای سریع یه نمونه اولیه از ایده‌ت ببینی و تستش کنی. مدلش veo-3.0-fast-generate-preview هست.
  • تولید استاندارد (Standard Generate): برای وقتی که میخوای بالاترین کیفیت ممکن رو برای خروجی نهایی داشته باشی. مدلش veo-3.0-generate-preview هست.
  • تولید صدای اصلی: ویدیو و صدا رو تو یه مرحله و کاملا هماهنگ با هم تولید میکنه.
  • لب‌خوانی بی‌نقص (Lip-Sync): اگه تو ویدیوت دیالوگ داشته باشی، حرکت لب‌ها کاملا با صدای دیالوگ هماهنگ میشه.
  • صدای محیط: صداهای محیطی مثل موسیقی پس‌زمینه، افکت‌های صوتی و نویز محیط به طور خودکار با تصویر مچ میشن.
  • کیفیت صدای حرفه‌ای: کیفیت میکس و وضوح صدا در حد استانداردهای پخش حرفه‌ایه.
  • کیفیت تصویر بالا: به طور پیش‌فرض ویدیوها رو با کیفیت 720p میسازه ولی قابلیت تولید 1080p رو هم داره.
  • فیلم‌برداری حرفه‌ای: حرکت‌های پیشرفته دوربین، نورپردازی‌های خاص و عمق میدان سینمایی رو شبیه‌سازی میکنه.
  • جلوه‌های ویژه: سیستم‌های ذرات (مثل دود و آتش)، افکت‌های جوی و مواد واقع‌گرایانه رو میتونه بسازه.
  • سبک‌های هنری: از سبک‌های بصری مختلف و ژانرهای سینمایی متفاوت پشتیبانی میکنه.

فیزیک و درک صحنه در Veo 3

یکی از نقاط قوت این مدل، درک بالای اون از دنیای فیزیکی و روایت داستانیه.

  • مایعات واقع‌گرایانه: رفتار آب، مایعات و ذرات از قوانین طبیعی فیزیک پیروی میکنه.
  • سیستم‌های گرانش: افتادن، جهش و حفظ شتاب اجسام به درستی شبیه‌سازی میشه.
  • ویژگی‌های مواد: شبیه‌سازی دقیق پارچه، فلز، شیشه و مواد ارگانیک.
  • افکت‌های ذرات: دود، آتش، گرد و غبار و ذرات معلق در هوا خیلی طبیعی به نظر میان.
  • ثبات شخصیت: میتونی ظاهر یه شخصیت رو تو چند تا ویدیوی مختلف ثابت نگه داری.
  • صحنه‌های چندشخصیتی: تعاملات پیچیده بین چند تا شخصیت رو به خوبی مدیریت میکنه.
  • درک صحنه: توالی زمانی و تداوم داستانی رو توی ویدیوها حفظ میکنه.
  • ورودی چندوجهی: میتونه از متن، عکس یا حتی یه ویدیوی دیگه برای ساخت ویدیوی جدید استفاده کنه.

چجوری با Veo 3 دیالوگ و صدای حرفه‌ای بسازیم؟

یکی از ویژگی‌های انقلابی Veo 3 اینه که دیالوگ‌ها رو با حرکت لب کاملا هماهنگ میکنه. برای این کار باید از تکنیک‌های خاصی استفاده کنی.

انواع روش‌های نوشتن دیالوگ

  1. دیالوگ مستقیم:
    • مثال: «معلم جلوی تخته سفید ایستاده و میگه: امروز میخوایم فتوسنتز رو بررسی کنیم، فرآیندی که گیاهان برای تبدیل نور خورشید به انرژی ازش استفاده میکنن.»
  2. دیالوگ محاوره‌ای:
    • مثال: «زن میپرسه: واسه ناهار کجا همدیگه رو ببینیم؟ مرد جواب میده: اون رستوران ایتالیایی جدیده تو مرکز شهر چطوره؟»
  3. دیالوگ احساسی:
    • مثال: «مدیرعامل با تامل مکث میکنه، بعد با قاطعیت میگه: این مسیریه که شرکت ما باید طی کنه. صداش ترکیبی از اراده و کمی عدم اطمینان رو منتقل میکنه.»

ساخت لایه‌های صوتی (Soundscapes)

میتونی صداهای مختلفی رو برای محیط مشخص کنی تا فضاسازی کامل بشه.

  • محیط‌های طبیعی:
    • Audio: Gentle wind through trees, various bird songs, rustling leaves, distant water flowing, peaceful forest atmosphere.
    • یعنی: صدای باد ملایم بین درخت‌ها، آواز پرنده‌های مختلف، خش خش برگ‌ها، صدای آب از دور، فضای آرام جنگل.
  • محیط‌های حرفه‌ای:
    • Audio: Soft keyboard typing, air conditioning hum, muffled phone conversations, paper rustling, professional office ambiance.
    • یعنی: صدای تایپ کردن کیبورد، صدای کولر گازی، صدای ضعیف مکالمات تلفنی، خش خش کاغذ، فضای حرفه‌ای اداره.
  • محیط شهری:
    • Audio: Distant traffic hum, occasional car horns, footsteps on pavement, muffled conversations, city ambiance with subtle building echoes.
    • یعنی: صدای ترافیک از دور، صدای بوق ماشین‌ها، صدای پا روی پیاده‌رو، مکالمات ضعیف، فضای شهری با اکوی ضعیف ساختمان‌ها.

کنترل موسیقی

  • موسیقی بر اساس حال و هوا:
    • مثال: «موسیقی ارکسترال الهام‌بخش با سازهای زهی و بادی که به سمت یه نقطه اوج هیجان‌انگیز میره و حس امید و اراده رو منتقل میکنه.»
  • موسیقی بر اساس ژانر:
    • مثال: «پیانوی جاز ملایم با یه خط بیس ظریف که یه فضای پیچیده و صمیمی مثل یه سالن لوکس رو ایجاد میکنه.»
  • موسیقی پویا:
    • مثال: «موسیقی الکترونیک تنش‌زا که با ریتم مینیمال شروع میشه، بعد لایه‌های سینت و پرکاشن بهش اضافه میشه و همزمان با تصمیم‌گیری شخصیت به اوج میرسه.»

صداهای هماهنگ با اتفاقات

  • هماهنگ با اکشن:
    • مثال: «صدای جلز و ولز روغن تو ماهیتابه، صدای چاقو موقع خرد کردن سبزیجات، صدای آب در حال جوشیدن، صدای به هم خوردن ظرف‌ها، فضای آشپزی در آشپزخانه.»
  • صداهای حرکت و برخورد:
    • مثال: «صدای پا موقع دویدن روی شن، نفس نفس زدن سنگین، صدای محکم بسته شدن در، صدای استارت ماشین، صدای جیغ لاستیک‌ها.»
  • صداهای تکنولوژی:
    • مثال: «صدای روشن شدن دستگاه، صدای کلیک دکمه‌ها، صداهای رابط کاربری صفحه نمایش، صدای نوتیفیکیشن‌ها، فضای مدرن تکنولوژی.»

نکته حیاتی برای دیالوگ: چجوری از زیرنویس ناخواسته جلوگیری کنیم؟

این یکی از مهم‌ترین تکنیک‌هاست. Veo 3 گاهی اوقات دیالوگ‌ها رو به صورت زیرنویس روی ویدیو نشون میده. برای جلوگیری از این مشکل:

  • روش درست – فرمت دو نقطه (Colon Format):
    • The detective looks directly at camera and says: "Something's not right here."
    • باید بعد از says از دو نقطه (:) استفاده کنی. این کار از ایجاد زیرنویس جلوگیری میکنه.
  • روش غلط – فرمت گیومه (Quote Format):
    • The detective says: "Something's not right here."
    • از این فرمت که فقط از گیومه استفاده میکنه، دوری کن چون باعث ایجاد زیرنویس میشه.

عیب‌یابی مشکلات رایج در صدا و دیالوگ

  • مشکل: هوش مصنوعی اسم‌ها یا کلمات پیچیده رو اشتباه تلفظ میکنه.
    • راه حل: از املای آوایی (Phonetic) استفاده کن.
    • مثال اصلی: "Read on to get Fofur and Shridar's guidance"
    • مثال اصلاح شده: "Read on to get foh-fur's and Shreedar's guidance"
  • قانون طول مناسب دیالوگ (قانون ۸ ثانیه):
    • عالی: دیالوگ‌هایی که گفتنشون حدود ۸ ثانیه طول میکشه.
      • مثال: «سارا، یه مدیرعامل بااعتمادبه‌نفس، به دوربین نگاه میکنه و میگه: نتایج فصل سوم ما از همه انتظارات فراتر رفت و ما رو در موقعیت رشد بی‌سابقه‌ای قرار داد.»
    • خیلی طولانی (باعث تند صحبت کردن میشه): از پاراگراف‌های طولانی که گفتنشون بیشتر از ۱۵ ثانیه طول میکشه خودداری کن.
    • خیلی کوتاه (باعث سکوت یا کلمات بی‌معنی میشه): از کلمات تکی مثل «سلام» یا «بله» پرهیز کن.
  • مشخص کن کی صحبت میکنه:
    • وقتی دو نفر تو صحنه هستن، حتما مشخص کن کدوم دیالوگ مال کیه.
    • مثال: «زن با لباس قرمز میپرسه: کجا همدیگه رو ببینیم؟ مرد با پیراهن آبی جواب میده: اون رستوران ایتالیایی جدیده چطوره؟»
  • اجازه بده Veo 3 دیالوگ طبیعی بسازه:
    • میتونی به جای نوشتن دیالوگ کامل، فقط موقعیت رو توصیف کنی.
    • مثلا: «یه استندآپ کمدین داره جوک تعریف میکنه.» یا «دو نفر دارن در مورد فیلمی که تازه دیدن بحث میکنن.»

روش‌های قطعی برای حذف زیرنویس

  1. فرمت دو نقطه: همونطور که گفته شد، همیشه از فرمت Character says: "dialogue" استفاده کن.
  2. نفی صریح (Explicit Negation): به آخر دستورت عبارت (no subtitles) یا no subtitles, no text overlays رو اضافه کن.
  3. نفی چندباره (برای موارد سرسخت): اگه باز هم زیرنویس داشتی، اینو امتحان کن: "No subtitles. No subtitles! No on-screen text whatsoever."
  • مشکل: صدای خنده تماشاچی‌های استودیویی ناخواسته.
    • راه حل: همیشه صدای پس‌زمینه مورد انتظارت رو مشخص کن.
    • بد: Character tells a joke (ممکنه صدای خنده اضافه کنه).
    • خوب: Character tells a joke. Audio: quiet office ambiance, no audience sounds, professional atmosphere.
    • یعنی: «شخصیت جوک میگه. صدا: فضای آرام اداری، بدون صدای تماشاچی، جو حرفه‌ای.»

کنترل روایت، احساسات و فیزیک صحنه

برای اینکه ویدیو جون بگیره و طبیعی به نظر برسه، باید بتونی داستان، احساسات شخصیت‌ها و قوانین فیزیک رو کنترل کنی.

توالی زمانی و پیشرفت احساسی

میتونی به Veo 3 بگی که یه اتفاق یا حس چجوری در طول زمان تغییر کنه.

  • پیشرفت احساسی:
    • مثال: «شخصیت اولش گیج و نامطمئنه، بعد به تدریج بااعتمادبه‌نفس و مصمم میشه و در نهایت با یه لبخند رضایت‌بخش کارش رو تموم میکنه.»
  • توالی اکشن:
    • مثال: «اون اول جلوی در تردید میکنه، بعد یه نفس عمیق میکشه و در نهایت با قاطعیت در رو باز میکنه.»
  • توالی حرکت دوربین:
    • مثال: «صحنه با یه نمای باز معرف (establishing shot) شروع میشه، بعد در ثانیه سوم به آرامی به یه نمای متوسط (medium shot) تبدیل میشه و در نهایت با یه نمای نزدیک (close-up) روی چهره مصمم شخصیت تموم میشه.»

کنترل احساسات ظریف و حذف «چهره مدل»

یکی از مشکلات مدل‌های هوش مصنوعی اینه که چهره‌ها بی‌روح و شبیه مدل‌های پلاستیکی به نظر میان. برای جلوگیری از این مشکل:

  • نشانه‌های احساسی ظریف:
    • مثال: «چشماش یه کم تنگ میشه، یه خط کوچیک بین ابروهاش میفته و قبل از حرف زدن فقط یه لحظه مکث میکنه.»
  • دادن زندگی به شخصیت:
    • مثال: «اون نیم قدم به جلو میاد، چونه‌اش رو بالا میبره، چشماش متمرکزه و انگار آماده درگیریه.»
  • حذف چهره مدل (Model Face):
    • مثال: «چشماش متفکرانه ریز میشه، سرش رو کج میکنه انگار داره اطلاعات جدیدی رو پردازش میکنه، و یه لبخند کوچیک روی لب‌هاش شکل میگیره.»

شبیه‌سازی فیزیک واقع‌گرایانه

Veo 3 تو شبیه‌سازی رفتار آب و مایعات عالیه. از اصطلاحات فیزیکی دقیق استفاده کن.

  • جریان و پاشیدن آب:
    • مثال: «یه لیوان آب واژگون میشه و فیزیک واقع‌گرایانه جریان مایع رو کنترل میکنه. آب روی سطح میز پخش میشه و الگوهای پاشیدن و بازتاب‌های سطح طبیعی رو ایجاد میکنه.»
  • رفتار پیشرفته مایعات:
    • مثال: «قطره‌های بارون به شیشه میخورن، هر قطره با فیزیک واقع‌گرایانه با بقیه ترکیب میشه، روی سطح شیشه سر میخوره و ردهای آب طبیعی با کشش سطحی مناسب ایجاد میکنه.»
  • شبیه‌سازی پارچه:
    • مثال: «یه روسری ابریشمی تو هوا میفته، پارچه سبکش به طور طبیعی با مقاومت هوا شناور میشه و با چین و چروک‌های واقع‌گرایانه به نرمی فرود میاد.»
  • فیزیک اجسام سخت:
    • مثال: «دو تا توپ بیلیارد با انتقال تکانه دقیق به هم برخورد میکنن، ضربه صدای واقع‌گرایانه‌ای ایجاد میکنه و با زوایای مناسب بر اساس اصول فیزیک از هم جدا میشن.»
  • افکت‌های سیستم ذرات:
    • مثال: «دود از آتیش با پیچ و تاب‌های واقع‌گرایانه بلند میشه، ذرات به طور طبیعی با جریان باد پخش میشن و وقتی نور خورشید از بینشون رد میشه، افکت‌های نوری حجمی ایجاد میکنن.»

حفظ ثبات شخصیت در صحنه‌های مختلف

برای اینکه یه شخصیت تو صحنه‌های مختلف دقیقا همون شکلی بمونه، باید توصیفات خیلی دقیقی ازش ارائه بدی.

  • قالب جامع شخصیت:
    • [NAME], a [AGE] [ETHNICITY] [GENDER] with [SPECIFIC_HAIR_DETAILS], [EYE_COLOR] eyes, [DISTINCTIVE_FACIAL_FEATURES], wearing [DETAILED_CLOTHING_DESCRIPTION], with [POSTURE_AND_MANNERISMS]
  • مثال برای ثبات شخصیت:
    • صحنه ۱ – معرفی شخصیت:
      • «دکتر جنیفر والش، یه متخصص اطفال ۳۵ ساله با موهای کوتاه قهوه‌ای مدل باب، چشم‌های سبز مهربون و لبخندی گرم، یه روپوش سفید آزمایشگاهی روی لباس‌های اسکراب آبی پوشیده و یه گوشی پزشکی دور گردنشه. اون داره یه بیمار جوون رو تو یه اتاق معاینه روشن معاینه میکنه.»
    • صحنه ۲ – همون شخصیت، مکان متفاوت:
      • «دکتر جنیفر والش، همون متخصص اطفال ۳۵ ساله با موهای کوتاه قهوه‌ای مدل باب و چشم‌های سبز مهربون، حالا یه ژاکت سبز غیررسمی و شلوار جین تیره پوشیده و پشت میز کارش تو خونه نشسته و پرونده‌های بیمارها رو بررسی میکنه. اون همون حالت گرم و دلسوز همیشگیش رو حفظ کرده.»
  • استفاده از اکسسوری‌های خاص:
    • مثال: «کارآگاه همیشه کت چرم قدیمی‌اش، ساعت نقره‌ای روی مچ دست چپش رو میپوشه و یه دفترچه چرمی قهوه‌ای فرسوده همراهشه. این عناصر شاخص تو هر صحنه تکرار میشن.»

چارچوب ۸ مرحله‌ای برای ساخت ویدیوهای سینمایی

برای اینکه یه توصیف ساده رو به یه شاهکار سینمایی تبدیل کنی، باید از این چارچوب ۸ جزئی استفاده کنی. هر چی جزئیات بیشتری از این ۸ مورد رو تو دستورت بیاری، نتیجه حرفه‌ای‌تر میشه.

جزءهدفمثال
سوژه (Subject)تمرکز اصلی و جزئیات شخصیت«یه مدیرعامل ۳۵ ساله بااعتمادبه‌نفس با موهای کوتاه قهوه‌ای مایل به قرمز»
زمینه (Context)محل و محیط صحنه«تو یه اتاق هیئت مدیره مدرن با دیوارهای شیشه‌ای موقع غروب خورشید»
اکشن (Action)اتفاقی که در صحنه میفته«اون داره نتایج فصلی رو با حرکات پرانرژی دست ارائه میده»
سبک (Style)زیبایی‌شناسی بصری و ژانر«سبک سینمایی شرکتی با درجه‌بندی رنگ گرم»
دوربین (Camera)نوع نما و حرکت دوربین«حرکت نرم دالی به داخل (dolly-in) از نمای متوسط به نمای نزدیک»
ترکیب‌بندی (Composition)قاب‌بندی و ساختار بصری«قانون یک‌سوم، سوژه در سمت چپ، پس‌زمینه محو (بوکه)»
فضا (Ambiance)نورپردازی، حال و هوا و اتمسفر«نور ساعت طلایی از پنجره‌ها، گرمای حرفه‌ای»
صدا (Audio)طراحی صدا و دیالوگ«اون میگه: نتایج فصل سوم ما از همه انتظارات فراتر رفت»

سطوح کیفیت بر اساس این چارچوب:

  • سطح استادی: هر ۸ جزء با جزئیات پیشرفته.
  • سطح حرفه‌ای: ۶ تا ۸ جزء با توصیفات دقیق.
  • سطح متوسط: ۴ تا ۶ جزء با جزئیات پایه.
  • سطح پایه: ۱ تا ۳ جزء (نتایج ضعیف).

استادی در فیلم‌برداری و کارگردانی با Veo 3

اینجا یاد میگیری چجوری با استفاده از تکنیک‌های حرفه‌ای، ویدیوهایی در حد هالیوود بسازی.

کتابخانه حرکات دوربین

میتونی هر نوع حرکت دوربینی رو که فکرش رو بکنی، شبیه‌سازی کنی.

  • شات ثابت (Static Shot): دوربین کاملا بی‌حرکته. برای نماهای معرف یا صحنه‌های دیالوگ عالیه.
    • کلمات کلیدی: static shot, fixed camera
  • پن (Pan): دوربین روی محور افقی به چپ یا راست میچرخه. برای نشون دادن مناظر وسیع یا دنبال کردن حرکت افقی خوبه.
    • کلمات کلیدی: pan left, pan right, slow pan
  • تیلت (Tilt): دوربین روی محور عمودی به بالا یا پایین میچرخه. برای نشون دادن ارتفاع یا احساسات شخصیت کاربرد داره.
    • کلمات کلیدی: tilt up, tilt down
  • شات تعقیبی (Tracking Shot): دوربین همراه با سوژه حرکت میکنه. برای صحنه‌های اکشن و دنبال کردن کاراکترها ایده‌آله.
    • کلمات کلیدی: tracking shot, follow shot
  • دالی (Dolly): کل دوربین به سوژه نزدیک یا ازش دور میشه. برای ایجاد صمیمیت یا حس جدایی استفاده میشه.
    • کلمات کلیدی: dolly in, dolly out, push in
  • زوم (Zoom): لنز دوربین زاویه دیدش رو تغییر میده (با دالی فرق داره). برای تاکید دراماتیک کاربرد داره.
    • کلمات کلیدی: zoom in, zoom out, crash zoom
  • شات کرین (Crane Shot): دوربین با استفاده از جرثقیل بالا یا پایین میره. برای نماهای حماسی و نشون دادن مقیاس صحنه عالیه.
    • کلمات کلیدی: crane shot, camera rises, camera descends
  • شات دستی (Handheld): دوربین لرزش‌های خفیفی مثل فیلم‌برداری با دست داره. حس واقع‌گرایانه و مستندگونه‌ای ایجاد میکنه.
    • کلمات کلیدی: handheld camera, shaky camera, documentary style
  • شات مداری (Orbit Shot): دوربین دور سوژه میچرخه. برای نمایش محصول یا لحظات جادویی خیلی خوبه.
    • کلمات کلیدی: orbit shot, arc shot, ۳۶۰-degree

کشف انقلابی: مهم‌ترین تکنیک دوربین

این مهم‌ترین نکته‌ایه که باید در مورد دوربین بدونی.
قانون حیاتی: همیشه وقتی موقعیت دوربین رو مشخص میکنی، از عبارت «(thats where the camera is)» استفاده کن.

چرا این کار میکنه؟ چون Veo 3 به جای اصطلاحات کلی، نیاز به موقعیت‌یابی صریح دوربین داره. این عبارت پردازش آگاهانه از دوربین رو فعال میکنه و شانس موفقیت تولید ویدیو رو به شدت بالا میبره.

  • مثال بد: Close-up shot of the chef cooking
  • مثال حرفه‌ای: Close-up shot with camera positioned at counter level (thats where the camera is) as the chef demonstrates knife techniques (نمای نزدیک با دوربینی که در سطح پیشخوان قرار گرفته (اینجا جاییه که دوربین هست) در حالی که سرآشپز تکنیک‌های چاقو رو نشون میده)

استادی در ترکیب‌بندی و انواع نما

  • نمای خیلی باز (Extreme Wide Shot – EWS): برای نشون دادن مقیاس و انزوا.
  • نمای باز (Wide Shot – WS): برای نشون دادن شخصیت در محیط.
  • نمای متوسط باز (Medium Wide Shot – MWS): ترکیبی از شخصیت و محیط.
  • نمای متوسط (Medium Shot – MS): از کمر به بالا، استاندارد برای مصاحبه و دیالوگ.
  • نمای متوسط نزدیک (Medium Close-Up – MCU): برای ثبت تمرکز و مهارت.
  • نمای نزدیک (Close-Up – CU): برای تاکید بر احساسات.
  • نمای خیلی نزدیک (Extreme Close-Up – ECU): برای برجسته کردن جزئیات حیاتی.

کنترل لنز، فوکوس و رنگ

  • افکت‌های لنز:
    • shallow depth of field: پس‌زمینه تار و زیبا (بوکه) برای جدا کردن سوژه.
    • deep focus: همه چیز از پیش‌زمینه تا پس‌زمینه واضح.
    • rack focus: تغییر فوکوس از یه سوژه به سوژه دیگه برای هدایت توجه.
    • wide-angle lens: بزرگنمایی فضا و پرسپکتیو.
    • lens flare: اضافه کردن افکت‌های نوری سینمایی.
  • پالت‌های رنگی:
    • monochromatic: تک‌رنگ برای وحدت هنری.
    • vibrant colors: رنگ‌های اشباع و پرانرژی.
    • pastel tones: رنگ‌های ملایم برای حس لطیف.
    • desaturated: رنگ‌های کم‌جون برای حس جدی.
    • sepia tone: قهوه‌ای قدیمی برای حس نوستالژیک.

انواع نورپردازی حرفه‌ای

  • نورپردازی سه‌نقطه‌ای (Three-Point Lighting): نور اصلی (Key)، نور پرکننده (Fill) و نور پشتی (Rim). استاندارد حرفه‌ای.
  • نورپردازی رامبراند (Rembrandt Lighting): ایجاد یه مثلث نوری روی گونه در سایه، برای درام.
  • نورپردازی پروانه‌ای (Butterfly Lighting): ایجاد یه سایه کوچک شبیه پروانه زیر بینی.
  • ساعت طلایی (Golden Hour): نور گرم و نرم غروب، برای فضای نوستالژیک.
  • ساعت آبی (Blue Hour): نور سرد و عمیق گرگ و میش، برای فضای رازآلود.
  • کیاروسکورو (Chiaroscuro): تضاد شدید بین نور و سایه، برای فضای فیلم نوآر.

استادی در ساخت ویدیوی سلفی

Veo 3 میتونه ویدیوهای سلفی خیلی طبیعی بسازه. فقط باید از این ساختار و فرمول استفاده کنی:

ساختار اصلی پرامپت سلفی:

  1. با A selfie video of [CHARACTER]... شروع کن.
  2. اضافه کن: holds the camera at arm's length (دوربین رو با فاصله یه دست گرفته).
  3. اضافه کن: His/her [body part] arm is clearly visible in the frame (دستش به وضوح تو قاب دیده میشه).
  4. اضافه کن: occasionally looking into the camera before [ACTION] (گاهی به دوربین نگاه میکنه قبل از اینکه [فلان کار] رو انجام بده).
  5. برای حس واقعی‌تر: The image is slightly grainy, looks very film-like (تصویر کمی نویز داره و شبیه فیلمه).
  6. قالب آماده ویدیوی سلفی (مثلا برای ولاگ سفر):

    A selfie video of a [CHARACTER_DESCRIPTION] exploring [LOCATION]. [He/She] is wearing [CLOTHING] and has [EMOTION] in [his/her] eyes. [LIGHTING_DESCRIPTION]. [He/She] is [ACTIVITY] while talking, occasionally looking into the camera before [SPECIFIC_ACTION]. The image is slightly grainy, looks very film-like. [He/She] speaks in a [ACCENT] and says: "[DIALOGUE_8_SECONDS_MAX]" [He/She] ends with [GESTURE].

    مثال ترجمه شده:
    «یه ویدیوی سلفی از یه بلاگر سفر که داره تو یه بازار شلوغ خیابونی تو توکیو میگرده. اون یه کت جین قدیمی پوشیده و هیجان تو چشماشه. نور خورشید بعدازظهر سایه‌های قشنگی بین غرفه‌ها ایجاد کرده. اون داره غذاهای خیابونی مختلف رو امتحان میکنه و حرف میزنه، گاهی به دوربین نگاه میکنه و بعد میچرخه تا به غرفه‌های جالب اشاره کنه. تصویر کمی نویز داره و شبیه فیلمه. اون با لهجه بریتانیایی میگه: «خب، وقتی اومدین توکیو حتما باید اینجا رو امتحان کنین. تاکویاکی اینجا واقعا فوق‌العاده‌ست و فروشنده بهم گفت این غذا سه نسله که تو خانواده‌شون درست میشه.» اون با یه علامت لایک (thumbs up) ویدیو رو تموم میکنه.»


    قالب‌های آماده حرفه‌ای برای شروع سریع

    اینجا چند تا قالب آماده برای ژانرها و کاربردهای مختلف وجود داره که میتونی ازشون استفاده کنی.

    قالب مصاحبه خیابانی (برای وایرال شدن)

    Create a [PLATFORM]-style street interview video set [TIME] in [LOCATION]. The environment includes [ENVIRONMENTAL_DETAILS]. Use [CAMERA_STYLE] filmed [ANGLE] in [COMPOSITION], with [LENS_TYPE] for [VISUAL_EFFECT]. [INTERVIEWER_DESCRIPTION] holds a mic. They stop [INTERVIEWEE_DESCRIPTION]. [POSITIONING] under [LIGHTING]. [INTERVIEWER] speaks [TONE]: "[QUESTION]" [INTERVIEWEE] [REACTION], then replies [RESPONSE_TONE]: "[ANSWER]" [POST_DIALOGUE_EFFECTS]. [SUBTITLE_INSTRUCTION].

    مثال:
    «یه ویدیوی مصاحبه خیابانی به سبک تیک‌تاک بساز که شب تو میدان تایمز نیویورک اتفاق میفته. محیط شامل بیلبوردهای چشمک‌زن، پیاده‌روهای براق، صدای بوق از دور و همهمه مردمه. از دوربین دستی با کمی لرزش استفاده کن، فیلم‌برداری از زاویه چشم تو یه قاب دونفره، با لنز واید و فوکوس عمیق برای حس واقع‌گرایانه. یه زن پرتغالی بلوند بااعتمادبه‌نفس تو دهه ۲۰ زندگیش، با یه لباس قرمز جذاب، میکروفون دستشه. اون یه مرد با ظاهر نامرتب و لباس‌های چندلایه رو متوقف میکنه. زن با لحنی شوخ ولی قاطع میپرسه: «ترجیح میدی خونه‌ت رو ۳۰ درصد ارزون‌تر و ۴۰ درصد سریع‌تر بسازی… یا مثل بازنده‌ها برگردی با مامانت زندگی کنی؟» مرد کمی مکث میکنه و با لحنی خشک جواب میده: «برگردم پیش مامانم؟ امکان نداره. همین الان خونه رو میسازم.» بلافاصله بعد از دیالوگش، افکت‌های صوتی میم سریع اضافه کن: یه صدای بیس‌دار «یـــو!»، صدای تعجب ضعیف جمعیت و یه زوم سریع روی صورتش. بدون زیرنویس.»

    قالب ویدیوی ASMR (با فوکوس ماکرو:

    Shot in extreme macro perspective, [CUTTING_TOOL] cutting a [DETAILED_OBJECT_DESCRIPTION]. The [OBJECT] has [TEXTURE_DETAILS] with [VISUAL_PROPERTIES]. [OBJECT] rests on [SURFACE] bathed in [LIGHTING]. Each [ACTION] produces [AUDIO_FOCUS] in an otherwise silent room.

    مثال:
    «فیلم‌برداری شده در نمای ماکروی شدید، یه چاقو داره یه لیچی شیشه‌ای نرم و بی‌نقص با جزئیات غنی رو میبره، شیشه‌اش ژله‌ماننده و سطح بیرونی بافت‌دار و ناهمواری شبیه پوست لیچی داره. سطحش نور رو به طور ظریف بازتاب میده و مات و نیمه‌شفاف با رنگ‌های صورتی-سفید کم‌رنگ به نظر میرسه. داخل شیشه صاف و براقه و یه هسته درخشان با شیب‌های شیری ظریف و حباب‌های خیلی ریز معلق داره. روی یه تخته برش چوبی زیر نور گرم قرار گرفته. هر برش حساب‌شده، یه منظره صوتی غنی ASMR تو یه اتاق کاملا ساکت ایجاد میکنه.»

    قالب ژانر وحشت/تریلر

    «نورپردازی تاریک و اتمسفریک با سایه‌های عمیق و نورپردازی انتخابی. دوربین دستی با لرزش خفیف برای ایجاد تنش. یه شخصیت به آرامی در یک [محیط ترسناک] حرکت میکنه، صدای [صدای تنش‌زا] از زیر پاش میاد. [عنصر ترسناک] باعث میشه اون [واکنش نشون بده]. صدا: [صداهای ترسناک]، [صدای اتمسفریک]، [موسیقی ناگهانی ترسناک]. پالت رنگی [رنگ‌های مشخص].»

    قالب کمدی

    «نورپردازی روشن و یکنواخت با دمای رنگ گرم. حرکات دوربین ثابت یا نرم برای وضوح. شخصیت در [موقعیت] با [مشکل کمدی] روبرو میشه. [عناصر کمدی]. زمان‌بندی خیلی مهمه—مکث قبل از گفتن پانچ‌لاین. صدا: دیالوگ واضح، [دستورالعمل موسیقی]، [افکت‌های صوتی]. با مشخص کردن «صدا: تن طبیعی اتاق، بدون صدای تماشاچی» از صدای خنده ناخواسته جلوگیری کن.»

    راه حل برای ویدیوی عمودی (۹:۱۶)

    در حال حاضر Veo 3 فقط به صورت پیش‌فرض ویدیوی افقی (۱۶:۹) میسازه. اما یه راه حل حرفه‌ای وجود داره:

    1. ویدیوی افقی رو با Veo 3 بساز.
    2. از ابزاری به اسم Luma's Reframe Video استفاده کن تا ویدیو رو به فرمت عمودی تبدیل کنی.
    3. خروجی نهایی یه ویدیوی عمودی با کیفیت 720p خواهد بود.
    4. پشتیبانی از ویدیوی عمودی به صورت بومی به زودی اضافه میشه.

    عیب‌یابی نهایی و نکات پیشرفته

    مشکلدلیل احتمالیراه‌حل
    مدل پیام میده «فقط پرامپت انگلیسی قبول میکنم»کاراکترهای غیراستاندارد، زبان‌های ترکیبیپرامپت رو به انگلیسی واضح بازنویسی کن، ایموجی‌ها رو حذف کن
    خطای «تولید ناموفق بود»پرامپت خیلی طولانیه یا قوانین رو نقض میکنهکوتاهش کن، محتوای غیرمجاز رو حذف کن
    خروجی جزئیات کمی دارهپرامپت به اندازه کافی دقیق نیستتوصیفگرهایی مثل نور، دوربین و فضا رو اضافه کن، به حالت Quality سوییچ کن
    اشیای ناخواسته ظاهر میشنپرامپت منفی (Negative Prompt) ندارییه پرامپت منفی با لیست کردن چیزهایی که نمیخوای اضافه کن
    حرکت‌ها پرش دارنسرعت زیاد دوربین در حالت Qualityسرعت دوربین رو کم کن یا از حالت Fast استفاده کن

    استراتژی پرامپت‌نویسی لایه‌ای

    1. لایه ۱: سوژه اصلی – «زن تاجر حرفه‌ای در اداره مدرن»
    2. لایه ۲: جزئیات بصری – «کت بلیزر سرمه‌ای، حالت بدنی بااعتمادبه‌نفس، نور طبیعی»
    3. لایه ۳: مشخصات فنی – «نمای متوسط، کیفیت ۱۰۸۰، عمق میدان کم»
    4. لایه ۴: عناصر صوتی – «دیالوگ واضح با صدای محیط اداره»
    5. لایه ۵: جهت‌دهی سبک – «زیبایی‌شناسی مستند شرکتی»

    پرامپت منفی جامع برای کنترل کیفیت

    برای اینکه از شر اکثر مشکلات رایج خلاص بشی، میتونی این پرامپت منفی جامع رو به آخر دستورهات اضافه کنی:
    Negative prompt: no text overlays, no watermarks, no cartoon effects, no unrealistic proportions, no blurry faces, no distorted hands, no artificial lighting, no oversaturation, no poor audio quality, no lip-sync issues, no camera shake, no compression artifacts, no unprofessional appearance.

    منابع

دیدگاه‌ها

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *