اگه تا حالا به این فکر کردی که چجوری میشه فقط با نوشتن چند خط متن، یه ویدیوی خفن و سینمایی ساخت، باید با گوگل Veo 3 آشنا بشی. این مدل هوش مصنوعی یکی از پیشرفتهترین ابزارهای تبدیل متن به ویدیو تو دنیاست که میتونه ویدیوهایی با کیفیت سینمایی، صدای هماهنگ، فیزیک واقعگرایانه و جلوههای ویژه در حد حرفهای تولید کنه. Veo 3 یه جورایی یه جهش بزرگ تو این تکنولوژیه و به تولیدکنندههای محتوا اجازه میده فقط با توصیف کردن چیزی که تو ذهنشون هست، ویدیوهای باکیفیت بسازن. یکی از ویژگیهای مهمش اینه که ویدیو و صدا رو همزمان تولید میکنه و این باعث میشه همه چیز کاملا با هم هماهنگ باشه.
ویژگیهای جدید و خفن Veo 3
این مدل یه سری قابلیتهای جدید و بهبودیافته داره که کار رو خیلی حرفهایتر میکنه. اینجا یه نگاهی بهشون میندازیم:
ویژگی | وضعیت | توضیحات |
---|---|---|
موقعیتیابی حیاتی دوربین | جدید | یه دستور نوشتاری انقلابی به اسم «(thats where the camera is)» |
استادی در ویدیوی سلفی | جدید | فرمولهای تست شده برای رفتار طبیعی تو ویدیوهای سلفی |
دستهبندی صدا | جدید | کتابخانههای صوتی حرفهای و کنترل کیفیت صدا |
کنترل کیفیت حرکت | جدید | کلمات کلیدی دقیق برای حرکتهای طبیعی، پرانرژی و زیبا |
عیبیابی تخصصی | جدید | راهحلهای تست شده برای مشکلات رایج موقع ساخت ویدیو |
راهحل ویدیوی عمودی | جدید | یه راهکار حرفهای برای ساخت ویدیو با فرمت ۹:۱۶ |
ترکیببندی پیشرفته | جدید | افکتهای لنز، پالتهای رنگی و درجهبندی سینمایی رنگ |
بهینهسازی روند کاری | جدید | ابزارهای حرفهای برای افزایش کیفیت و تبدیل فرمت ویدیو |
موتور تولید پرامپت متا | بهبودیافته | معماری شناختی سطح بالا برای تولید پرامپت (دستور) |
از کجا میشه به Veo 3 دسترسی داشت؟
این مدل از طریق پلتفرمهای مختلفی در دسترسه که هر کدوم برای یه گروه از کاربرا طراحی شدن:
پلتفرم | سطح دسترسی | ویژگیها |
---|---|---|
Vertex AI | سازمانی (Enterprise) | دسترسی کامل به API، پردازش دستهای، پیشنمایش عمومی |
Google Vids | مصرفکننده (Consumer) | رابط کاربری ساده، قالبهای آماده |
Gemini App | عمومی (General) | تولید ویدیوی پایه، سازگار با موبایل |
قابلیتهای اصلی Veo 3 در یک نگاه
این هوش مصنوعی یه مجموعه کامل از ابزارها رو در اختیارت میذاره:
- تولید سریع (Fast Generate): برای وقتی که میخوای سریع یه نمونه اولیه از ایدهت ببینی و تستش کنی. مدلش
veo-3.0-fast-generate-preview
هست. - تولید استاندارد (Standard Generate): برای وقتی که میخوای بالاترین کیفیت ممکن رو برای خروجی نهایی داشته باشی. مدلش
veo-3.0-generate-preview
هست. - تولید صدای اصلی: ویدیو و صدا رو تو یه مرحله و کاملا هماهنگ با هم تولید میکنه.
- لبخوانی بینقص (Lip-Sync): اگه تو ویدیوت دیالوگ داشته باشی، حرکت لبها کاملا با صدای دیالوگ هماهنگ میشه.
- صدای محیط: صداهای محیطی مثل موسیقی پسزمینه، افکتهای صوتی و نویز محیط به طور خودکار با تصویر مچ میشن.
- کیفیت صدای حرفهای: کیفیت میکس و وضوح صدا در حد استانداردهای پخش حرفهایه.
- کیفیت تصویر بالا: به طور پیشفرض ویدیوها رو با کیفیت 720p میسازه ولی قابلیت تولید 1080p رو هم داره.
- فیلمبرداری حرفهای: حرکتهای پیشرفته دوربین، نورپردازیهای خاص و عمق میدان سینمایی رو شبیهسازی میکنه.
- جلوههای ویژه: سیستمهای ذرات (مثل دود و آتش)، افکتهای جوی و مواد واقعگرایانه رو میتونه بسازه.
- سبکهای هنری: از سبکهای بصری مختلف و ژانرهای سینمایی متفاوت پشتیبانی میکنه.
فیزیک و درک صحنه در Veo 3
یکی از نقاط قوت این مدل، درک بالای اون از دنیای فیزیکی و روایت داستانیه.
- مایعات واقعگرایانه: رفتار آب، مایعات و ذرات از قوانین طبیعی فیزیک پیروی میکنه.
- سیستمهای گرانش: افتادن، جهش و حفظ شتاب اجسام به درستی شبیهسازی میشه.
- ویژگیهای مواد: شبیهسازی دقیق پارچه، فلز، شیشه و مواد ارگانیک.
- افکتهای ذرات: دود، آتش، گرد و غبار و ذرات معلق در هوا خیلی طبیعی به نظر میان.
- ثبات شخصیت: میتونی ظاهر یه شخصیت رو تو چند تا ویدیوی مختلف ثابت نگه داری.
- صحنههای چندشخصیتی: تعاملات پیچیده بین چند تا شخصیت رو به خوبی مدیریت میکنه.
- درک صحنه: توالی زمانی و تداوم داستانی رو توی ویدیوها حفظ میکنه.
- ورودی چندوجهی: میتونه از متن، عکس یا حتی یه ویدیوی دیگه برای ساخت ویدیوی جدید استفاده کنه.
چجوری با Veo 3 دیالوگ و صدای حرفهای بسازیم؟
یکی از ویژگیهای انقلابی Veo 3 اینه که دیالوگها رو با حرکت لب کاملا هماهنگ میکنه. برای این کار باید از تکنیکهای خاصی استفاده کنی.
انواع روشهای نوشتن دیالوگ
- دیالوگ مستقیم:
- مثال: «معلم جلوی تخته سفید ایستاده و میگه: امروز میخوایم فتوسنتز رو بررسی کنیم، فرآیندی که گیاهان برای تبدیل نور خورشید به انرژی ازش استفاده میکنن.»
- دیالوگ محاورهای:
- مثال: «زن میپرسه: واسه ناهار کجا همدیگه رو ببینیم؟ مرد جواب میده: اون رستوران ایتالیایی جدیده تو مرکز شهر چطوره؟»
- دیالوگ احساسی:
- مثال: «مدیرعامل با تامل مکث میکنه، بعد با قاطعیت میگه: این مسیریه که شرکت ما باید طی کنه. صداش ترکیبی از اراده و کمی عدم اطمینان رو منتقل میکنه.»
ساخت لایههای صوتی (Soundscapes)
میتونی صداهای مختلفی رو برای محیط مشخص کنی تا فضاسازی کامل بشه.
- محیطهای طبیعی:
Audio: Gentle wind through trees, various bird songs, rustling leaves, distant water flowing, peaceful forest atmosphere.
- یعنی: صدای باد ملایم بین درختها، آواز پرندههای مختلف، خش خش برگها، صدای آب از دور، فضای آرام جنگل.
- محیطهای حرفهای:
Audio: Soft keyboard typing, air conditioning hum, muffled phone conversations, paper rustling, professional office ambiance.
- یعنی: صدای تایپ کردن کیبورد، صدای کولر گازی، صدای ضعیف مکالمات تلفنی، خش خش کاغذ، فضای حرفهای اداره.
- محیط شهری:
Audio: Distant traffic hum, occasional car horns, footsteps on pavement, muffled conversations, city ambiance with subtle building echoes.
- یعنی: صدای ترافیک از دور، صدای بوق ماشینها، صدای پا روی پیادهرو، مکالمات ضعیف، فضای شهری با اکوی ضعیف ساختمانها.
کنترل موسیقی
- موسیقی بر اساس حال و هوا:
- مثال: «موسیقی ارکسترال الهامبخش با سازهای زهی و بادی که به سمت یه نقطه اوج هیجانانگیز میره و حس امید و اراده رو منتقل میکنه.»
- موسیقی بر اساس ژانر:
- مثال: «پیانوی جاز ملایم با یه خط بیس ظریف که یه فضای پیچیده و صمیمی مثل یه سالن لوکس رو ایجاد میکنه.»
- موسیقی پویا:
- مثال: «موسیقی الکترونیک تنشزا که با ریتم مینیمال شروع میشه، بعد لایههای سینت و پرکاشن بهش اضافه میشه و همزمان با تصمیمگیری شخصیت به اوج میرسه.»
صداهای هماهنگ با اتفاقات
- هماهنگ با اکشن:
- مثال: «صدای جلز و ولز روغن تو ماهیتابه، صدای چاقو موقع خرد کردن سبزیجات، صدای آب در حال جوشیدن، صدای به هم خوردن ظرفها، فضای آشپزی در آشپزخانه.»
- صداهای حرکت و برخورد:
- مثال: «صدای پا موقع دویدن روی شن، نفس نفس زدن سنگین، صدای محکم بسته شدن در، صدای استارت ماشین، صدای جیغ لاستیکها.»
- صداهای تکنولوژی:
- مثال: «صدای روشن شدن دستگاه، صدای کلیک دکمهها، صداهای رابط کاربری صفحه نمایش، صدای نوتیفیکیشنها، فضای مدرن تکنولوژی.»
نکته حیاتی برای دیالوگ: چجوری از زیرنویس ناخواسته جلوگیری کنیم؟
این یکی از مهمترین تکنیکهاست. Veo 3 گاهی اوقات دیالوگها رو به صورت زیرنویس روی ویدیو نشون میده. برای جلوگیری از این مشکل:
- روش درست – فرمت دو نقطه (Colon Format):
The detective looks directly at camera and says: "Something's not right here."
- باید بعد از
says
از دو نقطه (:
) استفاده کنی. این کار از ایجاد زیرنویس جلوگیری میکنه.
- روش غلط – فرمت گیومه (Quote Format):
The detective says: "Something's not right here."
- از این فرمت که فقط از گیومه استفاده میکنه، دوری کن چون باعث ایجاد زیرنویس میشه.
عیبیابی مشکلات رایج در صدا و دیالوگ
- مشکل: هوش مصنوعی اسمها یا کلمات پیچیده رو اشتباه تلفظ میکنه.
- راه حل: از املای آوایی (Phonetic) استفاده کن.
- مثال اصلی:
"Read on to get Fofur and Shridar's guidance"
- مثال اصلاح شده:
"Read on to get foh-fur's and Shreedar's guidance"
- قانون طول مناسب دیالوگ (قانون ۸ ثانیه):
- عالی: دیالوگهایی که گفتنشون حدود ۸ ثانیه طول میکشه.
- مثال: «سارا، یه مدیرعامل بااعتمادبهنفس، به دوربین نگاه میکنه و میگه: نتایج فصل سوم ما از همه انتظارات فراتر رفت و ما رو در موقعیت رشد بیسابقهای قرار داد.»
- خیلی طولانی (باعث تند صحبت کردن میشه): از پاراگرافهای طولانی که گفتنشون بیشتر از ۱۵ ثانیه طول میکشه خودداری کن.
- خیلی کوتاه (باعث سکوت یا کلمات بیمعنی میشه): از کلمات تکی مثل «سلام» یا «بله» پرهیز کن.
- عالی: دیالوگهایی که گفتنشون حدود ۸ ثانیه طول میکشه.
- مشخص کن کی صحبت میکنه:
- وقتی دو نفر تو صحنه هستن، حتما مشخص کن کدوم دیالوگ مال کیه.
- مثال: «زن با لباس قرمز میپرسه: کجا همدیگه رو ببینیم؟ مرد با پیراهن آبی جواب میده: اون رستوران ایتالیایی جدیده چطوره؟»
- اجازه بده Veo 3 دیالوگ طبیعی بسازه:
- میتونی به جای نوشتن دیالوگ کامل، فقط موقعیت رو توصیف کنی.
- مثلا: «یه استندآپ کمدین داره جوک تعریف میکنه.» یا «دو نفر دارن در مورد فیلمی که تازه دیدن بحث میکنن.»
روشهای قطعی برای حذف زیرنویس
- فرمت دو نقطه: همونطور که گفته شد، همیشه از فرمت
Character says: "dialogue"
استفاده کن. - نفی صریح (Explicit Negation): به آخر دستورت عبارت
(no subtitles)
یاno subtitles, no text overlays
رو اضافه کن. - نفی چندباره (برای موارد سرسخت): اگه باز هم زیرنویس داشتی، اینو امتحان کن:
"No subtitles. No subtitles! No on-screen text whatsoever."
- مشکل: صدای خنده تماشاچیهای استودیویی ناخواسته.
- راه حل: همیشه صدای پسزمینه مورد انتظارت رو مشخص کن.
- بد:
Character tells a joke
(ممکنه صدای خنده اضافه کنه). - خوب:
Character tells a joke. Audio: quiet office ambiance, no audience sounds, professional atmosphere.
- یعنی: «شخصیت جوک میگه. صدا: فضای آرام اداری، بدون صدای تماشاچی، جو حرفهای.»
کنترل روایت، احساسات و فیزیک صحنه
برای اینکه ویدیو جون بگیره و طبیعی به نظر برسه، باید بتونی داستان، احساسات شخصیتها و قوانین فیزیک رو کنترل کنی.
توالی زمانی و پیشرفت احساسی
میتونی به Veo 3 بگی که یه اتفاق یا حس چجوری در طول زمان تغییر کنه.
- پیشرفت احساسی:
- مثال: «شخصیت اولش گیج و نامطمئنه، بعد به تدریج بااعتمادبهنفس و مصمم میشه و در نهایت با یه لبخند رضایتبخش کارش رو تموم میکنه.»
- توالی اکشن:
- مثال: «اون اول جلوی در تردید میکنه، بعد یه نفس عمیق میکشه و در نهایت با قاطعیت در رو باز میکنه.»
- توالی حرکت دوربین:
- مثال: «صحنه با یه نمای باز معرف (establishing shot) شروع میشه، بعد در ثانیه سوم به آرامی به یه نمای متوسط (medium shot) تبدیل میشه و در نهایت با یه نمای نزدیک (close-up) روی چهره مصمم شخصیت تموم میشه.»
کنترل احساسات ظریف و حذف «چهره مدل»
یکی از مشکلات مدلهای هوش مصنوعی اینه که چهرهها بیروح و شبیه مدلهای پلاستیکی به نظر میان. برای جلوگیری از این مشکل:
- نشانههای احساسی ظریف:
- مثال: «چشماش یه کم تنگ میشه، یه خط کوچیک بین ابروهاش میفته و قبل از حرف زدن فقط یه لحظه مکث میکنه.»
- دادن زندگی به شخصیت:
- مثال: «اون نیم قدم به جلو میاد، چونهاش رو بالا میبره، چشماش متمرکزه و انگار آماده درگیریه.»
- حذف چهره مدل (Model Face):
- مثال: «چشماش متفکرانه ریز میشه، سرش رو کج میکنه انگار داره اطلاعات جدیدی رو پردازش میکنه، و یه لبخند کوچیک روی لبهاش شکل میگیره.»
شبیهسازی فیزیک واقعگرایانه
Veo 3 تو شبیهسازی رفتار آب و مایعات عالیه. از اصطلاحات فیزیکی دقیق استفاده کن.
- جریان و پاشیدن آب:
- مثال: «یه لیوان آب واژگون میشه و فیزیک واقعگرایانه جریان مایع رو کنترل میکنه. آب روی سطح میز پخش میشه و الگوهای پاشیدن و بازتابهای سطح طبیعی رو ایجاد میکنه.»
- رفتار پیشرفته مایعات:
- مثال: «قطرههای بارون به شیشه میخورن، هر قطره با فیزیک واقعگرایانه با بقیه ترکیب میشه، روی سطح شیشه سر میخوره و ردهای آب طبیعی با کشش سطحی مناسب ایجاد میکنه.»
- شبیهسازی پارچه:
- مثال: «یه روسری ابریشمی تو هوا میفته، پارچه سبکش به طور طبیعی با مقاومت هوا شناور میشه و با چین و چروکهای واقعگرایانه به نرمی فرود میاد.»
- فیزیک اجسام سخت:
- مثال: «دو تا توپ بیلیارد با انتقال تکانه دقیق به هم برخورد میکنن، ضربه صدای واقعگرایانهای ایجاد میکنه و با زوایای مناسب بر اساس اصول فیزیک از هم جدا میشن.»
- افکتهای سیستم ذرات:
- مثال: «دود از آتیش با پیچ و تابهای واقعگرایانه بلند میشه، ذرات به طور طبیعی با جریان باد پخش میشن و وقتی نور خورشید از بینشون رد میشه، افکتهای نوری حجمی ایجاد میکنن.»
حفظ ثبات شخصیت در صحنههای مختلف
برای اینکه یه شخصیت تو صحنههای مختلف دقیقا همون شکلی بمونه، باید توصیفات خیلی دقیقی ازش ارائه بدی.
- قالب جامع شخصیت:
[NAME], a [AGE] [ETHNICITY] [GENDER] with [SPECIFIC_HAIR_DETAILS], [EYE_COLOR] eyes, [DISTINCTIVE_FACIAL_FEATURES], wearing [DETAILED_CLOTHING_DESCRIPTION], with [POSTURE_AND_MANNERISMS]
- مثال برای ثبات شخصیت:
- صحنه ۱ – معرفی شخصیت:
- «دکتر جنیفر والش، یه متخصص اطفال ۳۵ ساله با موهای کوتاه قهوهای مدل باب، چشمهای سبز مهربون و لبخندی گرم، یه روپوش سفید آزمایشگاهی روی لباسهای اسکراب آبی پوشیده و یه گوشی پزشکی دور گردنشه. اون داره یه بیمار جوون رو تو یه اتاق معاینه روشن معاینه میکنه.»
- صحنه ۲ – همون شخصیت، مکان متفاوت:
- «دکتر جنیفر والش، همون متخصص اطفال ۳۵ ساله با موهای کوتاه قهوهای مدل باب و چشمهای سبز مهربون، حالا یه ژاکت سبز غیررسمی و شلوار جین تیره پوشیده و پشت میز کارش تو خونه نشسته و پروندههای بیمارها رو بررسی میکنه. اون همون حالت گرم و دلسوز همیشگیش رو حفظ کرده.»
- صحنه ۱ – معرفی شخصیت:
- استفاده از اکسسوریهای خاص:
- مثال: «کارآگاه همیشه کت چرم قدیمیاش، ساعت نقرهای روی مچ دست چپش رو میپوشه و یه دفترچه چرمی قهوهای فرسوده همراهشه. این عناصر شاخص تو هر صحنه تکرار میشن.»
چارچوب ۸ مرحلهای برای ساخت ویدیوهای سینمایی
برای اینکه یه توصیف ساده رو به یه شاهکار سینمایی تبدیل کنی، باید از این چارچوب ۸ جزئی استفاده کنی. هر چی جزئیات بیشتری از این ۸ مورد رو تو دستورت بیاری، نتیجه حرفهایتر میشه.
جزء | هدف | مثال |
---|---|---|
سوژه (Subject) | تمرکز اصلی و جزئیات شخصیت | «یه مدیرعامل ۳۵ ساله بااعتمادبهنفس با موهای کوتاه قهوهای مایل به قرمز» |
زمینه (Context) | محل و محیط صحنه | «تو یه اتاق هیئت مدیره مدرن با دیوارهای شیشهای موقع غروب خورشید» |
اکشن (Action) | اتفاقی که در صحنه میفته | «اون داره نتایج فصلی رو با حرکات پرانرژی دست ارائه میده» |
سبک (Style) | زیباییشناسی بصری و ژانر | «سبک سینمایی شرکتی با درجهبندی رنگ گرم» |
دوربین (Camera) | نوع نما و حرکت دوربین | «حرکت نرم دالی به داخل (dolly-in) از نمای متوسط به نمای نزدیک» |
ترکیببندی (Composition) | قاببندی و ساختار بصری | «قانون یکسوم، سوژه در سمت چپ، پسزمینه محو (بوکه)» |
فضا (Ambiance) | نورپردازی، حال و هوا و اتمسفر | «نور ساعت طلایی از پنجرهها، گرمای حرفهای» |
صدا (Audio) | طراحی صدا و دیالوگ | «اون میگه: نتایج فصل سوم ما از همه انتظارات فراتر رفت» |
سطوح کیفیت بر اساس این چارچوب:
- سطح استادی: هر ۸ جزء با جزئیات پیشرفته.
- سطح حرفهای: ۶ تا ۸ جزء با توصیفات دقیق.
- سطح متوسط: ۴ تا ۶ جزء با جزئیات پایه.
- سطح پایه: ۱ تا ۳ جزء (نتایج ضعیف).
استادی در فیلمبرداری و کارگردانی با Veo 3
اینجا یاد میگیری چجوری با استفاده از تکنیکهای حرفهای، ویدیوهایی در حد هالیوود بسازی.
کتابخانه حرکات دوربین
میتونی هر نوع حرکت دوربینی رو که فکرش رو بکنی، شبیهسازی کنی.
- شات ثابت (Static Shot): دوربین کاملا بیحرکته. برای نماهای معرف یا صحنههای دیالوگ عالیه.
- کلمات کلیدی:
static shot
,fixed camera
- کلمات کلیدی:
- پن (Pan): دوربین روی محور افقی به چپ یا راست میچرخه. برای نشون دادن مناظر وسیع یا دنبال کردن حرکت افقی خوبه.
- کلمات کلیدی:
pan left
,pan right
,slow pan
- کلمات کلیدی:
- تیلت (Tilt): دوربین روی محور عمودی به بالا یا پایین میچرخه. برای نشون دادن ارتفاع یا احساسات شخصیت کاربرد داره.
- کلمات کلیدی:
tilt up
,tilt down
- کلمات کلیدی:
- شات تعقیبی (Tracking Shot): دوربین همراه با سوژه حرکت میکنه. برای صحنههای اکشن و دنبال کردن کاراکترها ایدهآله.
- کلمات کلیدی:
tracking shot
,follow shot
- کلمات کلیدی:
- دالی (Dolly): کل دوربین به سوژه نزدیک یا ازش دور میشه. برای ایجاد صمیمیت یا حس جدایی استفاده میشه.
- کلمات کلیدی:
dolly in
,dolly out
,push in
- کلمات کلیدی:
- زوم (Zoom): لنز دوربین زاویه دیدش رو تغییر میده (با دالی فرق داره). برای تاکید دراماتیک کاربرد داره.
- کلمات کلیدی:
zoom in
,zoom out
,crash zoom
- کلمات کلیدی:
- شات کرین (Crane Shot): دوربین با استفاده از جرثقیل بالا یا پایین میره. برای نماهای حماسی و نشون دادن مقیاس صحنه عالیه.
- کلمات کلیدی:
crane shot
,camera rises
,camera descends
- کلمات کلیدی:
- شات دستی (Handheld): دوربین لرزشهای خفیفی مثل فیلمبرداری با دست داره. حس واقعگرایانه و مستندگونهای ایجاد میکنه.
- کلمات کلیدی:
handheld camera
,shaky camera
,documentary style
- کلمات کلیدی:
- شات مداری (Orbit Shot): دوربین دور سوژه میچرخه. برای نمایش محصول یا لحظات جادویی خیلی خوبه.
- کلمات کلیدی:
orbit shot
,arc shot
,۳۶۰-degree
- کلمات کلیدی:
کشف انقلابی: مهمترین تکنیک دوربین
این مهمترین نکتهایه که باید در مورد دوربین بدونی.
قانون حیاتی: همیشه وقتی موقعیت دوربین رو مشخص میکنی، از عبارت «(thats where the camera is)» استفاده کن.
چرا این کار میکنه؟ چون Veo 3 به جای اصطلاحات کلی، نیاز به موقعیتیابی صریح دوربین داره. این عبارت پردازش آگاهانه از دوربین رو فعال میکنه و شانس موفقیت تولید ویدیو رو به شدت بالا میبره.
- مثال بد:
Close-up shot of the chef cooking
- مثال حرفهای:
Close-up shot with camera positioned at counter level (thats where the camera is) as the chef demonstrates knife techniques
(نمای نزدیک با دوربینی که در سطح پیشخوان قرار گرفته (اینجا جاییه که دوربین هست) در حالی که سرآشپز تکنیکهای چاقو رو نشون میده)
استادی در ترکیببندی و انواع نما
- نمای خیلی باز (Extreme Wide Shot – EWS): برای نشون دادن مقیاس و انزوا.
- نمای باز (Wide Shot – WS): برای نشون دادن شخصیت در محیط.
- نمای متوسط باز (Medium Wide Shot – MWS): ترکیبی از شخصیت و محیط.
- نمای متوسط (Medium Shot – MS): از کمر به بالا، استاندارد برای مصاحبه و دیالوگ.
- نمای متوسط نزدیک (Medium Close-Up – MCU): برای ثبت تمرکز و مهارت.
- نمای نزدیک (Close-Up – CU): برای تاکید بر احساسات.
- نمای خیلی نزدیک (Extreme Close-Up – ECU): برای برجسته کردن جزئیات حیاتی.
کنترل لنز، فوکوس و رنگ
- افکتهای لنز:
shallow depth of field
: پسزمینه تار و زیبا (بوکه) برای جدا کردن سوژه.deep focus
: همه چیز از پیشزمینه تا پسزمینه واضح.rack focus
: تغییر فوکوس از یه سوژه به سوژه دیگه برای هدایت توجه.wide-angle lens
: بزرگنمایی فضا و پرسپکتیو.lens flare
: اضافه کردن افکتهای نوری سینمایی.
- پالتهای رنگی:
monochromatic
: تکرنگ برای وحدت هنری.vibrant colors
: رنگهای اشباع و پرانرژی.pastel tones
: رنگهای ملایم برای حس لطیف.desaturated
: رنگهای کمجون برای حس جدی.sepia tone
: قهوهای قدیمی برای حس نوستالژیک.
انواع نورپردازی حرفهای
- نورپردازی سهنقطهای (Three-Point Lighting): نور اصلی (Key)، نور پرکننده (Fill) و نور پشتی (Rim). استاندارد حرفهای.
- نورپردازی رامبراند (Rembrandt Lighting): ایجاد یه مثلث نوری روی گونه در سایه، برای درام.
- نورپردازی پروانهای (Butterfly Lighting): ایجاد یه سایه کوچک شبیه پروانه زیر بینی.
- ساعت طلایی (Golden Hour): نور گرم و نرم غروب، برای فضای نوستالژیک.
- ساعت آبی (Blue Hour): نور سرد و عمیق گرگ و میش، برای فضای رازآلود.
- کیاروسکورو (Chiaroscuro): تضاد شدید بین نور و سایه، برای فضای فیلم نوآر.
استادی در ساخت ویدیوی سلفی
Veo 3 میتونه ویدیوهای سلفی خیلی طبیعی بسازه. فقط باید از این ساختار و فرمول استفاده کنی:
ساختار اصلی پرامپت سلفی:
- با
A selfie video of [CHARACTER]...
شروع کن. - اضافه کن:
holds the camera at arm's length
(دوربین رو با فاصله یه دست گرفته). - اضافه کن:
His/her [body part] arm is clearly visible in the frame
(دستش به وضوح تو قاب دیده میشه). - اضافه کن:
occasionally looking into the camera before [ACTION]
(گاهی به دوربین نگاه میکنه قبل از اینکه [فلان کار] رو انجام بده). - برای حس واقعیتر:
The image is slightly grainy, looks very film-like
(تصویر کمی نویز داره و شبیه فیلمه). - ویدیوی افقی رو با Veo 3 بساز.
- از ابزاری به اسم
Luma's Reframe Video
استفاده کن تا ویدیو رو به فرمت عمودی تبدیل کنی. - خروجی نهایی یه ویدیوی عمودی با کیفیت 720p خواهد بود.
- پشتیبانی از ویدیوی عمودی به صورت بومی به زودی اضافه میشه.
- لایه ۱: سوژه اصلی – «زن تاجر حرفهای در اداره مدرن»
- لایه ۲: جزئیات بصری – «کت بلیزر سرمهای، حالت بدنی بااعتمادبهنفس، نور طبیعی»
- لایه ۳: مشخصات فنی – «نمای متوسط، کیفیت ۱۰۸۰، عمق میدان کم»
- لایه ۴: عناصر صوتی – «دیالوگ واضح با صدای محیط اداره»
- لایه ۵: جهتدهی سبک – «زیباییشناسی مستند شرکتی»
قالب آماده ویدیوی سلفی (مثلا برای ولاگ سفر):
A selfie video of a [CHARACTER_DESCRIPTION] exploring [LOCATION]. [He/She] is wearing [CLOTHING] and has [EMOTION] in [his/her] eyes. [LIGHTING_DESCRIPTION]. [He/She] is [ACTIVITY] while talking, occasionally looking into the camera before [SPECIFIC_ACTION]. The image is slightly grainy, looks very film-like. [He/She] speaks in a [ACCENT] and says: "[DIALOGUE_8_SECONDS_MAX]" [He/She] ends with [GESTURE].
مثال ترجمه شده:
«یه ویدیوی سلفی از یه بلاگر سفر که داره تو یه بازار شلوغ خیابونی تو توکیو میگرده. اون یه کت جین قدیمی پوشیده و هیجان تو چشماشه. نور خورشید بعدازظهر سایههای قشنگی بین غرفهها ایجاد کرده. اون داره غذاهای خیابونی مختلف رو امتحان میکنه و حرف میزنه، گاهی به دوربین نگاه میکنه و بعد میچرخه تا به غرفههای جالب اشاره کنه. تصویر کمی نویز داره و شبیه فیلمه. اون با لهجه بریتانیایی میگه: «خب، وقتی اومدین توکیو حتما باید اینجا رو امتحان کنین. تاکویاکی اینجا واقعا فوقالعادهست و فروشنده بهم گفت این غذا سه نسله که تو خانوادهشون درست میشه.» اون با یه علامت لایک (thumbs up) ویدیو رو تموم میکنه.»
قالبهای آماده حرفهای برای شروع سریع
اینجا چند تا قالب آماده برای ژانرها و کاربردهای مختلف وجود داره که میتونی ازشون استفاده کنی.
قالب مصاحبه خیابانی (برای وایرال شدن)
Create a [PLATFORM]-style street interview video set [TIME] in [LOCATION]. The environment includes [ENVIRONMENTAL_DETAILS]. Use [CAMERA_STYLE] filmed [ANGLE] in [COMPOSITION], with [LENS_TYPE] for [VISUAL_EFFECT]. [INTERVIEWER_DESCRIPTION] holds a mic. They stop [INTERVIEWEE_DESCRIPTION]. [POSITIONING] under [LIGHTING]. [INTERVIEWER] speaks [TONE]: "[QUESTION]" [INTERVIEWEE] [REACTION], then replies [RESPONSE_TONE]: "[ANSWER]" [POST_DIALOGUE_EFFECTS]. [SUBTITLE_INSTRUCTION].
مثال:
«یه ویدیوی مصاحبه خیابانی به سبک تیکتاک بساز که شب تو میدان تایمز نیویورک اتفاق میفته. محیط شامل بیلبوردهای چشمکزن، پیادهروهای براق، صدای بوق از دور و همهمه مردمه. از دوربین دستی با کمی لرزش استفاده کن، فیلمبرداری از زاویه چشم تو یه قاب دونفره، با لنز واید و فوکوس عمیق برای حس واقعگرایانه. یه زن پرتغالی بلوند بااعتمادبهنفس تو دهه ۲۰ زندگیش، با یه لباس قرمز جذاب، میکروفون دستشه. اون یه مرد با ظاهر نامرتب و لباسهای چندلایه رو متوقف میکنه. زن با لحنی شوخ ولی قاطع میپرسه: «ترجیح میدی خونهت رو ۳۰ درصد ارزونتر و ۴۰ درصد سریعتر بسازی… یا مثل بازندهها برگردی با مامانت زندگی کنی؟» مرد کمی مکث میکنه و با لحنی خشک جواب میده: «برگردم پیش مامانم؟ امکان نداره. همین الان خونه رو میسازم.» بلافاصله بعد از دیالوگش، افکتهای صوتی میم سریع اضافه کن: یه صدای بیسدار «یـــو!»، صدای تعجب ضعیف جمعیت و یه زوم سریع روی صورتش. بدون زیرنویس.»
قالب ویدیوی ASMR (با فوکوس ماکرو:
Shot in extreme macro perspective, [CUTTING_TOOL] cutting a [DETAILED_OBJECT_DESCRIPTION]. The [OBJECT] has [TEXTURE_DETAILS] with [VISUAL_PROPERTIES]. [OBJECT] rests on [SURFACE] bathed in [LIGHTING]. Each [ACTION] produces [AUDIO_FOCUS] in an otherwise silent room.
مثال:
«فیلمبرداری شده در نمای ماکروی شدید، یه چاقو داره یه لیچی شیشهای نرم و بینقص با جزئیات غنی رو میبره، شیشهاش ژلهماننده و سطح بیرونی بافتدار و ناهمواری شبیه پوست لیچی داره. سطحش نور رو به طور ظریف بازتاب میده و مات و نیمهشفاف با رنگهای صورتی-سفید کمرنگ به نظر میرسه. داخل شیشه صاف و براقه و یه هسته درخشان با شیبهای شیری ظریف و حبابهای خیلی ریز معلق داره. روی یه تخته برش چوبی زیر نور گرم قرار گرفته. هر برش حسابشده، یه منظره صوتی غنی ASMR تو یه اتاق کاملا ساکت ایجاد میکنه.»
قالب ژانر وحشت/تریلر
«نورپردازی تاریک و اتمسفریک با سایههای عمیق و نورپردازی انتخابی. دوربین دستی با لرزش خفیف برای ایجاد تنش. یه شخصیت به آرامی در یک [محیط ترسناک] حرکت میکنه، صدای [صدای تنشزا] از زیر پاش میاد. [عنصر ترسناک] باعث میشه اون [واکنش نشون بده]. صدا: [صداهای ترسناک]، [صدای اتمسفریک]، [موسیقی ناگهانی ترسناک]. پالت رنگی [رنگهای مشخص].»
قالب کمدی
«نورپردازی روشن و یکنواخت با دمای رنگ گرم. حرکات دوربین ثابت یا نرم برای وضوح. شخصیت در [موقعیت] با [مشکل کمدی] روبرو میشه. [عناصر کمدی]. زمانبندی خیلی مهمه—مکث قبل از گفتن پانچلاین. صدا: دیالوگ واضح، [دستورالعمل موسیقی]، [افکتهای صوتی]. با مشخص کردن «صدا: تن طبیعی اتاق، بدون صدای تماشاچی» از صدای خنده ناخواسته جلوگیری کن.»
راه حل برای ویدیوی عمودی (۹:۱۶)
در حال حاضر Veo 3 فقط به صورت پیشفرض ویدیوی افقی (۱۶:۹) میسازه. اما یه راه حل حرفهای وجود داره:
عیبیابی نهایی و نکات پیشرفته
مشکل | دلیل احتمالی | راهحل |
---|---|---|
مدل پیام میده «فقط پرامپت انگلیسی قبول میکنم» | کاراکترهای غیراستاندارد، زبانهای ترکیبی | پرامپت رو به انگلیسی واضح بازنویسی کن، ایموجیها رو حذف کن |
خطای «تولید ناموفق بود» | پرامپت خیلی طولانیه یا قوانین رو نقض میکنه | کوتاهش کن، محتوای غیرمجاز رو حذف کن |
خروجی جزئیات کمی داره | پرامپت به اندازه کافی دقیق نیست | توصیفگرهایی مثل نور، دوربین و فضا رو اضافه کن، به حالت Quality سوییچ کن |
اشیای ناخواسته ظاهر میشن | پرامپت منفی (Negative Prompt) نداری | یه پرامپت منفی با لیست کردن چیزهایی که نمیخوای اضافه کن |
حرکتها پرش دارن | سرعت زیاد دوربین در حالت Quality | سرعت دوربین رو کم کن یا از حالت Fast استفاده کن |
استراتژی پرامپتنویسی لایهای
پرامپت منفی جامع برای کنترل کیفیت
برای اینکه از شر اکثر مشکلات رایج خلاص بشی، میتونی این پرامپت منفی جامع رو به آخر دستورهات اضافه کنی:Negative prompt: no text overlays, no watermarks, no cartoon effects, no unrealistic proportions, no blurry faces, no distorted hands, no artificial lighting, no oversaturation, no poor audio quality, no lip-sync issues, no camera shake, no compression artifacts, no unprofessional appearance.
دیدگاهتان را بنویسید