آموزشگاه فن آوران آریا
ثبت نام
تصویری که توسط هوش مصنوعی از یک گربه خاکستری بازیگوش در یک پارک در طول روز تولید شده است.

نحوه ایجاد تصاویر هوش مصنوعی با کیفیت بالا

امین پناهی زاده

تسلط بر دستورهای واضح و دقیق، کلید تولید تصاویر هوش مصنوعی با ChatGPT است. اما دستورالعمل‌ها چگونه کار می‌کنند و چگونه می‌توانیم آنها را بهتر کنیم؟

اصول پایه

اعلان‌های هوش مصنوعی به طور کلی با اعلان‌های شفاف و ساختاریافته مؤثرتر عمل می‌کنند. برای تصاویر هوش مصنوعی، شما همیشه می خواهید موضوع یا تمرکز اصلی تصویر را به همراه زمینه و جزئیات مشخص کنید و اطلاعاتی در مورد سبک و زیبایی شناسی (مانند سبک هنری) ارائه دهید. با این حال، چیزهای بیشتری برای آن وجود دارد که در این راهنما بررسی خواهیم کرد، همراه با درخواست هایی که می توانید خودتان آن را اصلاح کنید.

من از ChatGPT (DALL-E) برای تولید تصاویر هوش مصنوعی خود استفاده خواهم کرد، اما شما می توانید از ابزارهای دیگری مانند Midjourney یا Stable Diffusion استفاده کنید—همه آنها متفاوت هستند!. شما باید یک مشترک ChatGPT Plus باشید تا بتوانید در تولید تصویر با هوش مصنوعی حرفه ای عمل کنید. با این حال، به عنوان یک کاربر رایگان، روزی دو نسل تصویر دریافت می کنید. تولید تصویر با هوش مصنوعی منابع قابل توجهی را می گیرد و رایگان نیست.

از زبان طبیعی و محاوره ای استفاده کنید

به طور کلی، بهترین کار این است که از زبان محاوره ای و ساده در هنگام ایجاد درخواست های خود استفاده کنید. هر چه با اعلان دقیق تر و واضح تر باشید، نتایج بهتری خواهید داشت. از آنجایی که ChatGPT یک ربات چت است، در مورد نحوه صحبت انسان در مکالمه و همچنین آگاهی از زمینه آموزش داده شده است.

همه مولدهای تصویر مبتنی بر هوش مصنوعی زبان طبیعی را می‌فهمند، اما همه آن‌ها این کار را به یک اندازه خوب انجام نمی‌دهند، بنابراین نتایج شما ممکن است بسته به پیچیدگی ابزار متفاوت باشد.

 

آیا درخواست طولانی تر همیشه بهتر است؟

توجه به این نکته مهم است که برخی از مولدهای تصویر هوش مصنوعی با جملات طولانی تر (50+ کلمه) به خوبی کار می کنند، در حالی که برخی دیگر با جمله کوتاه 10-20 کلمه بهتر کار می کنند. ایده خوبی است که طول های مختلف را آزمایش کنید تا بر اساس نیازهای منحصر به فرد شما، بهترین عملکرد را برای هر ابزاری پیدا کنید. من متوجه شده ام که ChatGPT با درخواست های مستقیم و دقیق تر بهتر کار می کند. هر چه دقیق تر و واضح تر باشید، بهتر است.

اعلان‌های بیش از حد پیچیده یا پرمخاطب گاهی می‌توانند هوش مصنوعی را گیج کنند. این در مورد تعادل است – اعلان های دقیق و در عین حال واضح که مؤثرترین کار را دارند.

با این حال، بهتر است از استفاده از عباراتی که معانی متناقضی دارند خودداری کنید زیرا ممکن است باعث سردرگمی مولد هوش مصنوعی شود. به عنوان مثال، استفاده از کلماتی مانند “روشن” و “شب” ممکن است معانی مختلفی داشته باشد.

مثال کوتاه کوتاه:

تصویری از یک گربه خاکستری بازیگوش در یک پارک در طول روز ایجاد کنید.

در اینجا تصویر تولید شده است:
تصویر ایجاد شده توسط هوش مصنوعی از یک گربه خاکستری در پارک.

مثال سریع طولانی:

یک گربه خاکستری تیره بازیگوش با خزهای نرم و کرکی در پارکی سرسبز در زیر نور گرم روز. گربه یک پروانه در حال بال زدن را در نزدیکی تکه ای از گل های وحشی تعقیب می کند. نور خورشید به آرامی از میان درختان عبور می‌کند و سایه‌های ناهمواری روی زمین می‌اندازد. خلق و خوی شاد و پر جنب و جوش، با سبکی واقع گرایانه، هایپررئال، واقعی و نمای لانگ شات است.

در اینجا تصویر تولید شده است:
تصویری که توسط هوش مصنوعی از یک گربه خاکستری بازیگوش در یک پارک در طول روز تولید شده است.

به اسم های مشخص برای موضوع اصلی بچسبید

وقتی نوبت به نوشتن در مورد موضوع اصلی می‌رسد، می‌خواهید از اسم‌ها و چیزهایی که می‌توانید ببینید، مانند چیزهای زنده یا فیزیکی یا مکان‌ها استفاده کنید. خوب، نه فقط چیزهایی که می توانید ببینید، بلکه هر چیزی که با حواس پنج گانه قابل درک باشد.

با این حال، مفاهیم انتزاعی تر مانند “خوشبختی”، “روشنگری” و “ترس” به بیان خلاقانه تری اجازه می دهند، اما احتمال کمتری وجود دارد که تصویر خروجی با هر دیدی که دارید مطابقت داشته باشد. بنابراین بهتر است این اصطلاحات را با واژگان خاص تر ترکیب کنید.

از زبان توصیفی استفاده کنید

گام بعدی این است که زمینه و جزئیات را نه تنها به سوژه خود اضافه کنید، بلکه همچنین می‌خواهید پس‌زمینه چگونه به نظر برسد. ساده ترین راه برای افزودن زمینه و جزئیات، در نظر گرفتن سه عنصر کلیدی است:

  • آنچه اتفاق می افتد یا آنچه سوژه انجام می دهد.
  • چگونه اتفاق می افتد – شیوه یا سبک.
  • جایی که در حال وقوع است – محیط یا محیط.

می توانید صفت هایی اضافه کنید تا به تصاویر خود عمق بیشتری بدهید. وقتی صحبت از صفت ها به میان می آید، بهترین کار این است که یک زوج بدون شلوغی دستور اضافه کنید تا به بهترین شکل با تصاویری که می خواهید تولید کنید مطابقت داشته باشد.

از مثال های ارائه شده برای هر دسته به عنوان راهنما برای کمک به ایجاد درخواست خود استفاده کنید:

  • خلق و خوی: آرام، پرانرژی، غم انگیز، رویایی، قدیمی، پرتعلیق، شاد، طنز، وهم انگیز.
  • نورپردازی: روشن، خاموش، نور پس‌زمینه، طبیعی، ساعت طلایی، نئون، صمیمی، مهتابی، کنتراست بالا و خنک.
  • محیط: شهری، طبیعی، حومه شهر، فانتزی، تاریخی، زیر آب، شهر کوچک، حرفه ای.
  • شخصیت: فرمانده، محتاط، ماجراجو، گریزان، گستاخ، پیچیده، ناهموار، پرورش دهنده.
  • رنگ: تک رنگ، رنگ های بی صدا، چشمگیر، خاکی، فلورسنت، فلزی، رنگ های سرد، رنگ های گرم.
  • سبک: رئالیستی، انتزاعی، مینیمالیستی، حداکثری، کارتونی، قدیمی، معاصر، آوانگارد.

اعلان ساده:

تصویری از یک خیابان با دوچرخه سواری در آن ایجاد کنید.

در اینجا تصویر تولید شده است:
تصویری که توسط هوش مصنوعی از خیابانی با دوچرخه سواری در حال حرکت در آن است.

اعلان تقویت شده با صفت:

یک خیابان سنگ‌فرش‌شده عجیب در دهکده‌ای اروپایی، با ردیفی از خانه‌های پاستلی رنگ که با جعبه‌های گل تزئین شده‌اند. نور خورشید صبح زود سایه‌های ملایمی ایجاد می‌کند و یک دوچرخه‌سوار با آرامش در خیابان رکاب می‌زند. یک کافه با صندلی در فضای باز در گوشه ای نشسته و عابران را دعوت می کند. خلق و خوی شاد، دعوت کننده و به طرز نوستالژیکی گرم است.

در اینجا تصویر تولید شده است:
تصویری از یک خیابان دهکده اروپایی که توسط هوش مصنوعی ایجاد شده و دوچرخه سواری در آن سوار شده است.

ترکیب بندی را فراموش نکنید

کادربندی یکی از بخش‌های کلیدی در ایجاد تصاویری که با هوش مصنوعی تولید می‌شوند از نظر بصری قابل توجه است، زیرا نحوه چیدمان عناصر و نحوه برخورد سوژه به بیننده را شکل می‌دهد. برای مثال، می‌توانید از «کلوزآپ»، «شات متوسط»، «شات عریض» یا «نقطه دید» برای تعیین زاویه و فاصله استفاده کنید. با ارائه جزئیات کادربندی، تصویر به احتمال زیاد با دید شما مطابقت دارد.

اعلان ساده:

“تصویری از یک شیر در طبیعت بسازید.”

در اینجا تصویر تولید شده است:
تصویر تولید شده توسط هوش مصنوعی از یک شیر در طبیعت.

درخواست پیشرفته:

«تصویر عکسی از یک شیر سلطنتی که بر فراز صخره‌ای نور خورشید در طبیعت آرام گرفته است و اطراف آن را علف‌های ساوانای طلایی احاطه کرده است. این صحنه درخشش ملایم غروب خورشید را با آسمان به رنگ های نارنجی و صورتی به تصویر می کشد. در پس‌زمینه، درختان اقاقیا در افق پراکنده‌اند و نسیم ملایمی علف‌های بلند را به هم می‌زند. خلق و خوی آرام و در عین حال قدرتمند است.»

در اینجا تصویر تولید شده است:
تصویری از یک شیر در حیات وحش که توسط هوش مصنوعی ایجاد شده است.

شناخت محدودیت های خلاقانه

همانطور که تولید متن با هوش مصنوعی محدودیت هایی دارد، در تولید تصویر و خلاقیت نیز محدودیت هایی برای هوش مصنوعی وجود دارد. فاقد دیدگاه انسانی و همچنین تجربه و احساسات شخصی از زندگی واقعی است. از آنجایی که هوش مصنوعی از داده ها (عمدتا داده های آنلاین) و قوانین آموزشی آموزش می بیند، کیفیت، عمق انسانی و تنوع داده های مورد استفاده در آموزش آن محدود می شود.

به نظر من، هیچ اصالت واقعی وجود ندارد. برخلاف انسان‌ها که می‌توانند خود را به روش‌های خارج از چارچوب بیان کنند، اما می‌تواند ابزار خوبی باشد که در کنار خلاقیت انسان کار می‌کند.

مطلب مرتبط:Copilot (هوش مصنوعی) در ویندوز ظاهر جدیدی پیدا می کندآموزش هوش مصنوعی در کسب و کار

امین پناهی زاده
نویسنده: امین پناهی زاده
تعداد نوشته ها:353

خلاصه از نویسنده:

دیدگاه کاربران

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

مقالات مشابه
© تمامی حقوق برای فن آوران آریا محفوظ میباشد.