میدجرنی چیست و چگونه از آن استفاده کنیم؟ راهنمای کامل کار با Midjourney
د بتوانید تنها با نوشتن چند کلمه، تصاویر خارقالعاده و چشمنواز خلق کنید. دیگر نیازی به سالها تمرین نقاشی یا تسلط بر نرمافزارهای پیچیده طراحی نیست! هوش مصنوعی Midjourney این رویا را به حقیقت تبدیل کرده است. این ابزار قدرتمند، نه تنها برای هنرمندان و طراحان حرفهای یک انقلاب محسوب میشود، بلکه به هر کسی که ایدهای در ذهن دارد و میخواهد آن را به تصویر بکشد، فرصتهای بینظیری میدهد. از ساخت ایدههای تبلیغاتی و طراحیهای مفهومی گرفته تا تصاویر پروفایل شخصی و آثار هنری منحصر به فرد، Midjourney افقهای جدیدی را در برابر خلاقیت ما گشوده است.
در این مقاله جامع، به طور عمیق به بررسی Midjourney، نحوه کار با آن، دستورات کاربردی و پیشرفتهاش، مقایسه آن با سایر ابزارهای مشابه و نگاهی به آینده درخشان این فناوری خواهیم پرداخت.
هوش مصنوعی Midjourney چیست و چگونه کار میکند
Midjourney یک برنامه هوش مصنوعی مولد است که به طور خاص برای تولید تصاویر از توصیفات متنی (Text-to-Image) طراحی شده است. این ابزار پیشرفته، بر اساس مدلهای پیچیده یادگیری عمیق (مانند شبکههای عصبی و ترانسفورمرها) فعالیت میکند. این مدلها توانایی شگفتانگیزی در درک و ترجمه کلمات به مفاهیم بصری دارند. به زبان ساده، شما ایدههای خود را به صورت متن مینویسید و Midjourney آن را به یک اثر هنری بصری خیرهکننده تبدیل میکند.
این فناوری توسط آزمایشگاه تحقیقاتی مستقل Midjourney Inc. توسعه یافته و از طریق یک ربات دیسکورد (Discord bot) در دسترس کاربران قرار میگیرد. این شیوه دسترسی، به شما اجازه میدهد به راحتی و از طریق یک پلتفرم ارتباطی محبوب، با این هوش مصنوعی قدرتمند تعامل داشته باشید.
راهنمای گامبهگام ساخت تصویر با Midjourney: خلق آثار هنری در چند دقیقه
برای شروع کار با Midjourney و خلق اولین تصاویر خود، کافیست مراحل زیر را دنبال کنید. همانطور که گفته شد، Midjourney عمدتاً از طریق دیسکورد عمل میکند و شما با استفاده از دستورات متنی با ربات آن تعامل خواهید داشت:
عضویت در دیسکورد: اگر هنوز حساب کاربری دیسکورد ندارید، ابتدا یک حساب رایگان و سریع در وبسایت Discord ایجاد کنید.
پیوستن به سرور Midjourney: به وبسایت رسمی Midjourney (midjourney.com) بروید و روی دکمه “Join the Beta” یا “Sign In” کلیک کنید تا به سرور دیسکورد رسمی Midjourney هدایت شوید.
پذیرش قوانین و مقررات: پس از ورود به سرور، معمولاً باید قوانین و شرایط استفاده را مطالعه و تأیید کنید.
ورود به کانالهای تولید تصویر: در نوار کناری سمت چپ دیسکورد، به یکی از کانالهای مشخص شده برای تولید تصویر، مانند کانالهای “newbies” (تازهکاران) یا کانالهایی با نامهای عددی (مثلاً newbies-1)، بروید.
استفاده از دستور اصلی /imagine: در کادر پیامرسان دیسکورد، دستور /imagine را تایپ کنید. با فشار دادن کلید Space یا Enter، یک فیلد متنی به نام prompt ظاهر میشود.
وارد کردن پرامپت (توصیف متنی) ایدهآل شما: در فیلد prompt، توصیف دقیق و خلاقانه خود را از تصویری که میخواهید ایجاد کنید، بنویسید. هرچه توصیف شما دقیقتر، جزئیتر و غنیتر باشد، Midjourney میتواند تصویر مطلوبتری خلق کند.
مثال: برای خلق تصویری از “یک قصر باستانی شناور در آسمان، احاطه شده با ابرهای صورتی و بنفش در هنگام طلوع آفتاب، با سبک فانتزی حماسی و جزئیات فراوان”، کافیست همین توصیف را وارد کنید.
تأیید و تولید تصویر: پس از وارد کردن توصیف، کلید Enter را فشار دهید. ربات Midjourney شروع به پردازش میکند. این فرآیند ممکن است چند ثانیه تا یک دقیقه طول بکشد و در نهایت، چهار تصویر اولیه بر اساس توصیف شما تولید میشود.
انتخاب و ویرایش تصاویر (Upscale و Variations): زیر چهار تصویر تولید شده، دکمههایی با برچسبهای U1, U2, U3, U4 (برای افزایش وضوح) و V1, V2, V3, V4 (برای ایجاد تنوع) مشاهده خواهید کرد:
U (Upscale – افزایش وضوح): با کلیک روی هر دکمه U، Midjourney نسخه با وضوح بالاتر و جزئیات بیشتر از آن تصویر را تولید میکند.
V (Variations – ایجاد تنوع): با کلیک روی هر دکمه V، Midjourney چهار نسخه جدید و متفاوت از آن تصویر را بر اساس سبک و محتوای آن تولید میکند.
Refresh (فلش دایرهای): این دکمه به شما امکان میدهد چهار تصویر جدید را بر اساس همان توصیف اولیه تولید کنید.
دستورات کاربردی و پیشرفته در Midjourney: کنترل کامل بر آفرینش!
Midjourney مجموعهای غنی از دستورات و پارامترها را ارائه میدهد که به شما امکان میدهد کنترل بینظیری بر خروجی نهایی داشته باشید. این دستورات پس از توصیف اصلی و با — اضافه میشوند:
–ar <عرض>:<ارتفاع> (نسبت تصویر): برای تعیین نسبت عرض به ارتفاع تصویر.
مثال: برای یک منظره عریض، مانند “یک منظره کوهستانی باشکوه با رودخانهای خروشان –ar 16:9”.
–v <نسخه> (نسخه مدل): برای انتخاب نسخه خاصی از مدل هوش مصنوعی Midjourney. (مثلاً –v 6.0 برای جدیدترین و پیشرفتهترین نسخه).
مثال: برای “یک جنگل پریان عجیب و غریب با قارچهای درخشان –v 6.0”.
–style (سبک خام): (از نسخه V6 به بعد) برای خروجی خامتر و کمتر “استایلدار” که کنترل بیشتری بر واقعگرایی میدهد.
مثال: برای “یک فانوس دریایی قدیمی در ساحل طوفانی” با تمرکز بر جزئیات واقعگرایانه، از “–style raw” استفاده کنید.
–seed <عدد> (سید یا بذر): با استفاده از یک عدد مشخص، میتوانید تولید تصاویری با نتایج مشابه در دفعات بعدی را تضمین کنید. برای آزمایش و بهبود پرامپت یا تولید تغییرات جزئی مفید است.
–no <کلمه یا عبارت> (حذف عنصر): برای حذف عناصر خاصی که نمیخواهید در تصویر نهایی ظاهر شوند.
مثال: “یک باغ زیبا –no گلهای قرمز”.
–quality <0.25 | 0.5 | 1 | 2> (کیفیت تصویر): میزان زمان صرف شده برای پردازش و در نتیجه کیفیت و جزئیات تصویر را کنترل میکند (کیفیتهای بالاتر مصرف اعتبار بیشتری دارند).
مثال: برای “یک پرتره با جزئیات بسیار بالا از یک پیرمرد با چروکهای صورت مشخص –quality 2”.
–stylize <عدد> (میزان سبکسازی): میزان “هنری” بودن و “زیبایی” تصویر را کنترل میکند. مقادیر بالاتر منجر به تصاویر هنریتر و زندهتر میشوند.
مثال: برای “یک منظره آرام” با سبکسازی هنریتر، از “–stylize 1000” استفاده کنید.
–chaos <عدد> (میزان آشفتگی/تنوع): میزان تنوع در نتایج اولیه را کنترل میکند. مقادیر بالاتر نتایج متنوعتر و غیرقابل پیشبینیتر ایجاد میکنند.
مثال: برای “یک وسیله نقلیه آیندهنگر” که میخواهید تنوع زیادی در طرحهای اولیه آن ببینید، از “–chaos 50” استفاده کنید.
/blend (ترکیب تصاویر): این دستور به شما امکان میدهد تا چندین تصویر (معمولاً ۲ تا ۵) را با هم ترکیب کنید تا یک تصویر جدید ایجاد شود.
/settings: یک منوی تنظیمات شخصی را نمایش میدهد که میتوانید تنظیمات پیشفرض خود را برای کیفیت، سبکسازی و نسخه مدل تغییر دهید.
Midjourney در مقابل DALL-E: دو غول در دنیای خلق تصویر
Midjourney و DALL-E (توسعهیافته توسط OpenAI) دو رقیب اصلی و قدرتمند در زمینه تولید تصویر از متن هستند. هر دو قابلیتهای چشمگیری دارند، اما تفاوتهای کلیدی در رویکرد، قابلیتها و نوع خروجی نهایی آنها وجود دارد:
سبک هنری و زیباییشناسی
Midjourney: در تولید تصاویری با سبک هنری قوی و زیباییشناسی خاص سرآمد است. خروجیهای آن اغلب فانتزی، سورئال، حماسی، و با اتمسفر عمیق، واقعگرا، سینمایی و با نورپردازی چشمنواز هستند. اگر به دنبال آثار هنری خیرهکننده با سبک منحصر به فرد هستید، Midjourney انتخاب اول شماست.
DALL-E: خروجیهای متنوعتر و واقعگرایانهتر ارائه میدهد، با تأکید بیشتر بر دقت در بازتولید عناصر. این ابزار برای تصاویر محصول، گرافیکهای سادهتر، یا تصاویری که نیاز به دقت بالا در جزئیات دارند، کاربرد بیشتری دارد. DALL-E تلاش میکند تا هر چیزی را که توصیف میکنید، دقیقاً همانطور که هست، به تصویر بکشد.
دقت در درک توصیف و کنترلپذیری
Midjourney: برای نتایج مطلوب، نیاز به توصیفات خلاقانه و تا حدودی انتزاعی دارد. درک آن از مفاهیم و حالات انتزاعی قوی است و از پارامترهای متعدد برای کنترل خروجی پشتیبانی میکند.
DALL-E: درک بسیار قوی از دستورات دقیق و پیچیده دارد و توانایی تولید تصاویر با جزئیات دقیق را به خوبی انجام میدهد. همچنین، قابلیتهای دقیقی مانند “Inpainting” (تغییر بخشی از تصویر) و “Outpainting” (گسترش تصویر موجود) را ارائه میدهد.
رابط کاربری و دسترسی
Midjourney: عمدتاً از طریق دیسکورد و با دستورات متنی کار میکند که ممکن است برای کاربران جدید کمی ناآشنا باشد.
DALL-E: معمولاً از طریق یک رابط کاربری وب ساده و بصری در دسترس است که استفاده از آن را برای عموم کاربران آسانتر میکند.
سرعت تولید و مدلهای کسبوکار
Midjourney: در تولید چهار تصویر اولیه سریع عمل میکند، اما عملیات Upscale ممکن است کمی زمانبر باشد. این سرویس دارای پلنهای اشتراکی ماهانه یا سالانه است.
DALL-E: معمولاً سرعت بالایی در تولید تصاویر دارد و از سیستم اعتباری (Credit-based) استفاده میکند.
جامعه کاربری و بهروزرسانیها
Midjourney: دارای یک جامعه بسیار فعال و پرشور در دیسکورد است که کاربران به طور مداوم آثار و نکات خود را به اشتراک میگذارند. بهروزرسانیهای مکرر با نسخههای جدید مدل نیز از ویژگیهای آن است.
DALL-E: نیز جامعه کاربری فعالی دارد، اما کمتر بر جنبههای هنری متمرکز است و بیشتر برای کاربردهای تجاری و گرافیکی استفاده میشود.
نتیجهگیری در مقایسه: اگر هدف اصلی شما خلق آثار هنری بصری خیرهکننده، فانتزی، سورئال، یا تصاویر سینمایی با سبک و اتمسفر خاص است، Midjourney بدون شک انتخاب بهتری است. اما اگر به دقت بالا در بازتولید اشیاء، تولید تصاویر محصول، یا قابلیتهای پیشرفته ویرایش و گسترش تصاویر موجود نیاز دارید، DALL-E ممکن است مناسبتر باشد. بسیاری از کاربران حرفهای از هر دو ابزار برای اهداف مختلف استفاده میکنند، زیرا هر کدام نقاط قوت منحصر به فرد خود را دارند و مکمل یکدیگرند.
آیا Midjourney قابل دانلود است؟ دسترسی به یک سرویس ابری
هوش مصنوعی Midjourney به معنای واقعی کلمه یک “نرمافزار قابل دانلود” نیست. همانطور که قبلاً اشاره شد، Midjourney یک سرویس مبتنی بر ابر (Cloud-based Service) است. این بدان معناست که هسته اصلی هوش مصنوعی و پردازشهای سنگین آن بر روی سرورهای قدرتمند Midjourney در اینترنت انجام میشود و نتایج به کاربران ارسال میگردد. شما به جای “دانلود” و نصب یک نرمافزار، به این سرویس “دسترسی” پیدا میکنید.
نحوه دسترسی به Midjourney
از طریق دیسکورد (رایجترین و اصلیترین راه): با پیوستن به سرور رسمی Midjourney در دیسکورد، میتوانید از طریق ربات Midjourney در کانالهای مشخص شده، با آن تعامل داشته باشید و دستورات خود را برای تولید تصویر ارسال کنید. برای تجربه کاربری بهتر، میتوانید برنامه دسکتاپ یا اپلیکیشن موبایل دیسکورد را دانلود و نصب کنید، اما این برنامه صرفاً برای دسترسی به پلتفرم دیسکورد است و نه خود Midjourney.
از طریق وبسایت (نسخه آلفا/بتا برای کاربران خاص): Midjourney در حال توسعه یک رابط کاربری وب است که به کاربران امکان میدهد بدون نیاز به دیسکورد، تصاویر را مستقیماً از طریق وبسایت اختصاصی Midjourney ایجاد و مدیریت کنند. این قابلیت در حال حاضر ممکن است در مرحله آزمایشی (آلفا یا بتا) باشد و برای همه کاربران در دسترس نباشد یا فقط برای مشترکین پیشرفته فعال باشد. برای اطلاع از وضعیت دسترسی، باید به وبسایت رسمی Midjourney مراجعه کنید.
Midjourney هم ابزاری قدرتمند برای تولید تصویر است و هم خلاقیت انسان را پرورش میدهد. این فناوری به هنرمندان، طراحان، نویسندگان، و حتی افراد عادی این امکان را میدهد تا ایدههای بصری خود را بدون نیاز به مهارتهای پیچیده نقاشی، طراحی یا مدلسازی سهبعدی، به واقعیت تبدیل کنند. با ادامه پیشرفت این فناوری، مرزهای آنچه میتوانیم با هوش مصنوعی خلق کنیم، همچنان گسترش خواهد یافت و دنیایی از امکانات جدید و بیسابقه را پیش روی ما قرار خواهد داد.