راهنمای پرامپت‌نویسی مبتنی بر زنجیره تفکر (Chain-of-Thought)

4.5 () 1 هفته قبل 10 دقیقه

راهنمای پرامپت‌نویسی زنجیره‌ تفکر (Chain-of-Thought)

پرامپت‌نویسی زنجیره‌ تفکر (CoT) یک تکنیک پرامپت‌نویسی است که مدل‌های زبانی بزرگ (LLM) را تشویق می‌کند تا مرحله به مرحله استدلال کرده و روند تفکر خود را پیش از ارائه پاسخ نهایی توضیح دهند. به جای درخواست یک پاسخ مستقیم، که چیزی است که اکثر مدل‌ها تلاش می‌کنند انجام دهند. مانند «پاسخ چیست؟»، در پرامپت‌نویسی زنجیره‌ تفکر کافی است یک نشانه ساده مانند «بیایید مرحله به مرحله فکر کنیم» به پرامپت اضافه شود. این کار مدل را وادار می‌کند فرآیند تفکر خود را آشکار کرده و یک پاسخ ناگهانی را به نتیجه‌ای قابل اعتماد و گام‌به‌گام تبدیل کند.

گاهی خطاها زمانی ایجاد می‌شوند که مدل مستقیماً به سراغ پاسخ می‌رود. با گسترش سطح استدلال، CoT به مدل‌های LLM کمک می‌کند سرعت خود را کاهش دهند، وظیفه را تجزیه کنند و اشتباهات کمتری داشته باشند. البته، CoT همیشه راه‌حل قطعی نیست. برای مثال، در پرسش‌هایی که نیاز به جستجوی ساده دارند، ممکن است فقط خروجی طولانی‌تری ارائه دهد بدون اینکه ارزش بیشتری ایجاد کند. همچنین در برخی موارد، اگر مسئله مبهم باشد یا پرامپت به‌خوبی تنظیم نشده باشد، مدل ممکن است یک منطق مرحله‌به‌مرحله مطمئن اما اشتباه تولید کند.

درک اشتباهات رایج و بهترین روش‌های استفاده از CoT اهمیت زیادی دارد تا بتوانید آن را به‌درستی در جریان‌های کاری خود به کار بگیرید. برای آشنایی بیشتر ادامه مطلب را بخوانید!

چرا پرامپت‌نویسی زنجیره‌تفکر (COT) اهمیت دارد

بیشتر خطاهای LLM زمانی رخ می‌دهد که فرآیند استدلال فشرده یا حذف می‌شود. معمولاً مدل تنها با «تشخیص الگو» به یک پاسخ قابل قبول می‌رسد و ادامه می‌دهد. CoT با فعال‌ کردن مسیرهای استدلالی که شبیه استنتاج انسانی هستند، این مشکل را برطرف می‌کند—یعنی شکستن مسئله به بخش‌های کوچک‌تر، ارزیابی هر بخش و سپس رسیدن به یک نتیجه ترکیبی.

وظایفی که زنجیره‌ تفکر بیشترین تأثیر را در آن‌ها دارد:

کارهای ریاضی و منطقی: مسائل متنی، معماهای احتمالاتی و محاسبات چندمرحله‌ای از ارائه مراحل میانی صریح بهره‌مند می‌شوند.
برنامه‌ریزی و فرایندها: برنامه سفر، طرح‌های چندمرحله‌ای پروژه، راهنمای استقرار و چک‌لیست‌های عیب‌یابی زمانی بهبود می‌یابند که مدل مراحل را به‌صورت مرتب و مرحله به مرحله ارائه کند.
کارهای مبهم یا دارای محدودیت‌های متعدد: وقتی ورودی‌ها نامشخص باشند یا محدودیت‌ها (بودجه، زمان، منابع) با هم تداخل داشته باشند، CoT کمک می‌کند تا مدل فرضیات و مصالحه‌ها را آشکار کند.

در پژوهش‌ها نشان داده شده است که پرامپت‌نویسی به سبک زنجیره‌ تفکر باعث بهبود امتیاز مدل‌ها در بنچمارک‌هایی مانند GSM8K (ریاضیات پایه)، MMLU (دانش گسترده و استدلال) و BIG-bench (وظایف متنوع و چالش‌برانگیز) می‌شود. میزان بهبود دقیق بسته به مدل و نوع تنظیمات متفاوت است، اما الگو روشن است: هر زمان که یک وظیفه نیازمند استدلال باشد، زنجیره‌ تفکر به‌طور مداوم عملکرد را افزایش می‌دهد.

نمونه‌هایی از پرامپت‌نویسی زنجیره‌ تفکر

مثال 1: مسئله ریاضی

پرامپت:
اگر یک قطار در مدت 1.5 ساعت، 60 مایل حرکت کند، سرعت متوسط آن چقدر است؟ بیایید مرحله به مرحله فکر کنیم.

خروجی:

اول، مسافت کل برابر با 60 مایل است.
زمان برابر با 1.5 ساعت است.
سرعت متوسط = مسافت ÷ زمان = 60 ÷ 1.5 = 40 مایل بر ساعت.

در اینجا چه اتفاقی می‌افتد؟ به جای اینکه مدل فوراً بگوید «40mph»، مسیر محاسبه را نشان می‌دهد. این کار به شما اجازه می‌دهد ورودی‌ها (مسافت، زمان) و عملیات (تقسیم) را بررسی کنید. اگر اعداد اشتباه بودند، فوراً متوجه می‌شدید.

مثال 2: وظیفه منطقی یا کدنویسی

پرامپت:
یک تابع بنویسید که بررسی کند آیا یک عدد اول است یا نه. بیایید مرحله به مرحله فکر کنیم.

خروجی (نمونه):

مرحله 1: بررسی کنید آیا عدد کمتر از 2 است. اگر چنین است، مقدار false را برگردانید.
مرحله 2: از عدد 2 تا ریشه دوم عدد (به‌صورت شامل) حلقه بزنید.
مرحله 3: اگر عدد بر هر مقداری در این بازه بخش‌پذیر باشد، اول نیست.
مرحله 4: اگر هیچ مقسومی پیدا نشود، مقدار true را برگردانید.

این رویکردی استاندارد و کارآمد برای بررسی اول بودن عدد است. ساختار CoT باعث می‌شود مدل الگوریتم را پیش از نوشتن کد توضیح دهد، که برای یادگیری، بازبینی کد و رفع اشکال بسیار مفید است.

چگونه از پرامپت‌نویسی زنجیره‌ تفکر استفاده کنیم

هر وظیفه‌ای نیاز به یک راه‌حل توضیح‌داده‌شده ندارد. از CoT فقط زمانی استفاده کنید که واقعاً مفید باشد.

از CoT زمانی استفاده کنید که:

وظیفه شامل منطق، ریاضی، برنامه‌ریزی یا محدودیت‌های متعدد باشد.
نیاز دارید روند را بررسی یا آموزش دهید (آموزش، کوچینگ، بررسی کد، تحلیل داده).
تفسیر پرسش در شکل‌گیری پاسخ تأثیر دارد (فرضیات مهم هستند).
انتظار دارید خروجی را به ذینفعانی ارائه دهید که «چرایی» را هم می‌خواهند، نه فقط «چه چیزی» را.

از CoT زمانی صرف‌نظر کنید یا آن را کاهش دهید که:

وظیفه یک سؤال ساده و مستقیم باشد («پایتخت کجاست...؟»).
با محدودیت شدید تأخیر یا محدودیت توکن مواجه باشید.
نیاز به پاسخی کوتاه دارید و توضیح ارزش افزوده‌ای ایجاد نمی‌کند.

الگوهای مفید برای امتحان کردن:

«بیایید مرحله به مرحله فکر کنیم.»
«استدلال خود را به‌طور مختصر توضیح بده، سپس پاسخ نهایی را در یک خط با برچسب Answer: ارائه کن.»
«کار را با مراحل شماره‌گذاری‌شده نشان بده و سپس نتیجه نهایی را بیان کن.»
«وظیفه را به زیرمسئله‌ها تقسیم کن، هر کدام را حل کن و سپس جمع‌بندی را ارائه بده.»

پرامپت‌نویسی زنجیره‌ تفکر در مقابل سایر روش‌های پرامپت‌نویسی

این را مانند یک درخت تصمیم در نظر بگیرید که می‌توانید بارها از آن استفاده کنید:

آیا وظیفه‌ شما ساده و مبتنی بر واقعیت است؟

بله ← از Zero-Shot Prompting استفاده کنید.
نه ← ادامه دهید.

آیا الگوی مشخص یا فرمتی وجود دارد که می‌خواهید مدل از آن تقلید کند؟

بله ← برای ارائه مثال‌ها از Few-Shot Prompting استفاده کنید.
نه ← ادامه دهید.

آیا وظیفه نیازمند استدلال است (ریاضی، منطق، برنامه‌ریزی، ارزیابی مصالحه‌ها)؟
- بله ← از پرامپت‌نویسی زنجیره‌ تفکر برای آشکارسازی مراحل استفاده کنید.
- نه ← یک پرامپت کوتاه به‌صورت zero-shot یا few-shot در نظر بگیرید.

توضیح مختصر مراحل بالا:

Zero-Shot Prompting
- چیست: یک دستور مستقیم بدون ارائه مثال.
- مناسب برای: وظایف ساده، پرسش‌های مبتنی بر واقعیت، قالب‌بندی.
- نمونه: «این جمله را به فرانسوی ترجمه کن.»
Few-Shot Prompting
- چیست: ارائه چند مثال برای هدایت سبک، فرمت یا نوع وظیفه.
- مناسب برای: خروجی‌های ساختاریافته، تقلید از الگو، حفظ سازگاری.
- نمونه: ارائه دو جفت سؤال‌وجواب قبل از پرسش اصلی.
- پیشرفته‌تر: دوره مهندسی پرامپت برای افراد مبتدی - یادگیری نوشتن پرامپت در ChatGPT نمونه‌های دقیق few-shot و روش‌های ارزیابی را نشان می‌دهد.
پرامپت‌نویسی زنجیره‌ تفکر
- چیست: درخواست از مدل برای استدلال مرحله‌به‌مرحله پیش از پاسخ‌دهی.
- مناسب برای: ریاضی، منطق، برنامه‌ریزی، استدلال چندمرحله‌ای و وظایف مبهمی که فرضیات در آن مهم هستند.

در عمل، این رویکردها به‌خوبی در کنار هم کار می‌کنند. بسیاری از تیم‌ها چند مثال few-shot را با یک نشانه CoT ترکیب می‌کنند تا بهترین نتیجه را بگیرند: ساختار پایدار همراه با استدلال شفاف.

برای آشنایی کامل‌تر با مبانی پرامپت‌نویسی، پیشنهاد می‌کنیم مقاله «مهندسی پرامپت چیست؟» را نیز مطالعه کنید.

محدودیت‌ها و ریسک‌های استفاده از پرامپت‌نویسی زنجیره‌ تفکر

CoT قدرتمند است، اما جادو نیست. بنابراین این ملاحظات را در ذهن داشته باشید:

خروجی‌های طولانی‌تر و هزینه بیشتر: توکن‌های بیشتر به معنای تأخیر و هزینه بالاتر است. اگر به استدلال نیاز ندارید، آن را درخواست نکنید.
منطق مطمئن اما اشتباه: CoT می‌تواند یک مسیر نادرست را به‌طور قانع‌کننده «توضیح» دهد. با بررسی نمونه‌ای، تست واحد یا اعتبارسنج‌های خارجی از این موضوع جلوگیری کنید.
افشای بیش‌ازحد منطق داخلی: در زمینه‌های حساس (مثلاً انطباق، آزمون‌ها)، آشکار کردن تمام زنجیره استدلال ممکن است مطلوب نباشد. به جای آن، از استدلال‌های خلاصه و مختصر استفاده کنید.
تقویت ابهام: اگر پرامپت مبهم باشد، مدل ممکن است مراحلی بسازد که منطقی به نظر برسند اما وظیفه را اشتباه تفسیر کنند. بهترین راه‌حل، شفاف‌تر کردن پرامپت (دامنه، متغیرها، محدودیت‌ها) است.
نگرانی‌های حریم خصوصی: اگر استدلال مرحله‌به‌مرحله شامل داده‌های شخصی یا اختصاصی شود، مطمئن شوید که پرامپت‌ها و خروجی‌ها با سیاست‌های داده سازگار هستند.

بهترین روش‌های مدیریت ریسک:

فرمت و خط پایان را مشخص کنید: «در 3 تا 6 مرحله توضیح بده و سپس پاسخ نهایی را با برچسب Answer: ارائه کن.»
دامنه را محدود کنید: حقایق کلیدی، قوانین و محدودیت‌ها را از ابتدا مشخص کنید تا حدس‌وگمان کاهش یابد.
چک اضافه کنید: از مدل بخواهید محاسبه خود را دوباره بررسی کند («عدد نهایی را از روی مراحل مجدد محاسبه کن تا تأیید شود»).
از استدلال‌های فشرده استفاده کنید زمانی که زنجیره کامل لازم نیست: «به‌طور خلاصه توضیح بده چرا، سپس پاسخ را ارائه کن.»
اعتبارسنجی را برای وظایف تکراری خودکار کنید: برای مثال، خروجی‌های ریاضی را با یک اسکریپت کوچک یا ارزیاب جدا بررسی کنید.

پرامپت‌نویسی زنجیره‌ تفکر: بهترین روش‌ها (قابل استفاده مستقیم)

از این الگوها برای دستیابی به استدلال قابل اعتماد و خوانا استفاده کنید.

1) قالب استدلال + پاسخ نهایی:

«مسئله را با توضیح استدلال خود در 3 تا 6 مرحله کوتاه حل کن. سپس نتیجه نهایی را در خطی جدید با پیشوند Answer: بیان کن.»

چرا مؤثر است: بین بخش توضیح و بخش نتیجه خط جدا ایجاد می‌کند، که خواندن، کپی‌کردن و ارزیابی آن را آسان‌تر می‌کند.

2) تجزیه، حل و ترکیب:

«وظیفه را به زیرمسئله‌ها تقسیم کن، هر زیرمسئله را حل کن و سپس نتایج را ترکیب کن تا پاسخ نهایی به دست آید. هر فرضی را مشخص کن.»

چرا مؤثر است: بسیاری از خطاها زمانی رخ می‌دهند که مدل وظیفه را تقسیم نمی‌کند. این پرامپت مدل را ملزم به تجزیه کار می‌کند.

3) بررسی منطقی:

«پس از محاسبه نتیجه، آن را با روشی دیگر یا یک تخمین سریع بررسی کن. اگر دو نتیجه همخوان نبودند، مراحل را دوباره مرور کن.»

چرا مؤثر است: مدل را تشویق می‌کند خطاهای خود را پیدا کند، به‌ویژه در ریاضی و تخمین.

4) CoT مبتنی بر محدودیت:

«استدلال خود را توضیح بده، اما فرض کن بودجه ثابت برابر با $25k است، تیم شامل 3 مهندس است و زمان عرضه 6 هفته دیگر است. این محدودیت‌ها را در مراحل لحاظ کن.»

چرا مؤثر است: CoT زمانی بهتر عمل می‌کند که محدودیت‌های واقعی در زنجیره استدلال گنجانده شوند. در غیر این صورت، ممکن است طرح‌هایی ارائه شود که روی کاغذ خوب هستند اما در عمل شکست می‌خورند.

5) CoT فشرده (زمانی که محدودیت توکن دارید)

«یک استدلال کوتاه 2 تا 3 مرحله‌ای بده، سپس پاسخ نهایی را بیان کن.»

چرا مؤثر است: مزیت «نشان‌دادن روند» حفظ می‌شود، درحالی‌که هزینه و تأخیر کنترل می‌شود. اگر یک مسیر عملی و ساختاریافته برای استفاده از این الگوها و یادگیری روش‌های ارزیابی می‌خواهید، در یکی از دوره‌های آموزش مهندسی پرامپت (Prompt Engineering) شرکت کنید.

فراتر از مبانی: جایی که CoT در کار واقعی می‌درخشد

اکنون که می‌دانید چگونه از CoT استفاده کنید، بیایید کاربرد آن را به سناریوهای روزمره پیوند دهیم:

راهنمای تحلیل داده: از مدل بخواهید یک نمودار یا مجموعه‌داده را «مرحله به مرحله» تفسیر کند، فرضیه‌ها، بررسی‌ها و نتیجه را بیان کند.
بازبینی کد و یافتن باگ: از مدل بخواهید مسیر احتمالی خطا را تحلیل کرده، نقاط شکست بالقوه را فهرست کند و یک راه‌حل حداقلی و قابل آزمون پیشنهاد دهد.
برنامه‌ریزی پروژه: از مدل بخواهید برنامه را در فازهای مختلف—نیازمندی‌ها، ریسک‌ها، وابستگی‌ها، نقاط عطف—ترسیم کند و سپس یک زمان‌بندی ارائه دهد.
تصمیم‌گیری تجاری: برای قیمت‌گذاری، ارزیابی مصالحه‌های محصول یا مقایسه فروشندگان، ابتدا معیارهای تصمیم‌گیری را بخواهید و سپس یک توصیه رتبه‌بندی‌شده دریافت کنید.
آموزش و کوچینگ: معلمان، مربیان و زبان‌آموزان می‌توانند از CoT برای تقویت «چگونه فکر کردن» استفاده کنند، نه فقط «چه پاسخی دادن».

عیب‌یابی سریع: اگر CoT درست عمل نمی‌کند

اگر خروجی‌ها طولانی اما بی‌فایده هستند، دستور را دقیق‌تر کنید («فقط 3–6 مرحله»، «از شماره‌گذاری استفاده کن، نه متن طولانی»).
اگر مراحل منطقی به نظر می‌رسند اما اشتباه هستند، فرمول، تعاریف یا محدودیت‌های صحیح را در پرامپت ارائه دهید.
اگر استدلال از موضوع منحرف می‌شود، هدف را در پایان پرامپت دوباره بیان کنید («پاسخ نهایی باید یک عدد همراه با واحد باشد»).
اگر تأخیر زیاد است، از CoT فشرده استفاده کنید، زمینه را کاهش دهید یا CoT را فقط برای پرسش‌های دشوار به کار ببرید.
اگر خروجی‌ها ناسازگارند، یک بخش کوتاه few-shot با یکی دو نمونه CoT مناسب اضافه کنید تا الگو تثبیت شود.

جمع‌بندی

پرامپت‌نویسی زنجیره‌ تفکر ایده‌ای ساده با تأثیری فراتر از انتظار است: از مدل بخواهید روند کار خود را نشان دهد تا به دقت بیشتر، استدلال شفاف‌تر و نتایج قابل اعتمادتر برسید—به‌ویژه برای ریاضیات، منطق، برنامه‌ریزی و هر مسئله‌ای که فرضیات در آن مهم هستند. این روش همه‌چیز را حل نمی‌کند و نباید در همه موارد به کار رود. اما در شرایط مناسب—و همراه با محدودیت‌های دقیق، فرمت‌های فشرده و اعتبارسنجی پایه—بهبود عملکرد کاملاً محسوس خواهد بود.

از کوچک شروع کنید. یک جریان کاری را انتخاب کنید که اشتباهات در آن پرهزینه یا توضیح‌ها ضروری هستند. یک نشانه CoT اضافه کنید، یک قالب استدلال کوتاه تعیین کنید و پاسخ نهایی را مشخص و واضح دریافت کنید. تنظیم کنید، بسنجید و تکرار کنید. به مرور، یک راهنمای سبک‌وزن پرامپت‌نویسی خواهید داشت که تیم شما می‌تواند به آن اعتماد کند و مجموعه‌ای از مثال‌ها که می‌توانند در وظایف، ابزارها و مدل‌های مختلف دوباره استفاده شوند.

اگر می‌خواهید رویکردی عملی‌تر در استفاده از پرامپت‌نویسی زنجیره‌ تفکر (و مجموعه ابزار گسترده‌تری که LLMها را واقعاً کاربردی می‌کند) داشته باشید، گیت دوره‌های مناسبی ارائه می‌دهد. این دوره‌ها شما را با پرامپت‌نویسی ساختاریافته، ارزیابی و جریان‌های کاری دنیای واقعی با مدل‌های پیشرو همراه می‌کنند.

برترین دوره‌های مهندسی پرامپت:

دیدگاه ها

برای ثبت دیدگاه وارد حساب کاربری خود شوید.