راهنمای پرامپتنویسی مبتنی بر زنجیره تفکر (Chain-of-Thought)

پرامپتنویسی زنجیره تفکر (CoT) یک تکنیک پرامپتنویسی است که مدلهای زبانی بزرگ (LLM) را تشویق میکند تا مرحله به مرحله استدلال کرده و روند تفکر خود را پیش از ارائه پاسخ نهایی توضیح دهند. به جای درخواست یک پاسخ مستقیم، که چیزی است که اکثر مدلها تلاش میکنند انجام دهند. مانند «پاسخ چیست؟»، در پرامپتنویسی زنجیره تفکر کافی است یک نشانه ساده مانند «بیایید مرحله به مرحله فکر کنیم» به پرامپت اضافه شود. این کار مدل را وادار میکند فرآیند تفکر خود را آشکار کرده و یک پاسخ ناگهانی را به نتیجهای قابل اعتماد و گامبهگام تبدیل کند.
گاهی خطاها زمانی ایجاد میشوند که مدل مستقیماً به سراغ پاسخ میرود. با گسترش سطح استدلال، CoT به مدلهای LLM کمک میکند سرعت خود را کاهش دهند، وظیفه را تجزیه کنند و اشتباهات کمتری داشته باشند. البته، CoT همیشه راهحل قطعی نیست. برای مثال، در پرسشهایی که نیاز به جستجوی ساده دارند، ممکن است فقط خروجی طولانیتری ارائه دهد بدون اینکه ارزش بیشتری ایجاد کند. همچنین در برخی موارد، اگر مسئله مبهم باشد یا پرامپت بهخوبی تنظیم نشده باشد، مدل ممکن است یک منطق مرحلهبهمرحله مطمئن اما اشتباه تولید کند.
درک اشتباهات رایج و بهترین روشهای استفاده از CoT اهمیت زیادی دارد تا بتوانید آن را بهدرستی در جریانهای کاری خود به کار بگیرید. برای آشنایی بیشتر ادامه مطلب را بخوانید!
چرا پرامپتنویسی زنجیرهتفکر (COT) اهمیت دارد
بیشتر خطاهای LLM زمانی رخ میدهد که فرآیند استدلال فشرده یا حذف میشود. معمولاً مدل تنها با «تشخیص الگو» به یک پاسخ قابل قبول میرسد و ادامه میدهد. CoT با فعال کردن مسیرهای استدلالی که شبیه استنتاج انسانی هستند، این مشکل را برطرف میکند—یعنی شکستن مسئله به بخشهای کوچکتر، ارزیابی هر بخش و سپس رسیدن به یک نتیجه ترکیبی.
وظایفی که زنجیره تفکر بیشترین تأثیر را در آنها دارد:
- کارهای ریاضی و منطقی: مسائل متنی، معماهای احتمالاتی و محاسبات چندمرحلهای از ارائه مراحل میانی صریح بهرهمند میشوند.
- برنامهریزی و فرایندها: برنامه سفر، طرحهای چندمرحلهای پروژه، راهنمای استقرار و چکلیستهای عیبیابی زمانی بهبود مییابند که مدل مراحل را بهصورت مرتب و مرحله به مرحله ارائه کند.
- کارهای مبهم یا دارای محدودیتهای متعدد: وقتی ورودیها نامشخص باشند یا محدودیتها (بودجه، زمان، منابع) با هم تداخل داشته باشند، CoT کمک میکند تا مدل فرضیات و مصالحهها را آشکار کند.
در پژوهشها نشان داده شده است که پرامپتنویسی به سبک زنجیره تفکر باعث بهبود امتیاز مدلها در بنچمارکهایی مانند GSM8K (ریاضیات پایه)، MMLU (دانش گسترده و استدلال) و BIG-bench (وظایف متنوع و چالشبرانگیز) میشود. میزان بهبود دقیق بسته به مدل و نوع تنظیمات متفاوت است، اما الگو روشن است: هر زمان که یک وظیفه نیازمند استدلال باشد، زنجیره تفکر بهطور مداوم عملکرد را افزایش میدهد.
نمونههایی از پرامپتنویسی زنجیره تفکر
مثال 1: مسئله ریاضی
پرامپت:
اگر یک قطار در مدت 1.5 ساعت، 60 مایل حرکت کند، سرعت متوسط آن چقدر است؟ بیایید مرحله به مرحله فکر کنیم.
خروجی:
- اول، مسافت کل برابر با 60 مایل است.
- زمان برابر با 1.5 ساعت است.
- سرعت متوسط = مسافت ÷ زمان = 60 ÷ 1.5 = 40 مایل بر ساعت.
در اینجا چه اتفاقی میافتد؟ به جای اینکه مدل فوراً بگوید «40mph»، مسیر محاسبه را نشان میدهد. این کار به شما اجازه میدهد ورودیها (مسافت، زمان) و عملیات (تقسیم) را بررسی کنید. اگر اعداد اشتباه بودند، فوراً متوجه میشدید.
مثال 2: وظیفه منطقی یا کدنویسی
پرامپت:
یک تابع بنویسید که بررسی کند آیا یک عدد اول است یا نه. بیایید مرحله به مرحله فکر کنیم.
خروجی (نمونه):
- مرحله 1: بررسی کنید آیا عدد کمتر از 2 است. اگر چنین است، مقدار false را برگردانید.
- مرحله 2: از عدد 2 تا ریشه دوم عدد (بهصورت شامل) حلقه بزنید.
- مرحله 3: اگر عدد بر هر مقداری در این بازه بخشپذیر باشد، اول نیست.
- مرحله 4: اگر هیچ مقسومی پیدا نشود، مقدار true را برگردانید.
این رویکردی استاندارد و کارآمد برای بررسی اول بودن عدد است. ساختار CoT باعث میشود مدل الگوریتم را پیش از نوشتن کد توضیح دهد، که برای یادگیری، بازبینی کد و رفع اشکال بسیار مفید است.
چگونه از پرامپتنویسی زنجیره تفکر استفاده کنیم
هر وظیفهای نیاز به یک راهحل توضیحدادهشده ندارد. از CoT فقط زمانی استفاده کنید که واقعاً مفید باشد.
از CoT زمانی استفاده کنید که:
- وظیفه شامل منطق، ریاضی، برنامهریزی یا محدودیتهای متعدد باشد.
- نیاز دارید روند را بررسی یا آموزش دهید (آموزش، کوچینگ، بررسی کد، تحلیل داده).
- تفسیر پرسش در شکلگیری پاسخ تأثیر دارد (فرضیات مهم هستند).
- انتظار دارید خروجی را به ذینفعانی ارائه دهید که «چرایی» را هم میخواهند، نه فقط «چه چیزی» را.
از CoT زمانی صرفنظر کنید یا آن را کاهش دهید که:
- وظیفه یک سؤال ساده و مستقیم باشد («پایتخت کجاست...؟»).
- با محدودیت شدید تأخیر یا محدودیت توکن مواجه باشید.
- نیاز به پاسخی کوتاه دارید و توضیح ارزش افزودهای ایجاد نمیکند.
الگوهای مفید برای امتحان کردن:
- «بیایید مرحله به مرحله فکر کنیم.»
- «استدلال خود را بهطور مختصر توضیح بده، سپس پاسخ نهایی را در یک خط با برچسب Answer: ارائه کن.»
- «کار را با مراحل شمارهگذاریشده نشان بده و سپس نتیجه نهایی را بیان کن.»
- «وظیفه را به زیرمسئلهها تقسیم کن، هر کدام را حل کن و سپس جمعبندی را ارائه بده.»
پرامپتنویسی زنجیره تفکر در مقابل سایر روشهای پرامپتنویسی
این را مانند یک درخت تصمیم در نظر بگیرید که میتوانید بارها از آن استفاده کنید:
آیا وظیفه شما ساده و مبتنی بر واقعیت است؟
- بله ← از Zero-Shot Prompting استفاده کنید.
- نه ← ادامه دهید.
آیا الگوی مشخص یا فرمتی وجود دارد که میخواهید مدل از آن تقلید کند؟
- بله ← برای ارائه مثالها از Few-Shot Prompting استفاده کنید.
- نه ← ادامه دهید.
آیا وظیفه نیازمند استدلال است (ریاضی، منطق، برنامهریزی، ارزیابی مصالحهها)؟
بله ← از پرامپتنویسی زنجیره تفکر برای آشکارسازی مراحل استفاده کنید.
نه ← یک پرامپت کوتاه بهصورت zero-shot یا few-shot در نظر بگیرید.
توضیح مختصر مراحل بالا:
Zero-Shot Prompting
چیست: یک دستور مستقیم بدون ارائه مثال.
مناسب برای: وظایف ساده، پرسشهای مبتنی بر واقعیت، قالببندی.
نمونه: «این جمله را به فرانسوی ترجمه کن.»
Few-Shot Prompting
چیست: ارائه چند مثال برای هدایت سبک، فرمت یا نوع وظیفه.
مناسب برای: خروجیهای ساختاریافته، تقلید از الگو، حفظ سازگاری.
نمونه: ارائه دو جفت سؤالوجواب قبل از پرسش اصلی.
پیشرفتهتر: دوره مهندسی پرامپت برای افراد مبتدی - یادگیری نوشتن پرامپت در ChatGPT نمونههای دقیق few-shot و روشهای ارزیابی را نشان میدهد.
پرامپتنویسی زنجیره تفکر
چیست: درخواست از مدل برای استدلال مرحلهبهمرحله پیش از پاسخدهی.
مناسب برای: ریاضی، منطق، برنامهریزی، استدلال چندمرحلهای و وظایف مبهمی که فرضیات در آن مهم هستند.
در عمل، این رویکردها بهخوبی در کنار هم کار میکنند. بسیاری از تیمها چند مثال few-shot را با یک نشانه CoT ترکیب میکنند تا بهترین نتیجه را بگیرند: ساختار پایدار همراه با استدلال شفاف.
برای آشنایی کاملتر با مبانی پرامپتنویسی، پیشنهاد میکنیم مقاله «مهندسی پرامپت چیست؟» را نیز مطالعه کنید.
محدودیتها و ریسکهای استفاده از پرامپتنویسی زنجیره تفکر
CoT قدرتمند است، اما جادو نیست. بنابراین این ملاحظات را در ذهن داشته باشید:
- خروجیهای طولانیتر و هزینه بیشتر: توکنهای بیشتر به معنای تأخیر و هزینه بالاتر است. اگر به استدلال نیاز ندارید، آن را درخواست نکنید.
- منطق مطمئن اما اشتباه: CoT میتواند یک مسیر نادرست را بهطور قانعکننده «توضیح» دهد. با بررسی نمونهای، تست واحد یا اعتبارسنجهای خارجی از این موضوع جلوگیری کنید.
- افشای بیشازحد منطق داخلی: در زمینههای حساس (مثلاً انطباق، آزمونها)، آشکار کردن تمام زنجیره استدلال ممکن است مطلوب نباشد. به جای آن، از استدلالهای خلاصه و مختصر استفاده کنید.
- تقویت ابهام: اگر پرامپت مبهم باشد، مدل ممکن است مراحلی بسازد که منطقی به نظر برسند اما وظیفه را اشتباه تفسیر کنند. بهترین راهحل، شفافتر کردن پرامپت (دامنه، متغیرها، محدودیتها) است.
- نگرانیهای حریم خصوصی: اگر استدلال مرحلهبهمرحله شامل دادههای شخصی یا اختصاصی شود، مطمئن شوید که پرامپتها و خروجیها با سیاستهای داده سازگار هستند.
بهترین روشهای مدیریت ریسک:
- فرمت و خط پایان را مشخص کنید: «در 3 تا 6 مرحله توضیح بده و سپس پاسخ نهایی را با برچسب Answer: ارائه کن.»
- دامنه را محدود کنید: حقایق کلیدی، قوانین و محدودیتها را از ابتدا مشخص کنید تا حدسوگمان کاهش یابد.
- چک اضافه کنید: از مدل بخواهید محاسبه خود را دوباره بررسی کند («عدد نهایی را از روی مراحل مجدد محاسبه کن تا تأیید شود»).
- از استدلالهای فشرده استفاده کنید زمانی که زنجیره کامل لازم نیست: «بهطور خلاصه توضیح بده چرا، سپس پاسخ را ارائه کن.»
- اعتبارسنجی را برای وظایف تکراری خودکار کنید: برای مثال، خروجیهای ریاضی را با یک اسکریپت کوچک یا ارزیاب جدا بررسی کنید.
پرامپتنویسی زنجیره تفکر: بهترین روشها (قابل استفاده مستقیم)
از این الگوها برای دستیابی به استدلال قابل اعتماد و خوانا استفاده کنید.
1) قالب استدلال + پاسخ نهایی:
«مسئله را با توضیح استدلال خود در 3 تا 6 مرحله کوتاه حل کن. سپس نتیجه نهایی را در خطی جدید با پیشوند Answer: بیان کن.»
چرا مؤثر است: بین بخش توضیح و بخش نتیجه خط جدا ایجاد میکند، که خواندن، کپیکردن و ارزیابی آن را آسانتر میکند.
2) تجزیه، حل و ترکیب:
«وظیفه را به زیرمسئلهها تقسیم کن، هر زیرمسئله را حل کن و سپس نتایج را ترکیب کن تا پاسخ نهایی به دست آید. هر فرضی را مشخص کن.»
چرا مؤثر است: بسیاری از خطاها زمانی رخ میدهند که مدل وظیفه را تقسیم نمیکند. این پرامپت مدل را ملزم به تجزیه کار میکند.
3) بررسی منطقی:
«پس از محاسبه نتیجه، آن را با روشی دیگر یا یک تخمین سریع بررسی کن. اگر دو نتیجه همخوان نبودند، مراحل را دوباره مرور کن.»
چرا مؤثر است: مدل را تشویق میکند خطاهای خود را پیدا کند، بهویژه در ریاضی و تخمین.
4) CoT مبتنی بر محدودیت:
«استدلال خود را توضیح بده، اما فرض کن بودجه ثابت برابر با $25k است، تیم شامل 3 مهندس است و زمان عرضه 6 هفته دیگر است. این محدودیتها را در مراحل لحاظ کن.»
چرا مؤثر است: CoT زمانی بهتر عمل میکند که محدودیتهای واقعی در زنجیره استدلال گنجانده شوند. در غیر این صورت، ممکن است طرحهایی ارائه شود که روی کاغذ خوب هستند اما در عمل شکست میخورند.
5) CoT فشرده (زمانی که محدودیت توکن دارید)
«یک استدلال کوتاه 2 تا 3 مرحلهای بده، سپس پاسخ نهایی را بیان کن.»
چرا مؤثر است: مزیت «نشاندادن روند» حفظ میشود، درحالیکه هزینه و تأخیر کنترل میشود. اگر یک مسیر عملی و ساختاریافته برای استفاده از این الگوها و یادگیری روشهای ارزیابی میخواهید، در یکی از دورههای آموزش مهندسی پرامپت (Prompt Engineering) شرکت کنید.
فراتر از مبانی: جایی که CoT در کار واقعی میدرخشد
اکنون که میدانید چگونه از CoT استفاده کنید، بیایید کاربرد آن را به سناریوهای روزمره پیوند دهیم:
- راهنمای تحلیل داده: از مدل بخواهید یک نمودار یا مجموعهداده را «مرحله به مرحله» تفسیر کند، فرضیهها، بررسیها و نتیجه را بیان کند.
- بازبینی کد و یافتن باگ: از مدل بخواهید مسیر احتمالی خطا را تحلیل کرده، نقاط شکست بالقوه را فهرست کند و یک راهحل حداقلی و قابل آزمون پیشنهاد دهد.
- برنامهریزی پروژه: از مدل بخواهید برنامه را در فازهای مختلف—نیازمندیها، ریسکها، وابستگیها، نقاط عطف—ترسیم کند و سپس یک زمانبندی ارائه دهد.
- تصمیمگیری تجاری: برای قیمتگذاری، ارزیابی مصالحههای محصول یا مقایسه فروشندگان، ابتدا معیارهای تصمیمگیری را بخواهید و سپس یک توصیه رتبهبندیشده دریافت کنید.
- آموزش و کوچینگ: معلمان، مربیان و زبانآموزان میتوانند از CoT برای تقویت «چگونه فکر کردن» استفاده کنند، نه فقط «چه پاسخی دادن».
عیبیابی سریع: اگر CoT درست عمل نمیکند
- اگر خروجیها طولانی اما بیفایده هستند، دستور را دقیقتر کنید («فقط 3–6 مرحله»، «از شمارهگذاری استفاده کن، نه متن طولانی»).
- اگر مراحل منطقی به نظر میرسند اما اشتباه هستند، فرمول، تعاریف یا محدودیتهای صحیح را در پرامپت ارائه دهید.
- اگر استدلال از موضوع منحرف میشود، هدف را در پایان پرامپت دوباره بیان کنید («پاسخ نهایی باید یک عدد همراه با واحد باشد»).
- اگر تأخیر زیاد است، از CoT فشرده استفاده کنید، زمینه را کاهش دهید یا CoT را فقط برای پرسشهای دشوار به کار ببرید.
- اگر خروجیها ناسازگارند، یک بخش کوتاه few-shot با یکی دو نمونه CoT مناسب اضافه کنید تا الگو تثبیت شود.
جمعبندی
پرامپتنویسی زنجیره تفکر ایدهای ساده با تأثیری فراتر از انتظار است: از مدل بخواهید روند کار خود را نشان دهد تا به دقت بیشتر، استدلال شفافتر و نتایج قابل اعتمادتر برسید—بهویژه برای ریاضیات، منطق، برنامهریزی و هر مسئلهای که فرضیات در آن مهم هستند. این روش همهچیز را حل نمیکند و نباید در همه موارد به کار رود. اما در شرایط مناسب—و همراه با محدودیتهای دقیق، فرمتهای فشرده و اعتبارسنجی پایه—بهبود عملکرد کاملاً محسوس خواهد بود.
از کوچک شروع کنید. یک جریان کاری را انتخاب کنید که اشتباهات در آن پرهزینه یا توضیحها ضروری هستند. یک نشانه CoT اضافه کنید، یک قالب استدلال کوتاه تعیین کنید و پاسخ نهایی را مشخص و واضح دریافت کنید. تنظیم کنید، بسنجید و تکرار کنید. به مرور، یک راهنمای سبکوزن پرامپتنویسی خواهید داشت که تیم شما میتواند به آن اعتماد کند و مجموعهای از مثالها که میتوانند در وظایف، ابزارها و مدلهای مختلف دوباره استفاده شوند.
اگر میخواهید رویکردی عملیتر در استفاده از پرامپتنویسی زنجیره تفکر (و مجموعه ابزار گستردهتری که LLMها را واقعاً کاربردی میکند) داشته باشید، گیت دورههای مناسبی ارائه میدهد. این دورهها شما را با پرامپتنویسی ساختاریافته، ارزیابی و جریانهای کاری دنیای واقعی با مدلهای پیشرو همراه میکنند.
برترین دورههای مهندسی پرامپت:
برای ثبت دیدگاه وارد حساب کاربری خود شوید.