دیپ سیک (DeepSeek) چه تصویری از آینده هوش مصنوعی ترسیم می‌کند (HBR)

3.0 () 3 ماه قبل 7 دقیقه

دیپ‌سیک چه سیگنالی درباره آینده هوش مصنوعی می‌دهد

این مقاله در مجله کسب و کار هاروارد منتشر شده که منبعی معتبر و ارزشمند در حوزه کسب و کار است.

نویسنده: توبی ای. استوارت

ترجمه شده توسط تیم گیت (Git.ir)

...

عرضه مدل R1 توسط DeepSeek در اواخر ژانویه 2025 باعث افت قابل‌توجهی در ارزش بازار شرکت‌های فعال در زنجیره ارزش هوش مصنوعی شد؛ از توسعه‌دهندگان مدل‌ها گرفته تا ارائه‌دهندگان زیرساخت. سرمایه‌گذاران، R1 را به‌عنوان رقیبی قدرتمند اما کم‌هزینه برای مدل‌های تثبیت‌شده آمریکایی دیدند؛ تهدیدی برای پیش‌بینی‌های رشد بسیار خوش‌بینانه‌ای که ارزش‌گذاری‌های بالا را توجیه می‌کرد. با این حال، برای کسانی که روندها را دنبال می‌کردند، ظهور DeepSeek یا نمونه‌ای مشابه، قابل پیش‌بینی بود.

با وجود این، اکنون زمان مناسبی است برای بازاندیشی درباره مسیر آینده هوش مصنوعی. به‌جای اینکه R1 را یک نقطه عطف تعیین‌کننده بدانیم، بهتر است آن را نشانه‌ای از وضعیت فعلی و پیش‌درآمدی برای آنچه در راه است در نظر بگیریم.

در ادامه، پنج درس کلیدی برای رهبران کسب‌وکار ارائه می‌شود.

از تشخیص الگو به حل مسئله

مدل‌های زبانی بزرگ در سال‌های 2023 و 2024 توجه‌ها را به خود جلب کردند، اما در سال 2025 شاهد سیستم‌های هوش مصنوعی خواهیم بود که قادر به استدلال، برنامه‌ریزی و عمل مستقل هستند. دلیل این تحول، دو روند مهم است: ظهور مدل‌های استدلالی و ورود عامل‌های هوش مصنوعی که آماده استفاده در مقیاس واقعی هستند. این قابلیت‌ها به‌شدت به یادگیری تقویتی متکی‌اند؛ روشی برای آموزش عامل‌های هوشمند به‌گونه‌ای که بتوانند زنجیره‌ای از تصمیم‌های درست بگیرند. این فرآیند شبیه یادگیری یک بازی ویدیویی است؛ جایی که با انجام درست هر حرکت، امتیاز می‌گیرید و به‌مرور رفتارهای بهینه را یاد می‌گیرید.

نسل قبلی مدل‌ها مانند GPT-4 در تشخیص الگو فوق‌العاده بودند. آن‌ها با حجم عظیمی از داده‌ها پیش‌آموزش دیدند و با تحلیل زمینه، پاسخ‌هایی دقیق بر اساس پیش‌بینی کلمه بعدی ارائه می‌دادند.

اما DeepSeek R1 یک مدل استدلالی در دسترس عموم است؛ مشابه مدل‌های جدیدی مانند ChatGPT o3-mini از OpenAI و Copilot o1 از مایکروسافت. این مدل‌ها نشان‌دهنده گذار مهمی از پیش‌بینی احتمالی کلمات به حل مسئله به‌صورت گام‌به‌گام هستند؛ رویکردی که به‌شدت بر یادگیری تقویتی تکیه دارد. این توانایی باعث می‌شود آن‌ها در انجام برخی وظایف، مانند حل مسائل ریاضی، عملکرد بسیار بهتری نسبت به نسل قبل داشته باشند. همان‌طور که انسان‌ها برای ضرب اعداد بزرگ نیاز دارند مسئله را مرحله‌به‌مرحله حل کنند، این مدل‌ها نیز به‌طور فزاینده‌ای چنین کاری انجام می‌دهند.

با این توانایی در تجزیه و تحلیل مسائل، عامل‌های هوش مصنوعی می‌توانند در جریان انجام وظایف، به‌صورت پویا در فرآیندهای پیچیده حرکت کنند و با اطلاعات جدید سازگار شوند، نه اینکه به اسکریپت‌های ثابت و از پیش تعریف‌شده محدود باشند. این دقیقاً مشابه کاری است که انسان‌ها در محیط کار انجام می‌دهند؛ از پاسخ‌گویی کارشناسان پشتیبانی به مشتریان گرفته تا برنامه‌ریزی سفر توسط کارکنان اداری و تحلیل داده توسط تحلیلگران.

نقطه عطف اقتصادی هوش مصنوعی

یکی از تیترهای مهم درباره DeepSeek R1، هزینه توسعه حدود 5.5 میلیون دلاری آن بود. اما این عدد می‌تواند گمراه‌کننده باشد، زیرا احتمالاً فقط هزینه یک مرحله آموزش را شامل می‌شود و هزینه‌های زیرساخت، مهندسی و استقرار را در بر نمی‌گیرد. در مجموع، هزینه واقعی بسیار بالاتر است؛ هرچند همچنان کمتر از هزینه توسعه مدل‌هایی مانند OpenAI، Anthropic یا Google.

به‌جای تمرکز صرف بر این اعداد، باید بیشتر به هزینه‌های استفاده از مدل‌ها پس از آموزش توجه کنیم؛ یعنی «هزینه استنتاج». آموزش مدل‌ها سرمایه‌گذاری اولیه بالایی نیاز دارد، اما هزینه‌های استنتاج برای کاربردهای سازمانی اهمیت بیشتری دارند. مدل‌هایی مانند DeepSeek R1 و همچنین مدل‌های جدیدی مثل سری Llama از Meta، کاهش قابل‌توجهی در این هزینه‌ها ایجاد کرده‌اند.

به‌طور کلی، کاهش قیمت‌ها باعث افزایش رقابت و رشد استفاده می‌شود. کافی است به روند کاهش قیمت در بازار محصولات الکترونیکی مانند گوشی‌های هوشمند، تلویزیون‌ها و لپ‌تاپ‌ها نگاه کنیم که به‌واسطه پیشرفت در تولید نیمه‌هادی‌ها رخ داده است. این همان قانون مور است که با کاهش هزینه‌ها، نرخ پذیرش فناوری را افزایش می‌دهد. اکنون همین روند در حوزه هوش مصنوعی نیز در حال تکرار است.

هوش مصنوعی متن‌باز و اختصاصی در کنار هم وجود خواهند داشت

یکی از دلایلی که باید انتظار ظهور مدلی مانند DeepSeek R1 را داشت، اقتصاد پایه‌ای نرم‌افزارهای متن‌باز است. در طول تاریخ، پروژه‌های متن‌باز بارها با کاهش چشمگیر هزینه‌ها، راهکارهای اختصاصی را به چالش کشیده‌اند؛ از Unix/Linux در رایانش سازمانی گرفته تا Android در سیستم‌عامل‌های موبایل، MySQL در پایگاه‌های داده و البته Llama در حوزه هوش مصنوعی. مزیت هزینه‌ای نرم‌افزارهای متن‌باز کاملاً مستند است و طبیعی بود که هوش مصنوعی نیز همین مسیر را طی کند.

در حوزه هوش مصنوعی، مدل‌های اختصاصی شرکت‌هایی مانند OpenAI، Alphabet و Anthropic همچنان در زمینه‌هایی مانند قابلیت‌های چندوجهی، امنیت (برای مثال، به نظر می‌رسد دور زدن محدودیت‌های DeepSeek R1 آسان‌تر باشد) و سایر شاخص‌ها در سطح پیشرو قرار دارند. با این حال، مدل‌های با وزن باز مانند DeepSeek R1 فاصله خود را در استدلال متنی به‌شدت کاهش داده‌اند و از نظر بهره‌وری نیز بسیار قابل‌توجه هستند.

پتانسیل کاربردهای سازمانی این مدل زمانی آشکار شد که مایکروسافت به‌سرعت تصمیم گرفت DeepSeek R1 را در Azure ادغام کند. به دلیل هزینه کمتر و انعطاف‌پذیری بالاتر، مدل‌های باز مانند DeepSeek R1 برای کاربران بسیار جذاب خواهند بود. همچنین مدل‌های زبانی کوچک‌تر، مانند Phi-4 از مایکروسافت، نیز در بسیاری از کاربردها عملکرد قدرتمندی نشان داده‌اند.

در حال حاضر، به نظر می‌رسد با بازاری مواجه خواهیم بود که در آن بازیگران متنوعی حضور دارند، نه یک سناریوی «برنده همه‌چیز را می‌برد».

کمبود تراشه، محرک نوآوری الگوریتمی است

بخش دیگری از واکنش‌ها به DeepSeek R1 به این موضوع مربوط می‌شود که چین ظاهراً فاصله خود را با ایالات متحده در توسعه مدل‌های پیشرفته هوش مصنوعی کاهش داده است. محدودیت‌های صادراتی آمریکا با هدف محدود کردن دسترسی چین به پیشرفته‌ترین نیمه‌هادی‌ها و حفظ برتری شرکت‌های آمریکایی در تحقیق و توسعه هوش مصنوعی اعمال شده بود. برخی معتقدند همین موضوع نشان می‌دهد که چنین محدودیت‌هایی همچنان ضروری است.

اما اینکه این سیاست‌ها کاملاً موفق نبوده‌اند، چندان هم غافلگیرکننده نیست. همان ضرب‌المثل قدیمی را به یاد بیاورید: «نیاز، مادر اختراع است». محدودیت در دسترسی به تراشه‌ها باعث شده پژوهشگران چینی به‌جای تکیه بر توان محاسباتی بالا، بر کارایی الگوریتم‌ها تمرکز کنند؛ رویکردی که با توجه به افزایش شدید مصرف انرژی مراکز داده، می‌تواند بسیار آینده‌نگرانه باشد.

در واقع، کیفیت و ظرافت پژوهش‌های الگوریتمی در چین از قبل نیز قابل‌توجه بوده است. اکوسیستم مدل‌های زبانی بزرگ در این کشور به‌سرعت رشد کرده و تنها در سال گذشته، 117 مدل برای استفاده عمومی در دسترس بوده است. با وجود محدودیت‌های سخت‌گیرانه در داده‌های آموزشی و خروجی‌ها، بسیاری از این مدل‌ها در رتبه‌بندی‌های جهانی رقابت‌پذیر هستند، به‌ویژه در پردازش زبان چینی عملکرد بسیار خوبی دارند.

همچنین، چین از نیروی انسانی بسیار توانمندی در حوزه هوش مصنوعی برخوردار است. خود DeepSeek تیم تحقیقاتی بسیار خلاقی دارد و عمق استعدادهای AI در این کشور چشمگیر است.

دیپ‌سیک R1 همه‌چیز را تغییر نداد

با وجود تمام این تحولات، آزمایشگاه‌های بزرگ هوش مصنوعی و شرکت‌های عظیم فناوری در غرب، از جمله Microsoft، Meta، Alphabet و Amazon، همچنان با شدت بالا به سرمایه‌گذاری ادامه خواهند داد. این موضوع باعث می‌شود تقاضا برای پردازنده‌های گرافیکی پیشرفته و زیرساخت‌های هوش مصنوعی در سطح بالایی باقی بماند. مدل‌های متن‌باز جایگزین کامل مدل‌های اختصاصی نخواهند شد و احتمالاً شاهد مصرف عظیم منابع محاسباتی برای آموزش و اجرای مدل‌ها خواهیم بود.

در نتیجه، رقابت فشرده برای توسعه پیشرفته‌ترین سیستم‌های هوش مصنوعی ادامه پیدا می‌کند و همچنان تقاضا برای تراشه‌های قدرتمند و زیرساخت‌های ابری در مقیاس بزرگ را افزایش می‌دهد، حتی در شرایطی که هزینه سرمایه‌گذاری برای بسیاری از بازیگران این صنعت از درآمدهایشان پیشی گرفته است.

از سوی دیگر، خریداران بزرگ زیرساخت در غرب به‌شدت نگران ریسک تأمین هستند، زیرا بخش عمده‌ای از نیمه‌هادی‌های پیشرفته در کارخانه‌های TSMC در تایوان تولید می‌شود. با توجه به تنش‌های ژئوپلیتیک میان آمریکا و چین و اهمیت استراتژیک تایوان، احتمالاً این شرکت‌ها به فکر ذخیره‌سازی ظرفیت محاسباتی خواهند بود.

سرعت پیشرفت هوش مصنوعی و اهمیت اقتصادی و اجتماعی آن، به‌سختی با نمونه‌ای در تاریخ قابل مقایسه است. با پیشرفت یادگیری تقویتی و شکل‌گیری مدل‌های استدلالی و عامل‌های هوش مصنوعی، که به ایجاد کاربردهای بی‌شماری منجر خواهند شد، آینده نزدیک پر از لحظاتی مشابه «دیپ‌سیک» خواهد بود. باید انتظار پیشرفت مداوم، افزایش کاربردهای واقعی و آغاز یک تحول عمیق در ساختار اقتصاد را داشت.

جمع‌بندی

عرضه DeepSeek R1 نشان‌دهنده حرکت به‌سوی مدل‌های مبتنی بر استدلال و عامل‌های هوش مصنوعی است که توانایی حل مسئله دارند. این رویداد علاوه بر نمایش پیشرفت‌های چین در حوزه AI، روندهایی مانند کاهش هزینه‌ها، گسترش مدل‌های متن‌باز و ادامه رقابت میان مدل‌های اختصاصی و باز را نیز تقویت می‌کند.

گذار از تشخیص الگو به حل مسئله. مدل DeepSeek نشان داد که هوش مصنوعی در حال حرکت به سمت استدلال و تصمیم‌گیری مستقل است.
کاهش هزینه‌های هوش مصنوعی. کاهش هزینه‌های استفاده از مدل‌ها، مشابه روندی که در صنعت الکترونیک دیده‌ایم، باعث افزایش پذیرش این فناوری می‌شود.
رقابت میان مدل‌های متن‌باز و اختصاصی. DeepSeek R1 به‌عنوان یک مدل باز، هزینه‌ها را کاهش می‌دهد، اما مدل‌های اختصاصی همچنان در برخی قابلیت‌ها برتری دارند.
نوآوری الگوریتمی در چین. محدودیت‌های نیمه‌هادی باعث شده چین بر بهینه‌سازی الگوریتم‌ها تمرکز کند و پیشرفت‌های قابل‌توجهی به دست آورد.
رشد توقف‌ناپذیر هوش مصنوعی. با ادامه سرمایه‌گذاری شرکت‌های بزرگ، توسعه سریع AI و تحول اقتصادی گسترده ادامه خواهد داشت.

دیدگاه ها

برای ثبت دیدگاه وارد حساب کاربری خود شوید.