دیپ سیک (DeepSeek) چه تصویری از آینده هوش مصنوعی ترسیم میکند (HBR)

این مقاله در مجله کسب و کار هاروارد منتشر شده که منبعی معتبر و ارزشمند در حوزه کسب و کار است.
نویسنده: توبی ای. استوارت
ترجمه شده توسط تیم گیت (Git.ir)
عرضه مدل R1 توسط DeepSeek در اواخر ژانویه 2025 باعث افت قابلتوجهی در ارزش بازار شرکتهای فعال در زنجیره ارزش هوش مصنوعی شد؛ از توسعهدهندگان مدلها گرفته تا ارائهدهندگان زیرساخت. سرمایهگذاران، R1 را بهعنوان رقیبی قدرتمند اما کمهزینه برای مدلهای تثبیتشده آمریکایی دیدند؛ تهدیدی برای پیشبینیهای رشد بسیار خوشبینانهای که ارزشگذاریهای بالا را توجیه میکرد. با این حال، برای کسانی که روندها را دنبال میکردند، ظهور DeepSeek یا نمونهای مشابه، قابل پیشبینی بود.
با وجود این، اکنون زمان مناسبی است برای بازاندیشی درباره مسیر آینده هوش مصنوعی. بهجای اینکه R1 را یک نقطه عطف تعیینکننده بدانیم، بهتر است آن را نشانهای از وضعیت فعلی و پیشدرآمدی برای آنچه در راه است در نظر بگیریم.
در ادامه، پنج درس کلیدی برای رهبران کسبوکار ارائه میشود.
از تشخیص الگو به حل مسئله
مدلهای زبانی بزرگ در سالهای 2023 و 2024 توجهها را به خود جلب کردند، اما در سال 2025 شاهد سیستمهای هوش مصنوعی خواهیم بود که قادر به استدلال، برنامهریزی و عمل مستقل هستند. دلیل این تحول، دو روند مهم است: ظهور مدلهای استدلالی و ورود عاملهای هوش مصنوعی که آماده استفاده در مقیاس واقعی هستند. این قابلیتها بهشدت به یادگیری تقویتی متکیاند؛ روشی برای آموزش عاملهای هوشمند بهگونهای که بتوانند زنجیرهای از تصمیمهای درست بگیرند. این فرآیند شبیه یادگیری یک بازی ویدیویی است؛ جایی که با انجام درست هر حرکت، امتیاز میگیرید و بهمرور رفتارهای بهینه را یاد میگیرید.
نسل قبلی مدلها مانند GPT-4 در تشخیص الگو فوقالعاده بودند. آنها با حجم عظیمی از دادهها پیشآموزش دیدند و با تحلیل زمینه، پاسخهایی دقیق بر اساس پیشبینی کلمه بعدی ارائه میدادند.
اما DeepSeek R1 یک مدل استدلالی در دسترس عموم است؛ مشابه مدلهای جدیدی مانند ChatGPT o3-mini از OpenAI و Copilot o1 از مایکروسافت. این مدلها نشاندهنده گذار مهمی از پیشبینی احتمالی کلمات به حل مسئله بهصورت گامبهگام هستند؛ رویکردی که بهشدت بر یادگیری تقویتی تکیه دارد. این توانایی باعث میشود آنها در انجام برخی وظایف، مانند حل مسائل ریاضی، عملکرد بسیار بهتری نسبت به نسل قبل داشته باشند. همانطور که انسانها برای ضرب اعداد بزرگ نیاز دارند مسئله را مرحلهبهمرحله حل کنند، این مدلها نیز بهطور فزایندهای چنین کاری انجام میدهند.
با این توانایی در تجزیه و تحلیل مسائل، عاملهای هوش مصنوعی میتوانند در جریان انجام وظایف، بهصورت پویا در فرآیندهای پیچیده حرکت کنند و با اطلاعات جدید سازگار شوند، نه اینکه به اسکریپتهای ثابت و از پیش تعریفشده محدود باشند. این دقیقاً مشابه کاری است که انسانها در محیط کار انجام میدهند؛ از پاسخگویی کارشناسان پشتیبانی به مشتریان گرفته تا برنامهریزی سفر توسط کارکنان اداری و تحلیل داده توسط تحلیلگران.
نقطه عطف اقتصادی هوش مصنوعی
یکی از تیترهای مهم درباره DeepSeek R1، هزینه توسعه حدود 5.5 میلیون دلاری آن بود. اما این عدد میتواند گمراهکننده باشد، زیرا احتمالاً فقط هزینه یک مرحله آموزش را شامل میشود و هزینههای زیرساخت، مهندسی و استقرار را در بر نمیگیرد. در مجموع، هزینه واقعی بسیار بالاتر است؛ هرچند همچنان کمتر از هزینه توسعه مدلهایی مانند OpenAI، Anthropic یا Google.
بهجای تمرکز صرف بر این اعداد، باید بیشتر به هزینههای استفاده از مدلها پس از آموزش توجه کنیم؛ یعنی «هزینه استنتاج». آموزش مدلها سرمایهگذاری اولیه بالایی نیاز دارد، اما هزینههای استنتاج برای کاربردهای سازمانی اهمیت بیشتری دارند. مدلهایی مانند DeepSeek R1 و همچنین مدلهای جدیدی مثل سری Llama از Meta، کاهش قابلتوجهی در این هزینهها ایجاد کردهاند.
بهطور کلی، کاهش قیمتها باعث افزایش رقابت و رشد استفاده میشود. کافی است به روند کاهش قیمت در بازار محصولات الکترونیکی مانند گوشیهای هوشمند، تلویزیونها و لپتاپها نگاه کنیم که بهواسطه پیشرفت در تولید نیمههادیها رخ داده است. این همان قانون مور است که با کاهش هزینهها، نرخ پذیرش فناوری را افزایش میدهد. اکنون همین روند در حوزه هوش مصنوعی نیز در حال تکرار است.
هوش مصنوعی متنباز و اختصاصی در کنار هم وجود خواهند داشت
یکی از دلایلی که باید انتظار ظهور مدلی مانند DeepSeek R1 را داشت، اقتصاد پایهای نرمافزارهای متنباز است. در طول تاریخ، پروژههای متنباز بارها با کاهش چشمگیر هزینهها، راهکارهای اختصاصی را به چالش کشیدهاند؛ از Unix/Linux در رایانش سازمانی گرفته تا Android در سیستمعاملهای موبایل، MySQL در پایگاههای داده و البته Llama در حوزه هوش مصنوعی. مزیت هزینهای نرمافزارهای متنباز کاملاً مستند است و طبیعی بود که هوش مصنوعی نیز همین مسیر را طی کند.
در حوزه هوش مصنوعی، مدلهای اختصاصی شرکتهایی مانند OpenAI، Alphabet و Anthropic همچنان در زمینههایی مانند قابلیتهای چندوجهی، امنیت (برای مثال، به نظر میرسد دور زدن محدودیتهای DeepSeek R1 آسانتر باشد) و سایر شاخصها در سطح پیشرو قرار دارند. با این حال، مدلهای با وزن باز مانند DeepSeek R1 فاصله خود را در استدلال متنی بهشدت کاهش دادهاند و از نظر بهرهوری نیز بسیار قابلتوجه هستند.
پتانسیل کاربردهای سازمانی این مدل زمانی آشکار شد که مایکروسافت بهسرعت تصمیم گرفت DeepSeek R1 را در Azure ادغام کند. به دلیل هزینه کمتر و انعطافپذیری بالاتر، مدلهای باز مانند DeepSeek R1 برای کاربران بسیار جذاب خواهند بود. همچنین مدلهای زبانی کوچکتر، مانند Phi-4 از مایکروسافت، نیز در بسیاری از کاربردها عملکرد قدرتمندی نشان دادهاند.
در حال حاضر، به نظر میرسد با بازاری مواجه خواهیم بود که در آن بازیگران متنوعی حضور دارند، نه یک سناریوی «برنده همهچیز را میبرد».
کمبود تراشه، محرک نوآوری الگوریتمی است
بخش دیگری از واکنشها به DeepSeek R1 به این موضوع مربوط میشود که چین ظاهراً فاصله خود را با ایالات متحده در توسعه مدلهای پیشرفته هوش مصنوعی کاهش داده است. محدودیتهای صادراتی آمریکا با هدف محدود کردن دسترسی چین به پیشرفتهترین نیمههادیها و حفظ برتری شرکتهای آمریکایی در تحقیق و توسعه هوش مصنوعی اعمال شده بود. برخی معتقدند همین موضوع نشان میدهد که چنین محدودیتهایی همچنان ضروری است.
اما اینکه این سیاستها کاملاً موفق نبودهاند، چندان هم غافلگیرکننده نیست. همان ضربالمثل قدیمی را به یاد بیاورید: «نیاز، مادر اختراع است». محدودیت در دسترسی به تراشهها باعث شده پژوهشگران چینی بهجای تکیه بر توان محاسباتی بالا، بر کارایی الگوریتمها تمرکز کنند؛ رویکردی که با توجه به افزایش شدید مصرف انرژی مراکز داده، میتواند بسیار آیندهنگرانه باشد.
در واقع، کیفیت و ظرافت پژوهشهای الگوریتمی در چین از قبل نیز قابلتوجه بوده است. اکوسیستم مدلهای زبانی بزرگ در این کشور بهسرعت رشد کرده و تنها در سال گذشته، 117 مدل برای استفاده عمومی در دسترس بوده است. با وجود محدودیتهای سختگیرانه در دادههای آموزشی و خروجیها، بسیاری از این مدلها در رتبهبندیهای جهانی رقابتپذیر هستند، بهویژه در پردازش زبان چینی عملکرد بسیار خوبی دارند.
همچنین، چین از نیروی انسانی بسیار توانمندی در حوزه هوش مصنوعی برخوردار است. خود DeepSeek تیم تحقیقاتی بسیار خلاقی دارد و عمق استعدادهای AI در این کشور چشمگیر است.
دیپسیک R1 همهچیز را تغییر نداد
با وجود تمام این تحولات، آزمایشگاههای بزرگ هوش مصنوعی و شرکتهای عظیم فناوری در غرب، از جمله Microsoft، Meta، Alphabet و Amazon، همچنان با شدت بالا به سرمایهگذاری ادامه خواهند داد. این موضوع باعث میشود تقاضا برای پردازندههای گرافیکی پیشرفته و زیرساختهای هوش مصنوعی در سطح بالایی باقی بماند. مدلهای متنباز جایگزین کامل مدلهای اختصاصی نخواهند شد و احتمالاً شاهد مصرف عظیم منابع محاسباتی برای آموزش و اجرای مدلها خواهیم بود.
در نتیجه، رقابت فشرده برای توسعه پیشرفتهترین سیستمهای هوش مصنوعی ادامه پیدا میکند و همچنان تقاضا برای تراشههای قدرتمند و زیرساختهای ابری در مقیاس بزرگ را افزایش میدهد، حتی در شرایطی که هزینه سرمایهگذاری برای بسیاری از بازیگران این صنعت از درآمدهایشان پیشی گرفته است.
از سوی دیگر، خریداران بزرگ زیرساخت در غرب بهشدت نگران ریسک تأمین هستند، زیرا بخش عمدهای از نیمههادیهای پیشرفته در کارخانههای TSMC در تایوان تولید میشود. با توجه به تنشهای ژئوپلیتیک میان آمریکا و چین و اهمیت استراتژیک تایوان، احتمالاً این شرکتها به فکر ذخیرهسازی ظرفیت محاسباتی خواهند بود.
سرعت پیشرفت هوش مصنوعی و اهمیت اقتصادی و اجتماعی آن، بهسختی با نمونهای در تاریخ قابل مقایسه است. با پیشرفت یادگیری تقویتی و شکلگیری مدلهای استدلالی و عاملهای هوش مصنوعی، که به ایجاد کاربردهای بیشماری منجر خواهند شد، آینده نزدیک پر از لحظاتی مشابه «دیپسیک» خواهد بود. باید انتظار پیشرفت مداوم، افزایش کاربردهای واقعی و آغاز یک تحول عمیق در ساختار اقتصاد را داشت.
جمعبندی
عرضه DeepSeek R1 نشاندهنده حرکت بهسوی مدلهای مبتنی بر استدلال و عاملهای هوش مصنوعی است که توانایی حل مسئله دارند. این رویداد علاوه بر نمایش پیشرفتهای چین در حوزه AI، روندهایی مانند کاهش هزینهها، گسترش مدلهای متنباز و ادامه رقابت میان مدلهای اختصاصی و باز را نیز تقویت میکند.
گذار از تشخیص الگو به حل مسئله. مدل DeepSeek نشان داد که هوش مصنوعی در حال حرکت به سمت استدلال و تصمیمگیری مستقل است.
کاهش هزینههای هوش مصنوعی. کاهش هزینههای استفاده از مدلها، مشابه روندی که در صنعت الکترونیک دیدهایم، باعث افزایش پذیرش این فناوری میشود.
رقابت میان مدلهای متنباز و اختصاصی. DeepSeek R1 بهعنوان یک مدل باز، هزینهها را کاهش میدهد، اما مدلهای اختصاصی همچنان در برخی قابلیتها برتری دارند.
نوآوری الگوریتمی در چین. محدودیتهای نیمههادی باعث شده چین بر بهینهسازی الگوریتمها تمرکز کند و پیشرفتهای قابلتوجهی به دست آورد.
رشد توقفناپذیر هوش مصنوعی. با ادامه سرمایهگذاری شرکتهای بزرگ، توسعه سریع AI و تحول اقتصادی گسترده ادامه خواهد داشت.
برای ثبت دیدگاه وارد حساب کاربری خود شوید.