آموزشگاه فن آوران آریا > مقالات > Deepseek چیست؟

Deepseek چیست؟

2025/01/30

امین پناهی زاده

اینترنت با نام “DeepSeek” پر شده است. شرکت‌های هوش مصنوعی مانند OpenAI و NVIDIA شاهد کاهش قیمت سهام خود هستند و علاقه‌مندان به هوش مصنوعی در سراسر جهان دست‌های خود را با خوشحالی به هم می‌مالند. چرا این تازه وارد به دنیای هوش مصنوعی اینقدر بزرگ است؟

DeepSeek یک هوش مصنوعی منبع باز با ادعاهای بزرگ است

DeepSeek مانند GPT-o1 یا Claude یا Llama یا هر یک از عزیزان فعلی هوش مصنوعی یک مدل هوش مصنوعی مولد است. خوب، دقیق‌تر است که بگوییم این گروهی از مدل‌های هوش مصنوعی هستند که انواعی برای کاربردهای مختلف طراحی شده‌اند.

بر خلاف، برای مثال، مدل‌های GPT OpenAI، DeepSeek تحت مجوز MIT منبع باز است که امکان استفاده تجاری را می‌دهد. این بدان معنی است که کل عملکرد داخلی مدل برای دیدن باز است. هرکسی می‌تواند بدون پرداخت هزینه‌های مجوز از هر نوعی از آن استفاده کند، و هیچ چیزی مانع از تغییر یا ساخت کارهایی که قبلاً انجام شده است وجود ندارد. این یکی از دلایل کلیدی است که DeepSeek منجر به اختلال در بازار کوتاه مدت شده است که ممکن است به اصلاح بلندمدت بازار تبدیل شود.

با این حال، اگر DeepSeek خوب نباشد، هیچ یک از اینها واقعاً مهم نیست. عامل اصلی دیگری که همه درباره این مدل هوش مصنوعی صحبت می کنند، عملکرد خوب آن است. در بنچمارک‌های هوش مصنوعی، DeepSeek همانند GPT-o1 و سایر مدل‌های تولیدی برتر عمل می‌کند. حتی در برخی موارد بهتر است. البته این چیزی است که هر کسی می تواند تأیید کند، اما ادعای واقعا تکان دهنده این است که توسعه این مدل چقدر هزینه داشته است.

DeepSeek ادعا می کند که این مدل برای کمتر از شش میلیون دلار آموزش دیده است. تا زمانی که در نظر نگیرید که مدل‌هایی که در حال مبادله هستند، هزینه‌ای بیش از صد میلیون دلار برای آموزش دارند، پول زیادی به نظر می‌رسد. نه تنها این، بلکه DeepSeek بر روی سخت افزار کمتر قدرتمندتر از آنچه در دسترس شرکت های آمریکایی مانند OpenAI است آموزش دیده بود. البته این یکی از ادعاهایی است که به این راحتی قابل تایید نیست و ممکن است مبلغ ذکر شده بسیار کمتر از واقعیت باشد. با این حال، در حال حاضر هیچ منبعی وجود ندارد که نشان دهد هزینه ها بیشتر از آنچه ادعا شده است.

آخرین «کار بزرگ» که فکر می‌کنم در مورد DeepSeek قابل ذکر است این است که چگونه از آن برای «تقطیر» مدل‌های بزرگ، متراکم و گران‌قیمت محاسباتی مانند Llama به مدل‌های کوچک‌تر با توانایی‌های استدلالی مشابه استفاده شده است. اساساً، DeepSeek مدلی را با مدل‌های پیچیده‌تر بزرگ‌تر آموزش می‌دهد تا خروجی‌های آن را تقلید کند، بدون اینکه تمام ماشین‌کاری‌های پیچیده در زیر کاپوت وجود داشته باشد. این به طور موثر مدل‌های بزرگ‌تر را به مدل‌های کوچک‌تر با (تا کنون) چند جنبه منفی فشرده می‌کند. این یک جهش بزرگ برای اجرای مدل های پیچیده به صورت محلی، استفاده از توان کمتر و نیاز به سخت افزار کمتر است.

DeepSeek توسط مهندسان چینی توسعه داده شد

DeepSeek یک استارت آپ به رهبری لیانگ ونفنگ (39) است که برای اولین بار به عنوان مدیر یک صندوق تامینی موفق شد همچین کاری انجام دهد.

به نظر می رسد DeepSeek چیزی است که به یک پروژه پرشور تبدیل می شود و به دنبال آن نیست که آن را به یک تلاش انتفاعی تبدیل کند. در واقع، این مدل قبلاً به همه داده شده است، زیرا منبع باز است. از قضا، تحریم‌های ایالات متحده بر تراشه‌های هوش مصنوعی قدرتمند شرکت‌هایی مانند NVIDIA، ممکن است بخشی از دلایلی باشد که توسعه‌دهندگان DeepSeek مجبور شدند آن را تا این حد کارآمد کنند.

نحوه استفاده از هوش مصنوعی DeepSeek

اگر از وب‌سایت DeepSeek بازدید می‌کنید، می‌توانید به برنامه و همچنین پیوندهایی به مدل‌های واقعی برای دانلود و استفاده در سخت‌افزار خود دسترسی داشته باشید. ساده ترین راه برای اجرای برخی از نسخه های DeepSeek بر روی سخت افزار خود استفاده از Olama است.

البته، به این زودی مدل DeepSeek سطح GPT-o1 را روی لپ‌تاپ خود اجرا نمی‌کنید، اما برای چند هزار دلار پردازنده‌های گرافیکی و رم گران‌قیمت، این کار کاملاً امکان‌پذیر است. البته بسیاری از مدل‌های کوچک‌تر DeepSeek وجود دارند که چندان خوب نیستند، اما روی رایانه‌ای که احتمالاً اکنون دارید به خوبی اجرا می‌شوند. حتی نسخه ای وجود دارد که (فقط) روی Raspberry Pi اجرا می شود.

برای دانلود کافیه وارد سایت DeepSeek شوید و روی گزینه get deepseek app کلیک کنید تا کد qr برای شما نمایش داده شود و پس از اسکن کد به صفحه دانلود برنامه هوش مصنوعی ارجاع میشوید.

نکته: لینک دانلود deepseek

نگرانی های ویژه ای در مورد DeepSeek وجود دارد

با توجه به اینکه چگونه بخش‌هایی از داستان DeepSeek ممکن است برای برخی از کارشناسان صنعت هوش مصنوعی خیلی خوب به نظر برسد و منشأ آن در چین است که نگرانی‌هایی را در مورد تعصب، سانسور و حتی امنیت سایبری ایجاد می‌کند، جای تعجب نیست که در مورد DeepSeek تردید وجود داشته باشد.

در واقع، از نسخه میزبانی شده آنلاین LLM سوالاتی بپرسید که به دولت فعلی چین حساس است، و ممکن است آنطور که انتظار دارید پیش رو نباشد. با این حال، از آنجایی که کد برای همه باز است، هر کسی می‌تواند در صورت داشتن دانش، نحوه رفتار آن را تنظیم کند. این نگرانی ها در اصل قابل رفع است.

روزهای اولیه برای DeepSeek است، و مدتی طول می کشد تا ببینیم اوضاع چگونه خواهد شد، اما چیزی که در مورد آن شک ندارم این است که صنعت مولد هوش مصنوعی اولین تغییر پارادایم اصلی خود را از زمانی که ChatGPT برای اولین بار برای عموم عرضه شد، تجربه کرده است.

مطلب مرتبط:موزیلا با دستیار Orbit وارد عرصه هوش مصنوعی می شود – “face age” چیست؟ آیا این ابزار جدید هوش مصنوعی می تواند به مبارزه با بیماری هایی مانند سرطان کمک کند؟