Deepseek چیست؟
اینترنت با نام “DeepSeek” پر شده است. شرکتهای هوش مصنوعی مانند OpenAI و NVIDIA شاهد کاهش قیمت سهام خود هستند و علاقهمندان به هوش مصنوعی در سراسر جهان دستهای خود را با خوشحالی به هم میمالند. چرا این تازه وارد به دنیای هوش مصنوعی اینقدر بزرگ است؟
DeepSeek یک هوش مصنوعی منبع باز با ادعاهای بزرگ است
DeepSeek مانند GPT-o1 یا Claude یا Llama یا هر یک از عزیزان فعلی هوش مصنوعی یک مدل هوش مصنوعی مولد است. خوب، دقیقتر است که بگوییم این گروهی از مدلهای هوش مصنوعی هستند که انواعی برای کاربردهای مختلف طراحی شدهاند.
بر خلاف، برای مثال، مدلهای GPT OpenAI، DeepSeek تحت مجوز MIT منبع باز است که امکان استفاده تجاری را میدهد. این بدان معنی است که کل عملکرد داخلی مدل برای دیدن باز است. هرکسی میتواند بدون پرداخت هزینههای مجوز از هر نوعی از آن استفاده کند، و هیچ چیزی مانع از تغییر یا ساخت کارهایی که قبلاً انجام شده است وجود ندارد. این یکی از دلایل کلیدی است که DeepSeek منجر به اختلال در بازار کوتاه مدت شده است که ممکن است به اصلاح بلندمدت بازار تبدیل شود.
با این حال، اگر DeepSeek خوب نباشد، هیچ یک از اینها واقعاً مهم نیست. عامل اصلی دیگری که همه درباره این مدل هوش مصنوعی صحبت می کنند، عملکرد خوب آن است. در بنچمارکهای هوش مصنوعی، DeepSeek همانند GPT-o1 و سایر مدلهای تولیدی برتر عمل میکند. حتی در برخی موارد بهتر است. البته این چیزی است که هر کسی می تواند تأیید کند، اما ادعای واقعا تکان دهنده این است که توسعه این مدل چقدر هزینه داشته است.
DeepSeek ادعا می کند که این مدل برای کمتر از شش میلیون دلار آموزش دیده است. تا زمانی که در نظر نگیرید که مدلهایی که در حال مبادله هستند، هزینهای بیش از صد میلیون دلار برای آموزش دارند، پول زیادی به نظر میرسد. نه تنها این، بلکه DeepSeek بر روی سخت افزار کمتر قدرتمندتر از آنچه در دسترس شرکت های آمریکایی مانند OpenAI است آموزش دیده بود. البته این یکی از ادعاهایی است که به این راحتی قابل تایید نیست و ممکن است مبلغ ذکر شده بسیار کمتر از واقعیت باشد. با این حال، در حال حاضر هیچ منبعی وجود ندارد که نشان دهد هزینه ها بیشتر از آنچه ادعا شده است.
آخرین «کار بزرگ» که فکر میکنم در مورد DeepSeek قابل ذکر است این است که چگونه از آن برای «تقطیر» مدلهای بزرگ، متراکم و گرانقیمت محاسباتی مانند Llama به مدلهای کوچکتر با تواناییهای استدلالی مشابه استفاده شده است. اساساً، DeepSeek مدلی را با مدلهای پیچیدهتر بزرگتر آموزش میدهد تا خروجیهای آن را تقلید کند، بدون اینکه تمام ماشینکاریهای پیچیده در زیر کاپوت وجود داشته باشد. این به طور موثر مدلهای بزرگتر را به مدلهای کوچکتر با (تا کنون) چند جنبه منفی فشرده میکند. این یک جهش بزرگ برای اجرای مدل های پیچیده به صورت محلی، استفاده از توان کمتر و نیاز به سخت افزار کمتر است.
DeepSeek توسط مهندسان چینی توسعه داده شد
DeepSeek یک استارت آپ به رهبری لیانگ ونفنگ (39) است که برای اولین بار به عنوان مدیر یک صندوق تامینی موفق شد همچین کاری انجام دهد.
به نظر می رسد DeepSeek چیزی است که به یک پروژه پرشور تبدیل می شود و به دنبال آن نیست که آن را به یک تلاش انتفاعی تبدیل کند. در واقع، این مدل قبلاً به همه داده شده است، زیرا منبع باز است. از قضا، تحریمهای ایالات متحده بر تراشههای هوش مصنوعی قدرتمند شرکتهایی مانند NVIDIA، ممکن است بخشی از دلایلی باشد که توسعهدهندگان DeepSeek مجبور شدند آن را تا این حد کارآمد کنند.
نحوه استفاده از هوش مصنوعی DeepSeek
اگر از وبسایت DeepSeek بازدید میکنید، میتوانید به برنامه و همچنین پیوندهایی به مدلهای واقعی برای دانلود و استفاده در سختافزار خود دسترسی داشته باشید. ساده ترین راه برای اجرای برخی از نسخه های DeepSeek بر روی سخت افزار خود استفاده از Olama است.
البته، به این زودی مدل DeepSeek سطح GPT-o1 را روی لپتاپ خود اجرا نمیکنید، اما برای چند هزار دلار پردازندههای گرافیکی و رم گرانقیمت، این کار کاملاً امکانپذیر است. البته بسیاری از مدلهای کوچکتر DeepSeek وجود دارند که چندان خوب نیستند، اما روی رایانهای که احتمالاً اکنون دارید به خوبی اجرا میشوند. حتی نسخه ای وجود دارد که (فقط) روی Raspberry Pi اجرا می شود.
برای دانلود کافیه وارد سایت DeepSeek شوید و روی گزینه get deepseek app کلیک کنید تا کد qr برای شما نمایش داده شود و پس از اسکن کد به صفحه دانلود برنامه هوش مصنوعی ارجاع میشوید.
نکته: لینک دانلود deepseek
نگرانی های ویژه ای در مورد DeepSeek وجود دارد
با توجه به اینکه چگونه بخشهایی از داستان DeepSeek ممکن است برای برخی از کارشناسان صنعت هوش مصنوعی خیلی خوب به نظر برسد و منشأ آن در چین است که نگرانیهایی را در مورد تعصب، سانسور و حتی امنیت سایبری ایجاد میکند، جای تعجب نیست که در مورد DeepSeek تردید وجود داشته باشد.
در واقع، از نسخه میزبانی شده آنلاین LLM سوالاتی بپرسید که به دولت فعلی چین حساس است، و ممکن است آنطور که انتظار دارید پیش رو نباشد. با این حال، از آنجایی که کد برای همه باز است، هر کسی میتواند در صورت داشتن دانش، نحوه رفتار آن را تنظیم کند. این نگرانی ها در اصل قابل رفع است.
روزهای اولیه برای DeepSeek است، و مدتی طول می کشد تا ببینیم اوضاع چگونه خواهد شد، اما چیزی که در مورد آن شک ندارم این است که صنعت مولد هوش مصنوعی اولین تغییر پارادایم اصلی خود را از زمانی که ChatGPT برای اولین بار برای عموم عرضه شد، تجربه کرده است.
مطلب مرتبط:موزیلا با دستیار Orbit وارد عرصه هوش مصنوعی می شود – “face age” چیست؟ آیا این ابزار جدید هوش مصنوعی می تواند به مبارزه با بیماری هایی مانند سرطان کمک کند؟
        			        		
	
	


    
    
    
    
دیدگاهتان را بنویسید