ارائه نسخه جدید هوش مصنوعی دیپ سیک
به گزارش وب کنفرانس، استارت آپ هوش مصنوعی چینی دیپ سیک با عرضه جدید ترین مدل خود موجی در جامعه هوش مصنوعی سراسر دنیا ایجاد کرد.
به گزارش وب کنفرانس به نقل از ونچر بیت، این مدل جدید سیستمی با ۶۸۵ میلیارد پارامتر است که سلطه غول های فناوری آمریکا در این بازار را به چالش می کشد و همزمان چشم انداز رقابت در این عرصه را از راه دسترسی منبع باز تغییر می دهد. این شرکت چینی بی سروصدا مدل دیپ سیک V۳.۱ را در پلت فرم Hugging Face ارائه نمود. طی چند ساعت نخست بعد از عرضه مدل، تست های اولیه نشان داد امتیاز بنچمارک آن بهتر از رقبای دیگرش است که توسط شرکتهای اوپن ای آی و آنتروپیک عرضه شده است. از طرفی منبع باز بودن مدل مذکور دسترسی جهانی به آنرا بدون تنش های ژئوپولتیکی تضمین می نماید. عرضه دیپ سیک V۳.۱ تنها یک بهبود تدریجی در توانمندیهای هوش مصنوعی نیست. این رویداد نشان دهنده تغییر بنیادی در نحوه توسعه، توزیع و کنترل پیشرفته ترین سیستم های هوش مصنوعی جهان است، تغییری که می تواند نتایج عمیقی در رقابت فناورانه جاری بین آمریکا و چین داشته باشد. چند ساعت بعد از عرضه این مدل در پلت فرم Hugging Face محبوبیت آن در رده بندی ها بالا رفت و تقدیر محققانی از سرتاسر جهان که آنرا دانلود و قابلیت هایش را آزمایش کرده بودند، به دنبال داشت. این مدل به امتیاز ۷۱.۶ درصد در بنچمارک کد نویسی Aider را به دست آورد و خویش را بعنوان یکی از مدل هایی با عملکرد برتر تثبیت کرد و به صورت مستقیم سلطه غول های هوش مصنوعی آمریکایی را به چالش کشیده است. دیپ سیک V۳.۱ دستاوردهای مهندسی قابل توجهی ارائه می کند که انتظارات از عملکرد مدلهای هوش مصنوعی را تعریف مجدد می کند. این سیستم قادر به پردازش ۱۲۸ هزار توکن متنی (تقریباً معادل یک کتاب ۴۰۰ صفحه ای) و سرعت پاسخگویی آن بسیار سریع تر از رقبا است. این مدل از فرمت های دقت مختلف از BF۱۶ استاندارد گرفته تا FP۸ آزمایشی پشتیبانی می کند که به توسعه دهندگان امکان می دهد عملکرد را بر مبنای محدودیت های سخت افزاری خاص خود بهینه سازی کنند. پیشرفت اصلی در چیزی است که دیپ سیک آنرا ساختار هیبریدی می نامد. برخلاف تلاشهای پیشین برای ترکیب قابلیت های مختلف هوش مصنوعی که به ایجاد سیستم هایی با عملکرد ضعیف در همه چیز منجر می شد، V۳.۱ چت استدلال و قابلیت های کد نویسی را در یک مدل هماهنگ یکپارچه کرد. به اجمال، این سیستم قادر به پردازش ۱۲۸ هزار توکن متنی (تقریباً معادل یک کتاب ۴۰۰ صفحه ای) و سرعت پاسخگویی آن بسیار سریع تر از رقبا است. این مدل از فرمت های دقت مختلف از BF۱۶ استاندارد گرفته تا FP۸ آزمایشی پشتیبانی می کند که به توسعه دهندگان امکان می دهد عملکرد را مبنی بر محدودیت های سخت افزاری خاص خود بهینه سازی کنند.
این مطلب را می پسندید؟
(1)
(0)
تازه ترین مطالب مرتبط
نظرات بینندگان در مورد این مطلب