CoinInsight360.com logo CoinInsight360.com logo
America's Social Casino

Forklog 2025-05-30 16:00:00

Новая ИИ-модель DeepSeek сможет работать на одном GPU

Китайская ИИ-лаборатория DeepSeek обновила «рассуждающую» ИИ-модель R1. Ее «дистиллированная» версия способна работать на одной видеокарте.  DeepSeek-R1-0528-Qwen3-8B создана на базе Qwen3-8B, которую Alibaba презентовала в мае. Согласно заявлению компании, она показала результаты лучше Gemini 2.5 Flash от Google в AIME 2025 — сборнике сложных математических вопросов.  «Дистиллированная» версия — упрощенный и ускоренный вариант большой модели машинного обучения, полученный с помощью метода дистилляции знаний. Подобные нейросети чаще всего не так производительны, но гораздо менее требовательны к вычислениям.  Согласно данным NodeShift, для работы Qwen3-8B требуется графический процессор с 40-80 Гб видеопамяти. Она может быть запущена на одной видеокарте Nvidia H100. DeepSeek использовала обновленную версию R1 и Qwen3-8B для обучения и настройки DeepSeek-R1-0528-Qwen3-8B.  Новая вариант основной нейросети R1 имеет незначительные обновления, утверждает компания. Она доступна на платформе Hugging Face.  Разработчик с ником xlr8harder обратил внимание, что модель менее охотно дискуссирует на спорные темы, особенно связанные с китайским правительством.  Deepseek R1 0528 is substantially less permissive on contentious free speech topics than previous Deepseek releases.It's unclear if this indicates they've adapted their post-training goals, or if this is another example of a reasoning model. pic.twitter.com/BPOYodBCAH— xlr8harder (@xlr8harder) May 29, 2025 «DeepSeek заслуживает критики за этот релиз: эта модель — большой шаг назад для свободы слова. Смягчает ситуацию то, что нейросеть имеет открытый исходный код с разрешительной лицензией, так что сообщество может (и будет) решать эту проблему», — отметил он. В одном из примеров модель отказалась приводить аргументы за нарушение прав человека в лагерях для интернированных в Синьцзяне. Она признала сам факт, но избежала прямой критики китайского правительства.  «Интересно, хотя и не совсем удивительно, что она способна привести лагеря в качестве примера нарушения прав человека, но отрицает это, когда ее спрашивают напрямую», — написал xlr8harder. Напомним, в апреле DeepSeek выложила в открытый доступ новую ориентированную на математику ИИ-модель Prover.

Feragatnameyi okuyun : Burada sunulan tüm içerikler web sitemiz, köprülü siteler, ilgili uygulamalar, forumlar, bloglar, sosyal medya hesapları ve diğer platformlar (“Site”), sadece üçüncü taraf kaynaklardan temin edilen genel bilgileriniz içindir. İçeriğimizle ilgili olarak, doğruluk ve güncellenmişlik dahil ancak bunlarla sınırlı olmamak üzere, hiçbir şekilde hiçbir garanti vermemekteyiz. Sağladığımız içeriğin hiçbir kısmı, herhangi bir amaç için özel bir güvene yönelik mali tavsiye, hukuki danışmanlık veya başka herhangi bir tavsiye formunu oluşturmaz. İçeriğimize herhangi bir kullanım veya güven, yalnızca kendi risk ve takdir yetkinizdedir. İçeriğinizi incelemeden önce kendi araştırmanızı yürütmeli, incelemeli, analiz etmeli ve doğrulamalısınız. Ticaret büyük kayıplara yol açabilecek yüksek riskli bir faaliyettir, bu nedenle herhangi bir karar vermeden önce mali danışmanınıza danışın. Sitemizde hiçbir içerik bir teklif veya teklif anlamına gelmez