Китайская компания DeepSeek выпустила обновленную языковую модель R1 с открытой лицензией
Китайская компания DeepSeek анонсировала новую версию своей языковой модели R1, которая теперь доступна на платформе Hugging Face под открытой MIT-лицензией. Изменения в обновленной модели незначительны, но она может использоваться бесплатно в коммерческих целях, как сообщает TechCrunch. В текущем репозитории на Hugging Face представлены только конфигурационные файлы и параметры весов, которые определяют работу нейросети.
Новая версия DeepSeek-R1 включает в себя 685 миллиардов параметров, что делает ее весьма ресурсозатратной. Эксперты предупреждают, что запуск модели на обычных пользовательских устройствах может быть затруднен без дополнительных оптимизаций. Открытая лицензия позволяет бизнесу и разработчикам интегрировать модель R1 в свои продукты и проводить тестирование её возможностей, однако для полноценной эксплуатации потребуются значительные вычислительные мощности.
DeepSeek привлекла внимание в начале текущего года, когда представила R1 как конкурентоспособную и «рассуждающую» альтернативу разработкам OpenAI. Это вызвало опасения у ряда американских регуляторов, которые усмотрели в деятельности китайского стартапа потенциальную угрозу для национальной безопасности США. Так, сотрудникам Microsoft было запрещено использовать технологию DeepSeek.
Новая версия DeepSeek-R1 включает в себя 685 миллиардов параметров, что делает ее весьма ресурсозатратной. Эксперты предупреждают, что запуск модели на обычных пользовательских устройствах может быть затруднен без дополнительных оптимизаций. Открытая лицензия позволяет бизнесу и разработчикам интегрировать модель R1 в свои продукты и проводить тестирование её возможностей, однако для полноценной эксплуатации потребуются значительные вычислительные мощности.
DeepSeek привлекла внимание в начале текущего года, когда представила R1 как конкурентоспособную и «рассуждающую» альтернативу разработкам OpenAI. Это вызвало опасения у ряда американских регуляторов, которые усмотрели в деятельности китайского стартапа потенциальную угрозу для национальной безопасности США. Так, сотрудникам Microsoft было запрещено использовать технологию DeepSeek.
Ссылки по теме:
Миф о вреде ужина после шести вечера развеян диетологом Пристанским
Минпросвещения России поддерживает удаление оскорбительных видео о педагогах
Мединский о проверке книги Остера: «Впервые об этом слышу»
Лена Катина поддержала Егора Крида в скандале с концертом в Краснодаре
Суд в Денвере оправдал мужчину, отбывшего 26 лет за убийство младенца
Другие материалы рубрики:
Миф о вреде ужина после шести вечера развеян диетологом Пристанским
Диетолог Роман Пристанский опроверг миф о вреде ужина после 18:00, объяснив, что организму нужна энергия даже ночью. Он отметил, что правильный ужин важен для здоровья и предотвращает скачки сахара....
Минпросвещения России поддерживает удаление оскорбительных видео о педагогах
Мединский о проверке книги Остера: «Впервые об этом слышу»
Лена Катина поддержала Егора Крида в скандале с концертом в Краснодаре