Стоимость обучения модели DeepSeek стала одной из самых обсуждаемых тем после публикации CNN 19 сентября 2025 года. Компания DeepSeek заявила, что обучение модели R1 обошлось всего в $294 000, используя 512 GPU-чипов Nvidia H800. Такой размер затрат удивил многих, ведь западные модели с аналогичными возможностями стоят десятки и сотни миллионов долларов. Однако важно разобраться, что именно входит в эти расходы, а что остаётся за кадром, чтобы понять реальную стоимость обучения модели DeepSeek.

Что известно: заявленная стоимость обучения модели DeepSeek
- Модель R1 была обучена за $294 000.
- Для тренировки использовались 512 GPU-чипов Nvidia H800, предназначенные для китайского рынка.
- Финальная стадия обучения заняла примерно 80 часов.
- На подготовительном этапе использовались также чипы Nvidia A100, которые позже заменили на H800.

Что не включено: скрытые и предварительные расходы
Заявленная стоимость обучения модели DeepSeek в $294 000 не учитывает:
- Предобучение базовой версии модели до запуска R1.
- Сбор, очистку и аннотацию данных, без которых невозможно качественное обучение.
- Исследовательскую работу: архитектура модели, ранние прототипы, тестирование и оптимизация.
- Инфраструктуру и эксплуатационные расходы: электроэнергию, охлаждение, аренду оборудования и поддержку специалистов.

Более полная оценка: реальные затраты DeepSeek
Аналитики отмечают, что реальная стоимость обучения модели DeepSeek значительно выше. Включая все стадии — от предобучения до финального развертывания, — суммы могут достигать $5–6 миллионов.
Например, обучение версии DeepSeek V3 потребовало кластер из 2 048 GPU H800 и значительно больше времени, что увеличивало совокупные затраты.

Сравнение с затратами конкурентов
Чтобы понять, насколько необычной выглядит стоимость обучения модели DeepSeek, стоит сравнить её с другими проектами:
| Модель / проект | Заявленная или оценочная стоимость | Комментарии |
|---|---|---|
| DeepSeek R1 (официально) | ~$294 000 | Финальная стадия на H800, 80 часов |
| DeepSeek V3 (расширенные оценки) | ~$5,5–6 млн | Включает все этапы разработки |
| GPT-4 (OpenAI) | $100 млн и выше | Огромные затраты на инфраструктуру и данные |
| LLaMA (Meta) | десятки миллионов долларов | Разработка и предобучение включены в стоимость |
Почему стоимость обучения модели DeepSeek вызывает столько обсуждений
- Контраст с западными проектами. Разница между $294 000 и сотнями миллионов долларов выглядит сенсационной.
- Неоднозначность подсчётов. Под стоимостью обучения модели DeepSeek понимают разные вещи: кто-то учитывает только финальную стадию, кто-то — полный цикл.
- Влияние на рынок. Если цифра верна, обучение ИИ может стать доступнее для стартапов и университетов.
- Политический фактор. Использование китайских H800 вместо запрещённых A100 и H100 демонстрирует способность Китая обходить санкции.

Заключение
Стоимость обучения модели DeepSeek — $294 000 — звучит эффектно и подчеркивает возможности оптимизации. Но эта сумма отражает лишь ограниченный этап обучения и не включает все расходы. Реальная цена разработки, по мнению экспертов, исчисляется миллионами долларов.
Тем не менее, сам факт того, что DeepSeek демонстрирует такие цифры, меняет правила игры: теперь дискуссия о том, сколько на самом деле стоит создать конкурентоспособную языковую модель, стала ещё острее.
FAQ Часто задаваемые вопросы
1. Действительно ли стоимость обучения модели DeepSeek равна $294 000?
Это официально заявленная сумма, но она не охватывает весь цикл обучения и инфраструктуру.
2. Почему цифра так сильно отличается от GPT-4 и других моделей?
DeepSeek учитывает только финальный этап обучения, тогда как западные компании включают все расходы.
3. Какая реальная цена обучения DeepSeek?
Эксперты оценивают полную стоимость в пределах $5–6 миллионов.
4. Что входит в скрытые расходы?
Сбор данных, предобучение, архитектура, тестирование, оборудование и эксплуатация.
5. Какое значение это имеет для индустрии?
Если методы DeepSeek подтвердят эффективность, обучение ИИ-моделей станет дешевле и доступнее для большего числа игроков.
Источник: CNN



