Технический директор Яндекса Алексей Гусаков рассказал о причинах успеха китайского искусственного интеллекта DeepSeek, который стремительно догоняет американский ChatGPT. Всего год назад OpenAI считалась бесспорным лидером в области генеративных моделей, но сейчас ситуация меняется. DeepSeek не только приблизился к лидеру, но и сделал свои разработки открытыми, что стало важным шагом для всей индустрии.
Главное достижение DeepSeek — это два крупных релиза, которые уже привлекли внимание.
За короткий промежуток времени они сделали два значимых релиза, которые привлекли внимание индустрии. Первый — это базовая модель с колоссальным масштабом: 650 миллиардов параметров и хорошим качеством работы. Она стала основой для их второго релиза — специализированной модели, разработанной для решения задач, связанных с рассуждением и построением длинных цепочек логических выводов. Эта способность играет ключевую роль во множестве продуктов и сервисов, а также значительно повышает эффективность процессов.
Алексей Гусаков
Технический директор Яндекса
Гусаков отметил, что особенность DeepSeek — открытость. Компания не только выложила свои модели в Open Source с возможностью коммерческого использования, но и опубликовала подробный технический отчет. В нем описаны подходы к созданию моделей и технологические решения, которые позволили достичь таких результатов.
В наши дни такая степень открытости — большая редкость. В этом отношении DeepSeek стала исключением, и это действительно впечатляет. Их технический отчёт отличается высокой степенью подробности. Конечно, это не означает, что кто угодно прямо сейчас сможет взять и полностью воспроизвести их достижения — остаётся достаточно пространства для интерпретации и творческой инфраструктурной работы. Тем не менее, подобный уровень открытости делает воспроизведение их подходов вполне возможным, что задаёт новый стандарт для индустрии.
Алексей Гусаков
Технический директор Яндекса
Еще одно преимущество DeepSeek — экономичность. Компания доказала, что обучение моделей такого масштаба может быть значительно дешевле, чем у OpenAI, Google или Meta* (организация признана экстремистской, её деятельность запрещена на территории России). Это открывает новые возможности для создания компактных и эффективных моделей, адаптированных под узкоспециализированные задачи.