SUPERNOVA 32B

Языковая модель для решения сложных задач

Базовая модель:

Qwen2.5-32B-Instruct

Количество параметров:

32 миллиарда

Контекстное окно:

8K токенов

Технические особенности

Архитектура модели

  • Базовая модель: Qwen2.5-32B-Instruct.
  • Оптимизированная архитектура для русского языка.
  • Сохранение возможностей оригинальной модели.

Тренировочный датасет

  • Уникальный датасет на русском языке, включая открытые данные и сгенерированные.
  • Включает задачи по математике, программированию и естественным наукам.
  • Верифицированные ответы и решения.

Качество ответов

  • Сравнимые результаты с o1-preview и gigachat max.
  • Результаты бенчмарка Mena доступны по ССЫЛКЕ

Технические требования

  • Минимальные системные требования.
  • Оптимизация инференса.
  • Поддержка различных форматов ввода

Применение модели

  • Решение олимпиадных задач.
  • Анализ и написание кода.
  • Научные вычисления и рассуждения.
  • Возможность дообучения под конкретные задачи.