SoraYazılım
Русский
Заказные программные решения из Турции
Серверы Dell PowerEdge · Серверное оборудование

Dell PowerEdge XE9680

AI-сервер с 8 GPU — H100/H200/MI300X.

Краткий ответ

Dell PowerEdge XE9680 — 6U AI-сервер с поддержкой 8 GPU NVIDIA H100 / H200 SXM5 или AMD Instinct MI300X. Предназначен для обучения больших языковых моделей (LLM), инференса крупных моделей и HPC-нагрузок.

Dell PowerEdge XE9680 — флагманский AI-сервер Dell в формате 6U. Платформа представляет собой прямую альтернативу NVIDIA DGX H100 / H200 для заказчиков, выбирающих корпоративный канал поставок и сервисное обслуживание Dell. XE9680 поддерживает две основные конфигурации GPU: 8× NVIDIA HGX H100 / H200 SXM5 с топологией NVLink и NVSwitch, либо 8× AMD Instinct MI300X с топологией Infinity Fabric. Каждый GPU NVIDIA H100 SXM5 обеспечивает 80 ГБ HBM3-памяти и до 3,35 ПБ/с пропускной способности; H200 SXM5 расширяет HBM3e до 141 ГБ и 4,8 ТБ/с. AMD Instinct MI300X выделяется максимальным объёмом HBM3 в 192 ГБ на одну карту, что позволяет разместить крупные языковые модели целиком в памяти одного GPU без распараллеливания на уровне модели. Для заказчиков из России и СНГ платформа особенно интересна в проектах построения корпоративной AI-инфраструктуры, лабораторий научных исследований, обучения отраслевых LLM (банковская, медицинская, юридическая, инженерная вертикаль) и развёртывания high-end инференс-сервисов.

Процессорная подсистема XE9680 построена на двух процессорах Intel Xeon Scalable 4-го/5-го поколения с поддержкой до 56 ядер на сокет (112 ядер на сервер). Эти процессоры выполняют функции хост-узла GPU-кластера: координацию обучения, ввод-вывод данных, сериализацию и десериализацию датасетов, оркестрацию распределённых вычислений и обработку CPU-фрагментов вычислительного графа. Архитектура NVLink и NVSwitch обеспечивает связь между восемью GPU H100/H200 SXM5 с агрегированной пропускной способностью до 900 ГБ/с на каждый GPU (для NVLink 4.0). NVSwitch объединяет все восемь GPU в полную сеточную топологию (full all-to-all), что критически важно для эффективности коллективных операций AllReduce, AllGather, ReduceScatter и Broadcast в распределённом обучении. Поддерживаются основные фреймворки: PyTorch с распределённым обучением через FSDP (Fully Sharded Data Parallel) и DeepSpeed, TensorFlow с MirroredStrategy и MultiWorkerMirroredStrategy, Hugging Face Accelerate, NVIDIA NeMo, NVIDIA TensorRT-LLM для оптимизации инференса.

Подсистема оперативной памяти представлена 32 слотами DIMM DDR5 с максимальным суммарным объёмом 4 ТБ на платформу. Скорость памяти — 4800 МТ/с. Большой объём оперативной памяти необходим для обучения LLM как буфер между основной памятью GPU (HBM3/HBM3e) и хранилищем датасетов: на CPU выполняется предобработка, токенизация, аугментация и пакетирование данных перед загрузкой в GPU. Подсистема PCIe Gen5 обеспечивает 10 слотов PCIe Gen5 x16 — это критически важно для интеграции высокоскоростных сетевых адаптеров для распределённого обучения. Стандартная конфигурация включает поддержку 8 сетевых адаптеров NVIDIA InfiniBand NDR 400 ГБ/с или Ethernet 400 ГБ/с (по одному на каждый GPU), что обеспечивает оптимальную полосу для коллективных операций между узлами в многоузловых тренировочных кластерах. Архитектура GPUDirect RDMA позволяет GPU обмениваться данными напрямую через InfiniBand минуя CPU и системную память, что существенно снижает задержку распределённого обучения.

Дисковая подсистема XE9680 предлагает 8 слотов NVMe E3.S для локального хранилища. Для крупных LLM-проектов локальное хранилище обычно используется как кэш активных датасетов и checkpoint-файлов модели; основные датасеты размещаются на внешних высокоскоростных хранилищах типа Dell PowerScale (Isilon), VAST Data Universal Storage, DDN ExaScaler или WekaIO Matrix через сеть NDR. Локальные NVMe E3.S обеспечивают совокупную пропускную способность свыше 60 ГБ/с на чтение и более 4 миллионов IOPS, что достаточно для бесшовной подгрузки следующего батча во время обучения текущего батча. Электропитание построено на принципе двойного резервирования: до шести блоков питания 3200 Вт с горячей заменой и сертификацией Titanium. Совокупная потребляемая мощность платформы с восемью H100 SXM5 может достигать 10,2 кВт; для H200 — до 11,5 кВт; для MI300X — около 12 кВт. Платформа поддерживает воздушное охлаждение, однако для оптимального PUE и снижения шума мы рекомендуем сценарии с прямым жидкостным охлаждением (Direct Liquid Cooling), при котором холодная пластина устанавливается непосредственно на GPU и CPU.

Управление и наблюдаемость обеспечиваются iDRAC 9 Enterprise с расширенными функциями для AI-инфраструктуры: мониторинг температуры и энергопотребления каждого GPU, журналы событий NVLink/NVSwitch, диагностика NCCL (NVIDIA Collective Communications Library), интеграция с Dell OpenManage Enterprise и Dell CloudIQ для проактивной аналитики. Платформа поддерживает технологии безопасности Silicon-Based Root of Trust, Secure Boot, TPM 2.0, System Lockdown Mode. Для проектов с особыми требованиями к конфиденциальности (защита проприетарных датасетов, моделей-«ноу-хау», корпоративных весов) Sora Yazılım подбирает дополнительные средства защиты: шифрование данных в покое (Self-Encrypting Drives), шифрование сетевого трафика в кластере (IPsec, MACsec на адаптерах NDR), сертифицированные средства защиты информации и сертифицированные ОС для соответствия требованиям регулятора.

Сценарии применения. XE9680 закрывает четыре основные категории AI-нагрузок. Обучение базовых LLM (foundation model pre-training): кластер из 4–32 узлов XE9680 позволяет обучать модели объёмом от 7 до 70 миллиардов параметров с нуля; типичная конфигурация на 16 узлов (128 GPU H100) обучает модель 70B за несколько недель. Тонкая настройка LLM (fine-tuning, instruction tuning, RLHF): один-два узла XE9680 достаточны для дообучения открытых моделей семейств LLaMA, Mistral, Qwen, DeepSeek, Yi, GLM на корпоративных данных. Инференс крупных моделей: один узел XE9680 с восемью H100/H200 обслуживает многотысячные запросы в секунду к моделям 70B–200B параметров через NVIDIA TensorRT-LLM, vLLM, SGLang. Научные вычисления и HPC: моделирование молекулярной динамики, климатических моделей, гидродинамики, обработка медицинских изображений (компьютерная томография, МРТ), генерация лекарственных кандидатов, обработка геофизических данных в нефтегазовой отрасли.

Сопровождение Sora Yazılım. Мы выполняем полный цикл AI-проектов: предпроектная консультация по выбору архитектуры (XE9680 с H100 / H200 / MI300X либо альтернативные платформы), детальный сайзинг под профиль обучения или инференса, расчёт совокупной потребности в GPU и узлах, согласование с заказчиком целевых моделей и датасетов, оформление заказа через авторизованный канал Dell, доставка в СНГ с растаможиванием и логистикой, физическая инсталляция (монтаж, кабельная разводка NDR 400G и распределённое питание), конфигурация InfiniBand-фабрики, развёртывание базовой среды CUDA + cuDNN + NCCL + Magnum IO, настройка системы оркестрации (Slurm, Kubernetes с KubeRay, NVIDIA Run:AI), настройка мониторинга (Prometheus, Grafana, NVIDIA Data Center GPU Manager), запуск базовых тренировочных и инференс-пайплайнов на типовых моделях для приёмо-сдаточных испытаний, передача в опытную и промышленную эксплуатацию, обучение DevOps- и ML-инженеров заказчика. На стадии эксплуатации мы сопровождаем ProSupport Plus 7×24×4 для GPU-инфраструктуры, выполняем регулярные проверки состояния через SupportAssist и при необходимости подключаем удалённый мониторинг к нашему центру оперативного управления.

Соответствие требованиям регулятора. AI-инфраструктура часто обрабатывает данные особых категорий: персональные данные клиентов (банковский скоринг, медицинская диагностика), коммерческую тайну (проприетарные датасеты, обученные веса моделей), биометрические данные (распознавание лиц, голоса). Для соответствия 152-ФЗ «О персональных данных» и требованиям ФСТЭК России Sora Yazılım формирует комплексное решение: аппаратная платформа XE9680 с активированными Silicon-Based Root of Trust, Secure Boot и System Lockdown Mode; сертифицированная ФСТЭК операционная система (Astra Linux Special Edition с поддержкой NVIDIA CUDA и репозиторием AI-фреймворков); сертифицированные ФСТЭК средства защиты информации (Secret Net Studio, Dallas Lock); шифрование данных в покое и в передаче; полный комплект эксплуатационной документации и техническое задание под требования регулятора. Дополнительно, при работе с государственными информационными системами (ГИС) по требованиям приказов ФСТЭК России № 17 и № 21, а также при защите криптографическими средствами по требованиям ФСБ России, мы подбираем сертифицированные средства криптографической защиты (КриптоПро CSP, ViPNet CSP), сертифицированные межсетевые экраны (Континент, ViPNet Coordinator), модули доверенной загрузки и системы обнаружения вторжений. Для построения AI-кластеров на территории Российской Федерации Sora Yazılım дополнительно учитывает требования о размещении персональных данных на территории России (152-ФЗ, статья 18.5), требования о локализации обработки и требования по применению российских средств криптографической защиты при передаче данных по открытым каналам связи между узлами.

Топология AI-кластера и выбор сетевой подсистемы. Для распределённого обучения LLM критическое значение имеет топология межузловой сети. На малых кластерах из 4–8 узлов XE9680 (32–64 GPU) применяется конфигурация fat-tree с одноуровневым коммутатором InfiniBand NDR (типично NVIDIA Quantum-2 QM9700 с 64 портами NDR 400G); такая топология обеспечивает неблокируемое полное all-to-all соединение между всеми GPU кластера и предсказуемую производительность коллективных операций NCCL. Для крупных кластеров от 16 до 128 узлов (128–1024 GPU) применяется двухуровневый fat-tree (spine-leaf) с дополнительными коммутаторами Quantum-2 верхнего уровня и оптической инфраструктурой OSFP 800G; такая конфигурация поддерживает горизонтальное масштабирование до 2048 GPU в едином неблокируемом домене. Альтернативная топология dragonfly+ применяется в сценариях, где приоритетна оптимизация капитальных затрат на сетевую инфраструктуру при сохранении высокой производительности обучения. Sora Yazılım проектирует топологию совместно с заказчиком, выполняет расчёт количества коммутаторов, кабельной инфраструктуры (медь DAC до 5 метров, активные оптические кабели AOC до 30 метров, одномодовая оптика SR8/DR8 для более длинных дистанций) и стоимости. Альтернативно для инференс-нагрузок и для небольших проектов тонкой настройки доступна сеть на базе Ethernet 400G с протоколом RoCEv2 — менее дорогостоящая опция с допустимой производительностью для большинства корпоративных задач.

Сравнение с альтернативными платформами и выбор поколения GPU. На рынке AI-серверов XE9680 конкурирует с NVIDIA DGX H100 / H200, HPE Compute XD685, Supermicro AS-8125GS-TNHR, Lenovo ThinkSystem SR685a V3, Inspur NF5468 и Foxconn Ingrasys. Все эти платформы построены на одной аппаратной базе — материнской плате NVIDIA HGX H100 / H200 SXM5 с восемью GPU в формате SXM и интегрированной топологией NVLink/NVSwitch. Архитектурное различие — в дизайне корпуса, системе охлаждения, BMC-управлении и каналах сервисного обслуживания. Преимущества Dell XE9680 для корпоративных заказчиков СНГ: широкая логистическая сеть Dell с локальной поддержкой запчастей и техников, единая модель управления iDRAC 9 + OpenManage Enterprise (то же, что используется на классических PowerEdge), сертифицированный сервис ProSupport Plus с реакцией 4 часа, прозрачная модель ценообразования через авторизованный канал Dell. Выбор поколения GPU зависит от профиля рабочей нагрузки и горизонта проекта. H100 SXM5 с 80 ГБ HBM3 и пропускной способностью 3,35 ТБ/с — базовая рабочая лошадка для большинства задач обучения и инференса LLM 7B–70B параметров; стоимость одной карты H100 SXM5 составляет около 30–35 тысяч долларов США. H200 SXM5 с 141 ГБ HBM3e и 4,8 ТБ/с — оптимальный выбор для инференса крупных моделей 70B–200B параметров и обучения мультимодальных моделей, поскольку увеличенная HBM-память позволяет работать с большими контекстными окнами и снижает необходимость в шардировании; стоимость карты H200 примерно на 25–30% выше H100. AMD Instinct MI300X с 192 ГБ HBM3 — выбор для проектов, где критичен максимальный объём GPU-памяти и где ROCm-стек обеспечивает требуемую совместимость с применяемыми фреймворками; стоимость MI300X сопоставима с H100 при существенно большем объёме HBM. В перспективе ожидается следующее поколение NVIDIA Blackwell B100 / B200, которое в 2026 году придёт на смену линейке H100/H200; Dell готовит обновление платформы XE9680 под Blackwell, и Sora Yazılım информирует заказчиков о сроках доступности новых конфигураций.

Программная инфраструктура AI-стек. Полный стек, который Sora Yazılım развёртывает на XE9680, включает следующие слои. Базовая операционная система — Ubuntu Server 22.04 LTS или 24.04 LTS, либо Red Hat Enterprise Linux 9, либо российская Astra Linux Special Edition 1.7 для проектов с требованиями сертификации. Драйверная подсистема — NVIDIA Data Center GPU Driver актуальной версии, NVIDIA Fabric Manager для управления NVSwitch, NVIDIA Container Toolkit для интеграции с Docker и containerd. Базовый CUDA-стек — CUDA Toolkit, cuDNN, NCCL, NVSHMEM, Magnum IO GPUDirect Storage. Системы оркестрации — Slurm для классических HPC-кластеров, Kubernetes с операторами NVIDIA GPU Operator и Network Operator для облачно-ориентированных кластеров, NVIDIA Base Command Manager для упрощённого администрирования через NVIDIA. Расширенные системы оркестрации AI-нагрузок — NVIDIA Run:AI (бывший Run.AI, теперь часть NVIDIA AI Enterprise) для динамического разделения GPU между задачами и пользователями, KubeRay для распределённого Ray, MLflow и Weights & Biases для трекинга экспериментов. Фреймворки — PyTorch 2 с torch.distributed, FSDP и DeepSpeed; TensorFlow 2 с MultiWorkerMirroredStrategy; JAX с jit и pmap; NVIDIA NeMo для обучения LLM; NVIDIA TensorRT-LLM, vLLM, SGLang и Triton Inference Server для оптимизированного инференса. Мониторинг — NVIDIA Data Center GPU Manager (DCGM), Prometheus с node_exporter и dcgm-exporter, Grafana с готовыми дашбордами для GPU-кластеров, NVIDIA Mission Control для централизованного управления.

Ключевые возможности

Что предлагает

  • 8× NVIDIA H100/H200 SXM5 или AMD Instinct MI300X
  • Топология NVLink / NVSwitch (для NVIDIA) или Infinity Fabric (для AMD)
  • 10 слотов PCIe Gen5 x16
  • 32 слота DDR5 DIMM, до 4 ТБ оперативной памяти
  • Сетевая поддержка InfiniBand NDR 400G
Тех. сводка

Важные технические данные

GPU
8× NVIDIA H100/H200 SXM5 или AMD MI300X
Память
4 ТБ DDR5
Сеть
InfiniBand NDR 400G
Сценарии

Когда выбирать этот продукт?

ИИ

Обучение LLM

Кластер предварительного обучения больших языковых моделей.

Университет

Исследовательский HPC

Лаборатория исследований ИИ университета.

Финансы

AI-модель оценки рисков

Внутренняя AI-модель банка для скоринга и риск-аналитики.

Для кого подходит?

Команды AI-обучения, LLM, HPC.

Часто задаваемые вопросы

Часто задаваемые вопросы

Чем XE9680 отличается от HPE Compute XD685?
Обе платформы построены на одной аппаратной базе NVIDIA HGX H100 / H200 SXM5. Различие — в опыте управления (Dell iDRAC и OpenManage против HPE iLO и OneView) и каналах сервисного обслуживания. На уровне производительности обучения и инференса различий практически нет.
В чём преимущество AMD Instinct MI300X относительно NVIDIA H100/H200?
MI300X выделяется максимальным объёмом HBM3 — 192 ГБ на одну карту против 80 ГБ у H100 и 141 ГБ у H200. Это позволяет разместить крупные LLM целиком в памяти одного GPU без распараллеливания на уровне модели. Для инференса 70B–200B моделей и для научных HPC-задач MI300X обеспечивает оптимальное соотношение объёма памяти к производительности. Поддержка фреймворков построена на ROCm.
Каков срок поставки GPU H100/H200 в СНГ?
GPU NVIDIA H100 и H200 имеют ограниченную глобальную доступность; срок заказа составляет 8–16 недель в зависимости от объёма. AMD Instinct MI300X обычно доступен с более коротким сроком. Sora Yazılım резервирует слоты заказа заранее и рекомендует планирование AI-проектов с горизонтом 4–6 месяцев.
Какие требования к охлаждению AI-кластера на XE9680?
При воздушном охлаждении платформа требует холодного коридора с температурой не выше 24 °C и расходом воздуха не менее 600 CFM на сервер. Для конфигураций с восемью H100/H200 и сетью NDR мы рекомендуем прямое жидкостное охлаждение (Direct Liquid Cooling), что улучшает PUE центра обработки данных, снижает уровень шума и обеспечивает стабильную работу GPU на полной мощности.
Как организовать распределённое обучение на нескольких узлах XE9680?
Распределённое обучение строится на сети InfiniBand NDR 400 ГБ/с с топологией fat-tree или dragonfly. Программная часть — NCCL, NVIDIA Magnum IO, GPUDirect RDMA. Фреймворки PyTorch FSDP, DeepSpeed ZeRO, NVIDIA NeMo обеспечивают шардирование модели и оптимизатора. Sora Yazılım предоставляет проектирование топологии InfiniBand и настройку программной среды под ключ.
Какая гарантия и SLA рекомендуется для AI-инфраструктуры?
Для AI-кластеров мы настоятельно рекомендуем ProSupport Plus 7×24×4 с расширенной поддержкой GPU. Стоимость одного GPU H100 / H200 сопоставима со стоимостью самого сервера, поэтому быстрая замена в случае инцидента и проактивная диагностика через SupportAssist окупаются с первого устранённого сбоя.
Можно ли арендовать XE9680 вместо покупки?
Dell APEX (программа подписочного потребления Dell) позволяет использовать AI-инфраструктуру по модели OPEX с оплатой за потребление. Sora Yazılım формирует коммерческое предложение с расчётом TCO для модели CAPEX (классическая закупка) и OPEX (APEX) и помогает заказчику выбрать оптимальную модель в зависимости от горизонта проекта.
Какой объём данных типового обучения LLM?
Базовое обучение модели 70B параметров требует датасета порядка 10–15 триллионов токенов (примерно 30–50 ТБ сжатых данных). Для тонкой настройки достаточно 10–100 миллиардов токенов (100 ГБ – 1 ТБ). Sora Yazılım подбирает совместимое внешнее хранилище: Dell PowerScale, VAST Data, DDN ExaScaler, WekaIO Matrix — с пропускной способностью 100+ ГБ/с.
Соответствует ли XE9680 требованиям 152-ФЗ и ФСТЭК?
Аппаратная платформа поддерживает все необходимые механизмы доверенной загрузки (Silicon-Based Root of Trust, Secure Boot, TPM 2.0, System Lockdown Mode). Для AI-систем, обрабатывающих персональные данные или коммерческую тайну, Sora Yazılım подбирает сертифицированные ФСТЭК средства защиты информации, сертифицированную ОС (Astra Linux Special Edition с поддержкой NVIDIA CUDA) и формирует комплект документации для аттестации информационной системы.
Какие фреймворки и языковые модели поддерживаются?
PyTorch, TensorFlow, JAX, Hugging Face Transformers / Accelerate, NVIDIA NeMo, NVIDIA TensorRT-LLM, vLLM, SGLang, DeepSpeed, Megatron-LM. Поддерживаются открытые модели семейств LLaMA 2/3, Mistral, Mixtral, Qwen 2/3, DeepSeek, Yi, GLM-4, Falcon, а также проприетарные модели заказчика. Sora Yazılım предоставляет преднастройку среды на базе сертифицированных образов NVIDIA NGC.
Официальная страница продукта производителя

Открывает оригинальную техническую документацию и страницу продукта производителя в новой вкладке.

Серверы Dell PowerEdgeDell PowerEdge XE9680
Связанные услуги

Услуги, сопровождающие этот продукт

Dell PowerEdge XE9680 — лицензия + внедрение + поддержка

Sora Yazılım берёт на себя лицензирование, внедрение, обучение и текущее управление — всё в одних руках.