Почему AI упирается не только в GPU, но и в данные
В AI-инфраструктуре узким местом всё чаще становятся не GPU, а скорость подачи данных. MinIO и NVIDIA STX показывают, почему object storage, DPU и новые слои памяти становятся частью AI-фабрик.
kabooma
Новые опубликованные публичные топики, которые только начинают собирать участников.
Читайте всё сразу или соберите ленту из активных групп.
В AI-инфраструктуре узким местом всё чаще становятся не GPU, а скорость подачи данных. MinIO и NVIDIA STX показывают, почему object storage, DPU и новые слои памяти становятся частью AI-фабрик.
CTO CoreWeave Peter Salanki объяснил, почему запуск ИИ в продакшене — это не только модель и GPU. Главные сложности часто лежат в сети, памяти, планировании задач, наблюдаемости и физической инфраструктуре дата-центров.
Облако стоит оценивать не по цене виртуальной машины, а по стоимости полезной работы: транзакции, пользовательского часа, тестового контура или продуктовой среды. Только так можно честно сравнить его со своим ЦОДом.
DeepSeek сделала скидку 75% на V4-Pro постоянной. API модели теперь стоит в четыре раза дешевле первоначального тарифа, что усиливает ценовую конкуренцию на рынке LLM.
У побережья Шанхая запустили подводный дата-центр Shanghai Lingang UDC. Серверы разместили в герметичных модулях под водой, чтобы использовать море для охлаждения и питать объект от офшорной ветроэнергии.
Первые тесты Lisuan LX 7G100 показали, что китайская видеокарта запускает современные игры, но заметно уступает RTX 4060. Главные проблемы — цена около $485 и слабое соотношение FPS к стоимости.
Минпромторг рассматривает требования по переходу ЦОДов на российское оборудование. Инициатива обсуждается на фоне резкого падения ввода новых мощностей и проблем с энергоподключением.
РТК-ЦОД представил «Ковчег» — модульный ЦОД для аварийного восстановления данных. Решение рассчитано на компании, которым нужно сохранить резервные копии даже при серьёзной атаке или сбое основной инфраструктуры.
Yadro представил три продукта для корпоративной инфраструктуры: коммутаторы Kornfeld SE, СХД Tatlin.Backup.L и сервер Vegman R215 G4. Новинки закрывают задачи сети, резервного хранения и вычислений в ЦОД.
В 2025 году в России ввели около 5000 стоек в ЦОДах против 14 тысяч годом ранее. Спрос растёт из-за облаков и ИИ, но отрасль упирается в энергию, окупаемость и сложность строительства.
К 2030 году до 25–30% дата-центров могут перейти на полностью автономное электроснабжение. Главная причина — дефицит сетевых мощностей и долгие сроки подключения новых объектов.
Пока это весь поток.