Почему AI упирается не только в GPU, но и в данные
В AI-инфраструктуре узким местом всё чаще становятся не GPU, а скорость подачи данных. MinIO и NVIDIA STX показывают, почему object storage, DPU и новые слои памяти становятся частью AI-фабрик.
kabooma
Новые опубликованные публичные топики, которые только начинают собирать участников.
Читайте всё сразу или соберите ленту из активных групп.
В AI-инфраструктуре узким местом всё чаще становятся не GPU, а скорость подачи данных. MinIO и NVIDIA STX показывают, почему object storage, DPU и новые слои памяти становятся частью AI-фабрик.
CTO CoreWeave Peter Salanki объяснил, почему запуск ИИ в продакшене — это не только модель и GPU. Главные сложности часто лежат в сети, памяти, планировании задач, наблюдаемости и физической инфраструктуре дата-центров.
Первые тесты Lisuan LX 7G100 показали, что китайская видеокарта запускает современные игры, но заметно уступает RTX 4060. Главные проблемы — цена около $485 и слабое соотношение FPS к стоимости.
Alibaba представила ИИ-чип Zhenwu M890 и стоечную систему Panjiu AL128 на 128 ускорителей. Это часть стратегии компании по созданию собственного AI-стека — от железа до облака и моделей Qwen.
News Radar в ymki будет внутренним инструментом для редакции и SEO: помогает видеть свежий контекст по темам, но не публикует материалы автоматически.
ИТ-холдинг Т1, по данным СМИ, обсуждает покупку доли в «Группе Астра», разработчике Astra Linux. Источники расходятся по параметрам: от 10–15% акций до пакета не менее 25% и оценки до 40 млрд рублей.
Минпромторг потребовал усилить проверку процессоров «Иртыш» из-за возможного сходства с китайскими Loongson. Разработчик настаивает на российской инженерной работе и лицензированном использовании LoongArch, но окончательный вывод должна дать экспертиза.
РТК-ЦОД, «Лукоморье», «Скайфолл Лабс» и Proto создают единую платформу для управления ИТ-сервисами и инфраструктурой. Она должна объединить ITSM, ITAM, мониторинг, observability, аналитику и сервисное взаимодействие.
Даниэль Вавра снова резко высказался о состоянии геймдева: крупные студии, по его мнению, стали слишком дорогими и осторожными. На этом фоне он защищает авторский подход и считает ИИ неизбежным инструментом для будущей разработки игр.
Минпромторг прорабатывает механизм вывода особо значимых ИТ-проектов на зарубежные рынки. Потенциал есть у отраслевых решений, но экспорт потребует адаптации, партнёров и долгих вложений.
РТК-ЦОД представил «Ковчег» — модульный ЦОД для аварийного восстановления данных. Решение рассчитано на компании, которым нужно сохранить резервные копии даже при серьёзной атаке или сбое основной инфраструктуры.
«МегаФон» заключил соглашение с разработчиком «Телкор» и тестирует новое ядро для частных LTE- и 5G-сетей. Решение могут использовать в корпоративных проектах, если оно пройдёт проверки по производительности, совместимости и безопасности.