Почему AI упирается не только в GPU, но и в данные
В AI-инфраструктуре узким местом всё чаще становятся не GPU, а скорость подачи данных. MinIO и NVIDIA STX показывают, почему object storage, DPU и новые слои памяти становятся частью AI-фабрик.
kabooma
Новые опубликованные публичные топики, которые только начинают собирать участников.
Читайте всё сразу или соберите ленту из активных групп.
В AI-инфраструктуре узким местом всё чаще становятся не GPU, а скорость подачи данных. MinIO и NVIDIA STX показывают, почему object storage, DPU и новые слои памяти становятся частью AI-фабрик.
CTO CoreWeave Peter Salanki объяснил, почему запуск ИИ в продакшене — это не только модель и GPU. Главные сложности часто лежат в сети, памяти, планировании задач, наблюдаемости и физической инфраструктуре дата-центров.
Облако стоит оценивать не по цене виртуальной машины, а по стоимости полезной работы: транзакции, пользовательского часа, тестового контура или продуктовой среды. Только так можно честно сравнить его со своим ЦОДом.
Microsoft, по сообщениям СМИ, сокращает внутреннее использование Claude Code и переводит сотрудников на GitHub Copilot CLI. За этим виден более широкий тренд: AI-агенты быстро расходуют токены, и компании начинают жёстче считать стоимость их работы.
Первые тесты Lisuan LX 7G100 показали, что китайская видеокарта запускает современные игры, но заметно уступает RTX 4060. Главные проблемы — цена около $485 и слабое соотношение FPS к стоимости.
Минпромторг рассматривает требования по переходу ЦОДов на российское оборудование. Инициатива обсуждается на фоне резкого падения ввода новых мощностей и проблем с энергоподключением.
News Radar в ymki будет внутренним инструментом для редакции и SEO: помогает видеть свежий контекст по темам, но не публикует материалы автоматически.
ИТ-холдинг Т1, по данным СМИ, обсуждает покупку доли в «Группе Астра», разработчике Astra Linux. Источники расходятся по параметрам: от 10–15% акций до пакета не менее 25% и оценки до 40 млрд рублей.
Минпромторг потребовал усилить проверку процессоров «Иртыш» из-за возможного сходства с китайскими Loongson. Разработчик настаивает на российской инженерной работе и лицензированном использовании LoongArch, но окончательный вывод должна дать экспертиза.
РТК-ЦОД, «Лукоморье», «Скайфолл Лабс» и Proto создают единую платформу для управления ИТ-сервисами и инфраструктурой. Она должна объединить ITSM, ITAM, мониторинг, observability, аналитику и сервисное взаимодействие.
Минпромторг прорабатывает механизм вывода особо значимых ИТ-проектов на зарубежные рынки. Потенциал есть у отраслевых решений, но экспорт потребует адаптации, партнёров и долгих вложений.
РТК-ЦОД представил «Ковчег» — модульный ЦОД для аварийного восстановления данных. Решение рассчитано на компании, которым нужно сохранить резервные копии даже при серьёзной атаке или сбое основной инфраструктуры.