Почему AI упирается не только в GPU, но и в данные
В AI-инфраструктуре узким местом всё чаще становятся не GPU, а скорость подачи данных. MinIO и NVIDIA STX показывают, почему object storage, DPU и новые слои памяти становятся частью AI-фабрик.
kabooma
Новые опубликованные публичные топики, которые только начинают собирать участников.
Читайте всё сразу или соберите ленту из активных групп.
В AI-инфраструктуре узким местом всё чаще становятся не GPU, а скорость подачи данных. MinIO и NVIDIA STX показывают, почему object storage, DPU и новые слои памяти становятся частью AI-фабрик.
CTO CoreWeave Peter Salanki объяснил, почему запуск ИИ в продакшене — это не только модель и GPU. Главные сложности часто лежат в сети, памяти, планировании задач, наблюдаемости и физической инфраструктуре дата-центров.
Microsoft, по сообщениям СМИ, сокращает внутреннее использование Claude Code и переводит сотрудников на GitHub Copilot CLI. За этим виден более широкий тренд: AI-агенты быстро расходуют токены, и компании начинают жёстче считать стоимость их работы.
DeepSeek сделала скидку 75% на V4-Pro постоянной. API модели теперь стоит в четыре раза дешевле первоначального тарифа, что усиливает ценовую конкуренцию на рынке LLM.
Первые тесты Lisuan LX 7G100 показали, что китайская видеокарта запускает современные игры, но заметно уступает RTX 4060. Главные проблемы — цена около $485 и слабое соотношение FPS к стоимости.
Пока это весь поток.