Почему AI упирается не только в GPU, но и в данные
В AI-инфраструктуре узким местом всё чаще становятся не GPU, а скорость подачи данных. MinIO и NVIDIA STX показывают, почему object storage, DPU и новые слои памяти становятся частью AI-фабрик.
kabooma
Новые опубликованные публичные топики, которые только начинают собирать участников.
Читайте всё сразу или соберите ленту из активных групп.
В AI-инфраструктуре узким местом всё чаще становятся не GPU, а скорость подачи данных. MinIO и NVIDIA STX показывают, почему object storage, DPU и новые слои памяти становятся частью AI-фабрик.
CTO CoreWeave Peter Salanki объяснил, почему запуск ИИ в продакшене — это не только модель и GPU. Главные сложности часто лежат в сети, памяти, планировании задач, наблюдаемости и физической инфраструктуре дата-центров.
DeepSeek сделала скидку 75% на V4-Pro постоянной. API модели теперь стоит в четыре раза дешевле первоначального тарифа, что усиливает ценовую конкуренцию на рынке LLM.
Группа TeamPCP массово заражает open source-пакеты и инструменты разработчиков. Один из громких эпизодов затронул внутренние репозитории GitHub после установки вредоносного расширения для VS Code.
Первые тесты Lisuan LX 7G100 показали, что китайская видеокарта запускает современные игры, но заметно уступает RTX 4060. Главные проблемы — цена около $485 и слабое соотношение FPS к стоимости.
В npm выявили новую волну Mini Shai-Hulud: за короткое время злоумышленники опубликовали 639 вредоносных версий в 323 пакетах, связанных с AntV и популярными JavaScript-библиотеками. Вредонос крал секреты и мог распространяться дальше через npm-токены.
Пока это весь поток.