Почему AI упирается не только в GPU, но и в данные
В AI-инфраструктуре узким местом всё чаще становятся не GPU, а скорость подачи данных. MinIO и NVIDIA STX показывают, почему object storage, DPU и новые слои памяти становятся частью AI-фабрик.
24
kabooma
Новые опубликованные публичные топики, которые только начинают собирать участников.
Читайте всё сразу или соберите ленту из активных групп.
В AI-инфраструктуре узким местом всё чаще становятся не GPU, а скорость подачи данных. MinIO и NVIDIA STX показывают, почему object storage, DPU и новые слои памяти становятся частью AI-фабрик.
NVIDIA представила Nemotron-Labs Diffusion — семейство языковых моделей, которые могут генерировать текст не только слева направо, но и через diffusion-декодирование с параллельным уточнением токенов.
DeepSeek сделала скидку 75% на V4-Pro постоянной. API модели теперь стоит в четыре раза дешевле первоначального тарифа, что усиливает ценовую конкуренцию на рынке LLM.
Пока это весь поток.