Почему AI упирается не только в GPU, но и в данные
В AI-инфраструктуре узким местом всё чаще становятся не GPU, а скорость подачи данных. MinIO и NVIDIA STX показывают, почему object storage, DPU и новые слои памяти становятся частью AI-фабрик.
kabooma
Новые опубликованные публичные топики, которые только начинают собирать участников.
Читайте всё сразу или соберите ленту из активных групп.
В AI-инфраструктуре узким местом всё чаще становятся не GPU, а скорость подачи данных. MinIO и NVIDIA STX показывают, почему object storage, DPU и новые слои памяти становятся частью AI-фабрик.
CTO CoreWeave Peter Salanki объяснил, почему запуск ИИ в продакшене — это не только модель и GPU. Главные сложности часто лежат в сети, памяти, планировании задач, наблюдаемости и физической инфраструктуре дата-центров.
DeepSeek сделала скидку 75% на V4-Pro постоянной. API модели теперь стоит в четыре раза дешевле первоначального тарифа, что усиливает ценовую конкуренцию на рынке LLM.
GitHub собрал раздел с техническими руководствами по разработке ПО: от контроля версий и тестирования до архитектуры, технического долга, SDLC и platform engineering. Это не новости, а спокойная база знаний для разработчиков и команд.
Первые тесты Lisuan LX 7G100 показали, что китайская видеокарта запускает современные игры, но заметно уступает RTX 4060. Главные проблемы — цена около $485 и слабое соотношение FPS к стоимости.
AI-инструменты вроде Copilot, Cursor и Claude Code меняют требования к начинающим разработчикам. Простых задач становится меньше, а от джунов всё чаще ждут самостоятельности, системного мышления и умения проверять машинный код.
News Radar в ymki будет внутренним инструментом для редакции и SEO: помогает видеть свежий контекст по темам, но не публикует материалы автоматически.
ИТ-холдинг Т1, по данным СМИ, обсуждает покупку доли в «Группе Астра», разработчике Astra Linux. Источники расходятся по параметрам: от 10–15% акций до пакета не менее 25% и оценки до 40 млрд рублей.
Минпромторг потребовал усилить проверку процессоров «Иртыш» из-за возможного сходства с китайскими Loongson. Разработчик настаивает на российской инженерной работе и лицензированном использовании LoongArch, но окончательный вывод должна дать экспертиза.
РТК-ЦОД, «Лукоморье», «Скайфолл Лабс» и Proto создают единую платформу для управления ИТ-сервисами и инфраструктурой. Она должна объединить ITSM, ITAM, мониторинг, observability, аналитику и сервисное взаимодействие.
Минпромторг прорабатывает механизм вывода особо значимых ИТ-проектов на зарубежные рынки. Потенциал есть у отраслевых решений, но экспорт потребует адаптации, партнёров и долгих вложений.
РТК-ЦОД представил «Ковчег» — модульный ЦОД для аварийного восстановления данных. Решение рассчитано на компании, которым нужно сохранить резервные копии даже при серьёзной атаке или сбое основной инфраструктуры.