kabooma

Свежее

Новые опубликованные публичные топики, которые только начинают собирать участников.

Интересы

Читайте всё сразу или соберите ленту из активных групп.

Сбросить

Почему AI упирается не только в GPU, но и в данные

Потоки данных передаются от хранилища к GPU-серверам в дата-центре.

В AI-инфраструктуре узким местом всё чаще становятся не GPU, а скорость подачи данных. MinIO и NVIDIA STX показывают, почему object storage, DPU и новые слои памяти становятся частью AI-фабрик.

22

Что на самом деле нужно для запуска AI в production

Серверные стойки и светящаяся нейросеть в дата-центре.

CTO CoreWeave Peter Salanki объяснил, почему запуск ИИ в продакшене — это не только модель и GPU. Главные сложности часто лежат в сети, памяти, планировании задач, наблюдаемости и физической инфраструктуре дата-центров.

21

DeepSeek закрепила скидку на V4-Pro и давит на рынок ценой

Нейросетевой чип и график снижения стоимости AI-модели.

DeepSeek сделала скидку 75% на V4-Pro постоянной. API модели теперь стоит в четыре раза дешевле первоначального тарифа, что усиливает ценовую конкуренцию на рынке LLM.

39

Дата-центры уходят под воду: зачем серверам море

Водолаз осматривает подводный дата-центр с серверными модулями.

У побережья Шанхая запустили подводный дата-центр Shanghai Lingang UDC. Серверы разместили в герметичных модулях под водой, чтобы использовать море для охлаждения и питать объект от офшорной ветроэнергии.

24

Китайская Lisuan LX 7G100 пока не догнала RTX 4060

елёная видеокарта Nvidia побеждает китайского GPU-соперника на боксёрском ринге.

Первые тесты Lisuan LX 7G100 показали, что китайская видеокарта запускает современные игры, но заметно уступает RTX 4060. Главные проблемы — цена около $485 и слабое соотношение FPS к стоимости.

42

ЦОДам не хватает энергии: спрос растёт, новые стойки вводят медленнее

Дата-центр, которому требуется больше энергии для роста ИИ-нагрузок

В 2025 году в России ввели около 5000 стоек в ЦОДах против 14 тысяч годом ранее. Спрос растёт из-за облаков и ИИ, но отрасль упирается в энергию, окупаемость и сложность строительства.

344

Дата-центры всё чаще смотрят на собственную энергогенерацию

К 2030 году до 25–30% дата-центров могут перейти на полностью автономное электроснабжение. Главная причина — дефицит сетевых мощностей и долгие сроки подключения новых объектов.

38

Пока это весь поток.