Meta ускоряет разработку собственных AI-чипов MTIA
*Meta рассказала о развитии собственной линейки AI-чипов MTIA — Meta Training and Inference Accelerator. Компания делает на них ставку как на часть инфраструктуры, которая должна обслуживать ИИ-функции для миллиардов пользователей: от рекомендаций до ассистентов и генеративных моделей.
Модели меняются быстрее, чем классический цикл разработки железа. Поэтому компания пытается выпускать новые поколения ускорителей чаще и точнее подстраивать их под реальные нагрузки.
Четыре поколения за короткий срок
После MTIA 100 и MTIA 200 компания ускорила разработку сразу по четырём следующим поколениям: MTIA 300, MTIA 400, MTIA 450 и MTIA 500. Часть из них уже используется или готовится к внедрению, а массовые развёртывания MTIA 450 и MTIA 500 запланированы на 2027 год.
По словам *Meta, в production уже работают сотни тысяч MTIA-чипов. Это важная деталь: речь не о лабораторном эксперименте, а о железе, которое постепенно встраивают в реальные сервисы компании.
Коротко: *Metaне отказывается от внешних решений, но хочет иметь собственный слой ускорителей для задач, где важны масштаб и стоимость.
Почему фокус смещается к inference
В материале отдельно подчёркивается, что новые MTIA всё больше оптимизируют под GenAI inference — то есть под запуск уже обученных моделей для ответа пользователям. Это логично: обучение больших моделей требует огромных ресурсов, но ежедневное обслуживание запросов миллиардов людей тоже становится отдельной дорогой задачей.
MTIA 300 изначально был ближе к задачам ranking and recommendation, то есть ранжированию и рекомендациям. MTIA 400 уже лучше адаптировали под GenAI, а MTIA 450 и 500 получили дополнительные оптимизации именно для генеративного inference.
Память, скорость и чиплеты
*Meta делает акцент на пропускной способности памяти HBM и модульной архитектуре. От MTIA 300 до MTIA 500 пропускная способность HBM выросла в 4,5 раза, а compute FLOPS — в 25 раз, если сравнивать заявленные параметры в линейке.
Для MTIA 450 компания удвоила HBM bandwidth относительно MTIA 400, а для MTIA 500 добавила ещё 50% к MTIA 450. В таких задачах память часто становится не менее важной, чем «сырая» вычислительная мощность: модели нужно быстро читать и передавать огромные объёмы данных.
*Meta также использует модульный подход с chiplets. Это позволяет обновлять отдельные блоки быстрее и не ждать несколько лет до следующего большого поколения.
Софт не менее важен, чем железо
Ещё один заметный акцент — совместимость с привычным стеком разработки. MTIA строится вокруг PyTorch, а также использует vLLM, Triton и подходы Open Compute Project. Для разработчиков внутри компании это должно снижать трение: модели можно переносить на MTIA без полного переписывания под новое железо. Стек поддерживает eager и graph modes, интеграцию с torch.compile и torch.export, а также инструменты мониторинга, профилирования и отладки для production-среды.
Где остаются вопросы
Материал *Meta подробно рассказывает о стратегии и технических улучшениях, но это всё же текст самой компании. В нём мало независимых сравнений с GPU и почти нет деталей о стоимости владения, энергопотреблении в реальных сценариях и ограничениях при разных типах моделей.
Тем не менее направление понятно. Большие AI-компании всё чаще хотят контролировать не только модели и приложения, но и железо под ними. Когда inference становится массовой услугой, собственный чип — это уже не имиджевый проект, а способ считать экономику на годы вперёд.
5. Почему это интересно
История MTIA показывает, что гонка в ИИ идёт не только вокруг моделей, но и вокруг инфраструктуры. Чем больше пользователей общается с AI-сервисами каждый день, тем важнее становятся стоимость одного запроса, память, охлаждение, сетевые задержки и удобство переноса моделей. *Meta фактически говорит: универсальные GPU остаются важны, но для части массовых задач компания хочет более точное собственное железо. Это может стать обычной логикой для крупных платформ, у которых есть достаточно масштаба.
Итог
Компания пытается сделать железо ближе к темпу развития моделей, и это выглядит разумно для такого масштаба. Но оценивать MTIA только по заявленным приростам нельзя: реальные преимущества проявятся в стоимости, стабильности и удобстве эксплуатации в дата-центрах. Для обычного пользователя это останется невидимым, но именно такие вещи будут определять, насколько доступными и быстрыми станут AI-функции внутри больших сервисов.
Источник: Meta AI
* Компания Meta и её продукты признаны экстремистскими, их деятельность запрещена на территории РФ.
Подписка
Сейчас: Не подписан
Участники
0Видимых участников обсуждения пока нет.
Лучшие комментарии
Лучшие комментарии появятся после первых оценок и ответов.
Активные ветки
Активные ветки появятся, когда у корневых комментариев будут ответы.
Комментарии
0 всегоНаписать комментарий
Войдите, чтобы участвовать в обсуждении.
Комментариев пока нет. Можно начать ветку первым.
ymki
Цитаты из этого топика
Последние цитаты, созданные из текста топика и его комментариев.
Этот топик пока не цитировали.