Listen Top Shows Blog

047. Как запустить LLM (generative AI) на AWS

047. Как запустить LLM (generative AI) на AWS

Update: 2024-05-10

Share

Description

Хотите понять, как работать с большими языковыми моделями в облаке AWS? В этом выпуске мы пригласили Рустема (Rustem Feyzkhanov) - специалиста по машинному обучению и AWS Hero. Мы подробно разобрали разные варианты деплоя LLM:

•Amazon Bedrock - сервис для быстрого запуска популярных моделей
•Amazon SageMaker JumpStart - кастомные модели в пару кликов
•Hugging Face Estimator - доступ к библиотеке моделей Hugging Face
•Развертывание в контейнерах ECS и на GPU-инстансах EC2
•AWS Lambda - какие особенности надо учесть при таком запуске

С чего начать, что выбрать под свой кейс, как оптимизировать затраты - ответы в подкасте.

Слушайте, пробуйте!

Ссылки упомянутые во время подкаста:

Слайды с Реинвента https://www.dropbox.com/scl/fi/m72mosktms8k43q4ktpsx/Feyzkhanov_AWS_GenAI_Services_And_Options.pdf?rlkey=2p35imid8xxbhjyfunbj2m9ya&dl=0

Пример Mistral 7B на SageMaker JumpStart https://aws.amazon.com/blogs/machine-learning/mistral-7b-foundation-models-from-mistral-ai-are-now-available-in-amazon-sagemaker-jumpstart/

Использование HuggingFace для деплоя моделей на SageMaker https://huggingface.co/docs/sagemaker/inference

Использование AWS Lambda для хостинга Mistral 7B https://aws.plainenglish.io/serverless-compute-for-llm-with-a-step-by-step-guide-for-hosting-mistral-7b-on-aws-lambda-0a267e153cae

Использование ECS Fargate для хостинга LLAMA 2 https://aws.plainenglish.io/guide-for-running-llama-2-using-llama-cpp-on-aws-fargate-7086bcd1ed3c

Hugging face Inferentia 2 https://huggingface.co/blog/inferentia-llama2

Comments

In Channel

065. ClickHouse на AWS: скорость данных для AI и аналитики

2025-08-2949:09

064. MCP: Как подключить любой инструмент к AI за 5 минут?

064. MCP: Как подключить любой инструмент к AI за 5 минут?

2025-08-0731:32

061. Prompt Engineering: Как заставить AI работать на максимум?

2025-03-2042:30

060. Что такое Amazon SageMaker Lakehouse и что общего между айсбергом и хранилищем данных? 🤔

2025-02-2037:48

059. Масштабирование SaaS с Enterprise Support в регионе CEE

059. Масштабирование SaaS с Enterprise Support в регионе CEE

2025-01-2332:41

058. Новостной выпуск перед reInvent 2024

2024-11-2943:25

057. Reliability vs Resilience: в чем разница и почему это важно для вашего бизнеса?

057. Reliability vs Resilience: в чем разница и почему это важно для вашего бизнеса?

2024-11-2343:41

056. Безопасность генеративного ИИ: о чем нужно знать прямо сейчас?

056. Безопасность генеративного ИИ: о чем нужно знать прямо сейчас?

2024-11-0733:40

055. Кто такой TAM (Technical Account Manager)?

055. Кто такой TAM (Technical Account Manager)?

2024-10-3143:41

054. Как Community Day меняет IT-ландшафт Центральной Азии

054. Как Community Day меняет IT-ландшафт Центральной Азии

2024-10-2428:37

053. Генеративный ИИ: от хайпа к реальным бизнес-кейсам!

053. Генеративный ИИ: от хайпа к реальным бизнес-кейсам!

2024-10-1744:23

052. Инновации в Amazon: от книг до облаков!

052. Инновации в Amazon: от книг до облаков!

2024-10-1049:00

051. Миграция баз данных: лучшие практики от AWS - Часть 2

051. Миграция баз данных: лучшие практики от AWS - Часть 2

2024-10-0335:00

050. Новости за первое полугодие 2024 в AWS

050. Новости за первое полугодие 2024 в AWS

2024-07-1839:04

049. Миграция баз данных: лучшие практики от AWS

049. Миграция баз данных: лучшие практики от AWS

2024-07-0931:26

048. Аутентификация и авторизация с AWS Cognito

048. Аутентификация и авторизация с AWS Cognito

2024-06-0628:54

047. Как запустить LLM (generative AI) на AWS

047. Как запустить LLM (generative AI) на AWS

2024-05-1030:51

046. Бережливый архитектор

2024-03-2039:44

045. Оптимизация и тестирование Serverless в AWS

045. Оптимизация и тестирование Serverless в AWS

2024-02-2944:50

044. Кто такой аккаунт-менеджер в AWS?

044. Кто такой аккаунт-менеджер в AWS?

2024-02-2240:02

00:00

00:00

1.0x

047. Как запустить LLM (generative AI) на AWS

047. Как запустить LLM (generative AI) на AWS

Viktor Vedmich