Información general

AWS Lambda es un servicio de computación sin servidor que permite ejecutar código sin aprovisionar ni administrar servidores. Cree una lógica de escalado de clústeres que tenga en cuenta la carga de trabajo, mantenga las integraciones de eventos y administre los tiempos de ejecución con facilidad. Con Lambda, puede ejecutar código para casi cualquier aplicación o servicio backend sin administración de servidores y con un modelo de pago basado únicamente en el uso real. El cobro se determina por la cantidad de solicitudes para las funciones y el tiempo de ejecución del código.

Lambda cuenta una solicitud cada vez que comienza a ejecutarse en respuesta a un desencadenador de notificación de eventos (desde Amazon Simple Notification Service (SNS) o Amazon EventBridge, por ejemplo) o una llamada de invocación (desde Amazon API Gateway, por ejemplo) o a través de AWS SDK, lo que incluye las invocaciones de prueba desde la consola de AWS.

La duración se calcula desde el momento en que el código inicia la ejecución hasta que devuelve una respuesta o termina por cualquier motivo, redondeada al milisegundo más cercano.* El precio depende de la cantidad de memoria asignada a la función. En el modelo de recursos de AWS Lambda, debe elegir el volumen de memoria que desea para la función y, posteriormente, se asignará la capacidad proporcional de CPU y de otros recursos. Un aumento en el tamaño de la memoria provoca un incremento equivalente en la CPU disponible para la función. Para obtener más información, consulte la documentación sobre la configuración de funciones.

Puede ejecutar las funciones de Lambda en procesadores basados en arquitecturas x86 o Arm. Las funciones de AWS Lambda que se ejecutan en Graviton2, con una arquitectura de procesador basada en Arm diseñada por AWS, ofrecen un rendimiento de precios hasta un 34 % mejor en comparación con las funciones que se ejecutan en procesadores x86. Esto se aplica a una variedad de cargas de trabajo sin servidor, como aplicaciones web y móviles, backends, procesamiento de datos y procesamiento de contenido multimedia.

* Los cargos por duración se aplican al código que se ejecuta dentro del controlador de la función, así como al código de inicialización declarado fuera del controlador. En el caso de las funciones de Lambda con extensiones de AWS Lambda, la duración también incluye el tiempo que tarda el código de la última extensión en ejecución en terminar de ejecutarse durante la fase de cierre. En el caso de las funciones de Lambda configuradas con SnapStart, la duración también incluye el tiempo que tarda en cargarse el tiempo de ejecución, cualquier código que se ejecute en un enlace de versión ejecutable, y el código de inicialización ejecutado durante la creación de las copias de instantáneas usadas para la resiliencia. Para obtener más información, consulte la documentación del modelo de programación de Lambda.

El nivel gratuito de AWS Lambda incluye un millón de solicitudes gratuitas por mes y 400 000 GB-segundos de tiempo de computación por mes, utilizable para funciones basadas en procesadores x86 y Graviton2, en total. Además, el nivel gratuito incluye 100 GiB por mes de transmisión de respuestas HTTP, más allá de los primeros 6 MB por solicitud, que no tienen costo. Lambda también ofrece opciones de precios por niveles para la duración bajo demanda que supera ciertos umbrales de uso mensual. AWS Lambda forma parte de Savings Plans para computación, un modelo de precios flexible que ofrece precios económicos por el uso de Amazon Elastic Compute Cloud (Amazon EC2), AWS Fargate y Lambda a cambio de comprometerse a una cantidad constante de uso (medida en EUR/hora) durante un plazo de uno o tres años. Con Savings Plans para computación puede ahorrar hasta un 15 % en AWS Lambda. El ahorro se aplica a la duración y a la simultaneidad aprovisionada. Más información
 

people at desk

Calculadora de precios de AWS

Calcule el costo de su AWS Lambda y el de la arquitectura en una sola cotización.

Cree una cotización personalizada ahora

hands with calculator

Precios de AWS Lambda

El costo de la duración depende del volumen de memoria asignado a la función. Puede asignar cualquier cantidad de memoria a la función entre 128 MB y 10 240 MB, en incrementos de 1 MB. La siguiente tabla muestra algunos ejemplos del precio por cada 1 ms asociado a distintos tamaños de memoria, para un uso dentro del primer nivel de precios (por ejemplo, hasta 6000 millones de GB-segundos al mes en la región de la UE [Alemania]).

  • Precio de x86
  • Precio de Arm

Los niveles de precios de duración bajo demanda de Lambda se aplican a la duración mensual agregada de sus características que se ejecutan en la misma arquitectura (x86 o Arm, respectivamente), en la misma región y dentro de la cuenta. Si utiliza la facturación unificada en AWS Organizations, los niveles de precios se aplican a la duración mensual agregada de sus características que se ejecutan en la misma arquitectura, en la misma región y en todas las cuentas de la organización.

Precios del almacenamiento efímero de Lambda

Los costos del almacenamiento efímero dependen de la cantidad de almacenamiento efímero que se asigne a la función y de la duración de ejecución de la función, medida en milisegundos. Puede asignar a la función cualquier cantidad adicional de almacenamiento entre 512 MB y 10 240 MB en incrementos de 1 MB. Puede configurar el almacenamiento efímero para las funciones que se ejecutan en arquitecturas x86 y Arm. Para cada función de Lambda, están disponibles 512 MB de almacenamiento efímero sin costo adicional. Solo paga por el almacenamiento efímero adicional que configure.

Todos los ejemplos siguientes se basan en el precio en la UE (Alemania).

  • Supongamos que es un desarrollador de aplicaciones móviles que crea una aplicación para pedir comida. Los clientes pueden utilizar la aplicación para pedir comida en un restaurante concreto, recibir actualizaciones sobre el estado del pedido y recogerlo cuando esté listo. Debido a que espera una gran variación en la demanda, tanto por la hora del día como por la ubicación del restaurante, crea su backend móvil mediante servicios sin servidor, lo que incluye a AWS Lambda.

    Para simplificar, supongamos que su aplicación procesa tres millones de solicitudes al mes. La duración media de la ejecución de la función es de 120 ms. Se ha configurado la función con 1536 MB de memoria en un procesador basado en x86. Los cargos se calcularían de la siguiente manera:

    Cargos de computación mensuales

    El precio de mensual por computación es de 0,0000164477 EUR por GB-s. El nivel gratuito ofrece 400 000 GB-s.
    Computación total (segundos) = 3 millones * 120 ms = 360 000 segundos
    Capacidad de computación total (GB-s) = 360 000 * 1536 MB/1024 MB = 540 000 GB-s
    Computación total – computación del nivel gratuito = GB-s de computación facturable al mes
    540 000 GB-s – 400 000 GB-s del nivel gratuito = 140 000 GB-s
    Cargos de computación mensuales = 140 000 * 0,0000164477 EUR = 2,30 EUR

    Cargos de solicitudes mensuales

    El precio mensual por solicitudes es de 0,1974 EUR por un millón de solicitudes y el nivel gratuito ofrece un millón de solicitudes al mes.
    Solicitudes totales – Solicitudes del nivel gratuito = Solicitudes facturables al mes
    3 millones de solicitudes – 1 millón de solicitudes en el nivel gratuito = 2 millones de solicitudes mensuales facturables
    Cargos de solicitudes mensuales = 2 millones * 0,1974 EUR/1 millón = 0,3948 EUR

    Cargos mensuales totales

    Cargos totales = cargos de computación + cargos de solicitud = 2,30 EUR + 0,3948 EUR = 2,6948 EUR al mes

  • Digamos que es una empresa de logística con una flota de vehículos en el sitio, cada uno de los cuales está habilitado con sensores y conectividad 4G o 5G para emitir datos de telemetría en un flujo de datos de Amazon Kinesis. Desea utilizar los modelos de machine learning (ML) que ha desarrollado para inferir el estado del vehículo y predecir cuándo podría ser necesario el mantenimiento de determinados componentes.

    Supongamos que hay 10 000 vehículos en el sitio, cada uno de los cuales emite telemetría una vez por hora de forma escalonada con suficiente fluctuación. Pretende llevar a cabo esta inferencia en cada carga para asegurarse de que los vehículos están programados puntualmente para el mantenimiento y garantizar el estado óptimo de su flota.

    Supongamos que el modelo de ML está empaquetado junto con la función y tiene un tamaño de 512 MB. Para la inferencia, ha configurado su función con 1 GB de memoria y la ejecución de la función tarda una media de 2 segundos en completarse en un procesador basado en x86.

    Cargos de solicitudes mensuales:
    Al mes, los vehículos emitirán 10 000 * 24 * 31 = 7 440 000 mensajes que serán procesados por la función de Lambda.

    Cargos de solicitudes mensuales → 7,44 millones * 0,1974 EUR/millón = 1,468 EUR ~= 1,47 EUR

    Cargos de computación mensuales:
    Al mes, las funciones se ejecutarán una vez por mensaje durante 2 segundos.
    Duración mensual de informática (segundos) → 7,44 millones * 2 segundos = 14,88 millones de segundos
    Computación mensual (GB-s) → 14,88 millones de segundos * 1024 MB/1024 MB = 14,88 GB-s
    Cargos de computación mensuales → 14,88 millones de GB-s * 0,0000164477 EUR = 244,74 EUR

    Cargos mensuales totales:
    Cargos mensuales totales = cargos por solicitudes + cargos por informática = 1,47 EUR + 244,74 EUR = 246,21 EUR

  • Supongamos que es una empresa de servicios financieros que desea conocer mejor sus principales problemas de atención al cliente. Su objetivo es mejorar la experiencia del cliente y reducir la pérdida de clientela. Los clientes pueden conversar en directo con el personal de atención al cliente a través de la aplicación móvil que proporcione. Decide implementar un modelo de procesamiento de lenguaje natural (PLN).

    En este caso, utiliza el popular modelo de Representación de Codificador Bidireccional de Transformadores (BERT) en AWS Lambda. El modelo le ayuda a analizar sintácticamente, examinar y comprender las interacciones del servicio de atención al cliente a través de la aplicación móvil con el fin de mostrar el contenido de asistencia pertinente o derivar al cliente al agente de atención adecuado. El número de consultas de asistencia que procesa su modelo de inferencia varía mucho a lo largo de la semana.

    Supongamos que sus funciones que ejecutan el modelo de inferencia reciben 6 millones de solicitudes al mes. La duración media de la ejecución de la función es de 280 ms. Se ha configurado la función con 4096 MB de memoria en un procesador basado en x86.

    También configura la función para que utilice 2048 MB de almacenamiento efímero.

    Los cargos se calcularían de la siguiente manera:

    Cargos de computación mensuales:
    El precio de mensual por computación es de 0,0000164477 EUR por GB-s. El nivel gratuito ofrece 400 000 GB-s.
    Informática total (segundos) = 6 millones * 280 ms = 1 680 000 segundos
    Computación total (GB-s) = 1 680 000 * 4096 MB/1024 MB = 6 720 000 GB-s
    Computación total – computación del nivel gratuito = GB-s de computación facturable al mes
    6 720 000 GB-s – 400 000 GB-s del nivel gratuito = 6 320 000 GB-s
    Cargos de computación mensuales = 6 320 000 * 0,0000164477 EUR ~= 103,949 EUR ~= 103,95 EUR

    Cargos de solicitudes mensuales:
    El precio mensual por solicitudes es de 0,1974 EUR por un millón de solicitudes y el nivel gratuito ofrece un millón de solicitudes al mes.
    Solicitudes totales – Solicitudes del nivel gratuito = Solicitudes facturables al mes
    6 millones de solicitudes – 1 millón de solicitudes en el nivel gratuito = 5 millones de solicitudes mensuales facturables
    Cargos de solicitudes mensuales = 5 millones * 0,1974 EUR por millón = 0,987 EUR

    Cargos mensuales por almacenamiento efímero:
    El precio mensual por almacenamiento efímero es de 0,0000000362 EUR por cada GB-segundo y Lambda ofrece 512 MB de almacenamiento sin costo adicional.
    Informática total (segundos) = 6 millones * 280 ms = 1 680 000 segundos
    Almacenamiento efímero total facturable = 2048 MB – 512 MB = 1536 MB
    Almacenamiento efímero total (GB-s) = 1 680 000 * 1536 MB/1024 MB = 2 520 000 GB-s
    Cargos mensuales por almacenamiento efímero = 2 520 000 * 0,0000000362 EUR = 0,09 EUR

    Cargos mensuales totales:
    Cargos totales = cargos de computación + cargos de solicitudes = 103,95 EUR + 0,987 EUR + 0,09 EUR = 105,027 EUR al mes

Precios de la simultaneidad aprovisionada

Para tener mayor control sobre el rendimiento de sus aplicaciones sin servidor, habilite la simultaneidad aprovisionada para sus funciones Lambda. Cuando se habilita, la simultaneidad aprovisionada mantiene las funciones activadas y en el mayor estado de preparación para responder en milisegundos de dos dígitos. Paga por la cantidad de simultaneidad que configura y por el periodo por el que lo hace. Cuando la simultaneidad aprovisionada está habilitada y se ejecuta para su función, también paga por las solicitudes y por la duración en función de los precios que se muestran a continuación. Si la función supera la simultaneidad configurada, se cobrará por la ejecución excedente según la tarifa especificada en la sección de precios de AWS Lambda. Puede activar la simultaneidad aprovisionada para las funciones que se ejecutan en las arquitecturas x86 y Arm. Para obtener más información sobre la simultaneidad aprovisionada, consulte la documentación.

La simultaneidad aprovisionada se calcula desde el momento en que la habilita para su función hasta que la desactiva y se redondea a los 5 minutos más cercanos. El precio depende del volumen de memoria que asigne a su función y la cantidad de simultaneidad que configure. La duración se calcula a partir del momento en que el código comienza a ejecutarse hasta que regresa o finaliza de algún modo, y se redondea al 1 ms más cercano**. El precio depende de la cantidad de memoria asignada a la función.

** Los cargos de duración se aplican al código que se ejecuta en el gestor de una función, así como al código de inicialización que se declara fuera del gestor. En el caso de las funciones de Lambda con extensiones de AWS Lambda, la duración también incluye el tiempo que tarda el código de la última extensión en ejecución en terminar de ejecutarse durante la fase de cierre. Para las funciones configuradas con simultaneidad aprovisionada, AWS Lambda recicla periódicamente los entornos de ejecución y repite el código de inicialización. Para obtener más información, consulte la documentación del modelo de programación de Lambda.

Todos los ejemplos siguientes se basan en el precio en la UE (Alemania).

  • Supongamos que es desarrollador de aplicaciones móviles y crea una aplicación móvil para pedir comida. Los clientes pueden utilizar la aplicación para pedir comida en un restaurante concreto, recibir actualizaciones sobre el estado del pedido y recogerlo cuando esté listo. Debido a que espera una gran variación en la demanda de su aplicación, tanto por la hora del día como por la ubicación del restaurante, crea su backend móvil mediante servicios sin servidor, lo que incluye a AWS Lambda.

    Para simplificar, supongamos que su aplicación procesa tres millones de solicitudes al mes. La duración media de la ejecución de la función es de 120 ms. Se ha configurado la función con 1536 MB de memoria, en un procesador basado en x86.

    Va a hacer el lanzamiento de la nueva versión de su aplicación móvil, que ha comercializado intensamente. Espera un pico en la demanda durante el día del lanzamiento, desde el mediodía hasta las 8 de la tarde. Quiere que su aplicación móvil tenga capacidad de respuesta incluso cuando la demanda aumenta y disminuye rápidamente, por lo que habilita la simultaneidad aprovisionada en sus funciones Lambda. Establece la simultaneidad aprovisionada en 100.

    Durante esas ocho horas, sus funciones recibieron 500 000 solicitudes. La duración media de ejecución de la función mientras la simultaneidad aprovisionada está habilitada es de 100 ms. Durante el resto del mes, su aplicación recibe las 2,5 millones de solicitudes adicionales y las funciones se ejecutan en respuesta a ellas sin que esté habilitada la simultaneidad aprovisionada.

    Los cargos se calcularían de la siguiente manera:

    Cargos por simultaneidad aprovisionada:
    El precio de la simultaneidad aprovisionada es de 0,0000049488 EUR por cada GB-s.
    Periodo total en que la simultaneidad aprovisionada está habilitada (segundos) = 8 horas = 3600 segundos = 28 800 segundos
    Simultaneidad configurada total (GB): 100 * 1536 MB/1024 MB = 150 GB
    Cantidad total de simultaneidad aprovisionada (GB-s) = 150 GB * 28 800 segundos = 4 320 000 GB-s
    Cargos por simultaneidad aprovisionada: 4,32 millones de GB-s * 0,0000049488 EUR = 21.378 EUR

    Cargos por solicitudes:
    El precio por solicitudes mensuales es de 0,1974 EUR por cada millón de solicitudes y el nivel gratuito ofrece un millón de solicitudes al mes.
    Solicitudes totales – Solicitudes del nivel gratuito = Solicitudes facturables al mes
    3 000 000 de solicitudes – 1 millón de solicitudes en el nivel gratuito = 2 000 000 de solicitudes facturables al mes
    Cargos de solicitudes mensuales = 2 millones * 0,1974 EUR = 0,3948 EUR

    Cargos de computación cuando la simultaneidad aprovisionada está habilitada:
    El precio de computación es de 0,0000115473 EUR por GB-s
    Duración total de informática (segundos) = 500 000 * 100 ms = 50 000 segundos
    Computación total (GB-s) = 50 000 segundos * 1536 MB/1024 MB = 75 000 GB-s.
    Cargos de computación totales = 75 000 GB-s * 0,0000115473 EUR = 0,866 EUR

    Cargos por computación cuando la simultaneidad aprovisionada está desactivada:
    El precio de mensual por computación es de 0,0000164477 EUR por GB-s. El nivel gratuito ofrece 400 000 GB-s.
    Informática total (segundos) = 2,5 millones * 120 ms = 300 000 segundos
    Informática total (GB-s) = 300 000 * 1536 MB/1024 MB = 450 000 GB-s
    Computación total – Computación del nivel gratuito = GB-s de computación facturable al mes
    450 000 GB-s – 400 000 GB-s del nivel gratuito = 50 000 GB-s
    Cargos de computación mensuales = 50 000 * 0,0000164477 EUR = 0,82 EUR

    Cargos mensuales totales:
    Cargos totales = cargos de simultaneidad aprovisionada + cargos por solicitud + cargos por informática cuando la simultaneidad aprovisionada está habilitada + cargos por informática cuando la simultaneidad aprovisionada está desactivada
    Cargos totales = 21,378 EUR + 0,3948 EUR + 0,866 EUR + 0,82 EUR = 23,458 EUR

  • Supongamos que es un minorista que lleva a cabo una gran venta durante Cyber Monday, una fiesta del comercio electrónico que tiene lugar el lunes después de Acción de Gracias en Estados Unidos. Sus clientes pueden conversar en directo con el servicio de asistencia a través de la aplicación móvil que proporcione. Decide implementar un modelo de procesamiento de lenguaje natural (PLN).

    En este caso, utiliza el popular modelo de Representación de Codificador Bidireccional de Transformadores (BERT) en AWS Lambda. El modelo lo ayuda a analizar sintácticamente, examinar y comprender las interacciones del servicio de atención al cliente a través de la aplicación móvil con el fin de mostrar el contenido de asistencia pertinente o dirigir al cliente con el agente de atención adecuado. Durante esta venta recibirá muchas más consultas de asistencia al cliente de lo habitual, por lo que decide habilitar simultaneidad aprovisionada en sus funciones Lambda para que la aplicación responda rápidamente incluso cuando experimente picos de tráfico.

    Supongamos que sus funciones reciben dos millones de solicitudes durante las 24 horas del evento de venta, mientras la simultaneidad aprovisionada está habilitada. La duración media de la ejecución de la función es de 280 ms. Se ha configurado la función con 4096 MB de memoria en un procesador basado en x86 y se estableció la simultaneidad aprovisionada en siete.

    Los cargos se calcularían de la siguiente manera:

    Cargos por simultaneidad aprovisionada:
    El precio de la simultaneidad aprovisionada es de 0,0000049488 EUR por cada GB-s.
    Periodo total en que la simultaneidad aprovisionada está habilitada (segundos) = 24 horas = 3600 segundos = 86 400 segundos
    Simultaneidad configurada total (GB): 7 * 4096 MB/1024 MB = 28 GB
    Cantidad total de simultaneidad aprovisionada (GB-s) = 28 GB * 86 400 segundos = 2 419 200 GB-s
    Cargos por simultaneidad aprovisionada = 2 419 200 GB-s * 0,0000049488 EUR = 11,97 EUR

    Cargos de computación cuando la simultaneidad aprovisionada está habilitada:
    El precio de computación es de 0,0000115473 EUR por GB-s
    Duración total de informática (segundos) = 2 000 000 * 280 ms = 560 000 segundos
    Computación total (GB-s) = 560 000 segundos * 4096 MB/1024 MB = 2 240 000 GB-s.
    Cargos de computación totales = 2 240 000 GB-s * 0,0000115473 EUR = 25,86 EUR

    Cargos de solicitudes mensuales:
    El precio mensual por solicitudes es de 0,1974 EUR por cada millón de solicitudes
    Cargos de solicitudes mensuales = 2 millones * 0,1974 EUR/1 millón = 0,3948 EUR

    Cargos mensuales totales:
    Cargos totales = cargos de simultaneidad aprovisionada + cargos de computación cuando la simultaneidad aprovisionada está habilitada + cargos de solicitudes = 11,97 EUR + 25,86 EUR + 0,3948 EUR = 38,2248 EUR ~= 38.22 EUR

Transferencia de datos y otros cargos

Transferencia de datos
Los datos que se transfieren tanto desde como hacia las funciones de AWS Lambda desde fuera de la región en la que se ejecutan se cobrarán según los precios para transferencias de datos de Amazon EC2 tal y como se describen en la sección “Transferencia de datos”.

La transferencia de datos con AWS Lambda Functions es gratuita en la misma región de AWS entre los siguientes servicios: Amazon Simple Storage Service (S3), Amazon Glacier, Amazon DynamoDB, Amazon Simple Email Service (SES), Amazon Simple Queue Service (SQS), Amazon Kinesis, Amazon Elastic Container Registry (ECR), Amazon Simple Notification Service (SNS), Amazon Elastic File System (EFS) y Amazon SimpleDB.

El uso de Amazon Virtual Private Cloud (VPC) o emparejamiento de VPC con funciones de AWS Lambda incurrirá en cargos adicionales como se explica en la página de precios bajo demanda de Amazon Elastic Compute Cloud (EC2). Una interconexión de VPC es una conexión de redes entre dos VPC que permite enrutar el tráfico entre ellas mediante direcciones IPv4 privadas o direcciones IPv6

Cargos adicionales
Puede incurrir en cargos adicionales si su función Lambda utiliza otros servicios de AWS o transfiere datos. Por ejemplo, si su función de Lambda lee y escribe datos en Amazon S3, se le facturará por las solicitudes de lectura o escritura y los datos almacenados en Amazon S3.

Para obtener más detalles sobre los precios de los servicios de AWS, consulte la sección de precios en las páginas de los productos de AWS correspondientes.

Recursos de precios adicionales

Calculadora de precios de AWS

Calcule fácilmente los costos mensuales con AWS

Obtenga asistencia de precios

Póngase en contacto con los especialistas de AWS para obtener un presupuesto personalizado