awslabs
diff --git a/‎.github/workflows/code-generation.yml
+4-4 b/‎.github/workflows/code-generation.yml
+4-4
diff --git a/‎.projen/tasks.json
+12 b/‎.projen/tasks.json
+12
diff --git a/‎.projenrc.ts
+12 b/‎.projenrc.ts
+12
diff --git a/‎README.md
+6-6 b/‎README.md
+6-6
diff --git a/‎apidocs/classes/CustomSageMakerEndpoint.md
-7 b/‎apidocs/classes/CustomSageMakerEndpoint.md
-7
diff --git a/‎apidocs/classes/DeepLearningContainerImage.md
+63 b/‎apidocs/classes/DeepLearningContainerImage.md
+63
@@ -189,11 +189,23 @@ packageJson?.patch(JsonPatch.add('/scripts/postpack', 'pinst --enable'));
 project.addTask('generate-models-containers', {
   description: 'Generate new list of models available from Jumpstart and DLC containers',
   steps: [
+    {
+      say: 'Synthesize project files',
+      spawn: 'default',
+    },
+    {
+      say: 'Compile',
+      spawn: 'compile',
+    },
     {
       say: 'Generate new list of models available from Jumpstart and DLC containers',
       cwd: project.srcdir+'/patterns/gen-ai/aws-model-deployment-sagemaker/code-generation',
       exec: 'npm run generate',
     },
+    {
+      say: 'Generate the new apidocs',
+      spawn: 'post-compile',
+    },
   ],
 });
 
 
@@ -73,14 +73,14 @@ The following constructs are available in the library:
 |:-------------|:-------------|:-------------|
 | [Data ingestion pipeline](./src/patterns/gen-ai/aws-rag-appsync-stepfn-opensearch/) | Ingestion pipeline providing a RAG (retrieval augmented generation) source for storing documents in a knowledge base. | Amazon OpenSearch, AWS Step Functions, Amazon Bedrock, AWS AppSync, AWS Lambda | 
 | [Question answering](./src/patterns/gen-ai/aws-qa-appsync-opensearch/) | Question answering with a large language model (Anthropic Claude V2.1) using a RAG (retrieval augmented generation) source and/or long context. | Amazon OpenSearch, AWS Lambda, Amazon Bedrock, AWS AppSync | 
-| [Summarization](./src/patterns/gen-ai/aws-summarization-appsync-stepfn/) | Document summarization with a large language model (Anthropic Claude V2.1). | AWS Lambda, Amazon Bedrock, AWS AppSync and Amazon Elasticache for Redis.  |
+| [Summarization](./src/patterns/gen-ai/aws-summarization-appsync-stepfn/) | Document summarization with a large language model (Anthropic Claude V2.1). | AWS Lambda, Amazon Bedrock, AWS AppSync and Amazon ElastiCache for Redis.  |
 | [Lambda layer](./src/patterns/gen-ai/aws-langchain-common-layer/) | Python Lambda layer providing dependencies and utilities to develop generative AI applications on AWS. | AWS Lambda, Amazon Bedrock, Amazon SageMaker | 
-| [SageMaker model deployment (Jumpstart)](./src/patterns/gen-ai/aws-model-deployment-sagemaker/README_jumpstart.md) | Deploy a foundation model from Amazon SageMaker JumpStart to an Amazon SageMaker endpoint. | Amazon SageMaker | 
+| [SageMaker model deployment (JumpStart)](./src/patterns/gen-ai/aws-model-deployment-sagemaker/README_jumpstart.md) | Deploy a foundation model from Amazon SageMaker JumpStart to an Amazon SageMaker endpoint. | Amazon SageMaker | 
 | [SageMaker model deployment (Hugging Face)](./src/patterns/gen-ai/aws-model-deployment-sagemaker/README_hugging_face.md) | Deploy a foundation model from Hugging Face to an Amazon SageMaker endpoint. | Amazon SageMaker | 
 | [SageMaker model deployment (Custom)](./src/patterns/gen-ai/aws-model-deployment-sagemaker/README_custom_sagemaker_endpoint.md) | Deploy a foundation model from an S3 location to an Amazon SageMaker endpoint. | Amazon SageMaker | 
-| [Amazon Bedrock](./src/cdk-lib/bedrock/README.md) | CDK L2 Constructs for Amazon Bedrock | Amazon Bedrock, Amazon OpenSearch Serverless, AWS Lambda |
-| [Amazon OpenSearch Serverless Vector Collection](./src/cdk-lib/opensearchserverless/README.md) | CDK L2 Constructs to create a vector collection | Amazon OpenSearch Vector Index |
-| [Amazon OpenSearch Vector Index](./src/cdk-lib/opensearch-vectorindex/README.md) | CDK L1 Custom Resource to create a vector index | Amazon OpenSearch Serverless, AWS Lambda |
+| [Amazon Bedrock](./src/cdk-lib/bedrock/README.md) | CDK L2 Constructs for Amazon Bedrock. | Amazon Bedrock, Amazon OpenSearch Serverless, AWS Lambda |
+| [Amazon OpenSearch Serverless Vector Collection](./src/cdk-lib/opensearchserverless/README.md) | CDK L2 Constructs to create a vector collection. | Amazon OpenSearch Vector Index |
+| [Amazon OpenSearch Vector Index](./src/cdk-lib/opensearch-vectorindex/README.md) | CDK L1 Custom Resource to create a vector index. | Amazon OpenSearch Serverless, AWS Lambda |
 
 # Sample Use Cases
 
@@ -94,7 +94,7 @@ The official samples repository https://github.com/aws-samples/generative-ai-cdk
 | [aws-cdk-stack-builder-tool](https://github.com/aws-samples/aws-cdk-stack-builder-tool) | AWS CDK Builder is a browser-based tool designed to streamline bootstrapping of Infrastructure as Code (IaC) projects using the AWS Cloud Development Kit (CDK). |
 | [CDK Live! Building generative AI applications and architectures leveraging AWS CDK Constructs!](https://www.youtube.com/watch?v=NI1F4Xxqyr8) | CDK Live! episode focused on building and deploying generative AI applications and architectures on AWS using the AWS Cloud Development Kit (CDK) and the AWS Generative AI CDK Constructs. |
 | [Announcing AWS Generative AI CDK Constructs!](https://aws.amazon.com/blogs/devops/announcing-generative-ai-cdk-constructs/) | Blog post announcing the release of the AWS Generative AI CDK Constructs. |
-| [aws-genai-llm-chatbot](https://github.com/aws-samples/aws-genai-llm-chatbot/tree/main) | Multi-Model and Multi-RAG Powered Chatbot Using AWS CDK on AWS allowing you to experiment with a variety of Large Language Models and Multimodal Language Models, settings and prompts in your own AWS account |
+| [aws-genai-llm-chatbot](https://github.com/aws-samples/aws-genai-llm-chatbot/tree/main) | Multi-Model and Multi-RAG Powered Chatbot Using AWS CDK on AWS allowing you to experiment with a variety of Large Language Models and Multimodal Language Models, settings and prompts in your own AWS account. |
 
 # Operational Metrics Collection
 
 
@@ -34,7 +34,6 @@
 - [node](CustomSageMakerEndpoint.md#node)
 - [role](CustomSageMakerEndpoint.md#role)
 - [startupHealthCheckTimeoutInSeconds](CustomSageMakerEndpoint.md#startuphealthchecktimeoutinseconds)
-- [volumeSizeInGb](CustomSageMakerEndpoint.md#volumesizeingb)
 
 ### Methods
 
@@ -164,12 +163,6 @@ ___
 
 • `Private` `Readonly` **startupHealthCheckTimeoutInSeconds**: `number`
 
-___
-
-### volumeSizeInGb
-
-• `Optional` `Readonly` **volumeSizeInGb**: `number`
-
 ## Methods
 
 ### addToRolePolicy
 
@@ -39,6 +39,8 @@ https://github.com/aws/deep-learning-containers/blob/master/available_images.md
 - [DJL\_INFERENCE\_0\_24\_0\_NEURONX\_SDK2\_14\_1](DeepLearningContainerImage.md#djl_inference_0_24_0_neuronx_sdk2_14_1)
 - [DJL\_INFERENCE\_0\_25\_0\_DEEPSPEED0\_11\_0\_CU118](DeepLearningContainerImage.md#djl_inference_0_25_0_deepspeed0_11_0_cu118)
 - [DJL\_INFERENCE\_0\_25\_0\_NEURONX\_SDK2\_15\_0](DeepLearningContainerImage.md#djl_inference_0_25_0_neuronx_sdk2_15_0)
+- [DJL\_INFERENCE\_0\_26\_0\_DEEPSPEED0\_12\_6\_CU121](DeepLearningContainerImage.md#djl_inference_0_26_0_deepspeed0_12_6_cu121)
+- [DJL\_INFERENCE\_0\_26\_0\_NEURONX\_SDK2\_16\_0](DeepLearningContainerImage.md#djl_inference_0_26_0_neuronx_sdk2_16_0)
 - [HUGGINGFACE\_PYTORCH\_INFERENCE\_1\_10\_2\_TRANSFORMERS4\_17\_0\_CPU\_PY38\_UBUNTU20\_04](DeepLearningContainerImage.md#huggingface_pytorch_inference_1_10_2_transformers4_17_0_cpu_py38_ubuntu20_04)
 - [HUGGINGFACE\_PYTORCH\_INFERENCE\_1\_10\_2\_TRANSFORMERS4\_17\_0\_GPU\_PY38\_CU113\_UBUNTU20\_04](DeepLearningContainerImage.md#huggingface_pytorch_inference_1_10_2_transformers4_17_0_gpu_py38_cu113_ubuntu20_04)
 - [HUGGINGFACE\_PYTORCH\_INFERENCE\_1\_13\_1\_TRANSFORMERS4\_26\_0\_CPU\_PY39\_UBUNTU20\_04](DeepLearningContainerImage.md#huggingface_pytorch_inference_1_13_1_transformers4_26_0_cpu_py39_ubuntu20_04)
@@ -57,13 +59,20 @@ https://github.com/aws/deep-learning-containers/blob/master/available_images.md
 - [HUGGINGFACE\_PYTORCH\_INFERENCE\_1\_9\_1\_TRANSFORMERS4\_12\_3\_GPU\_PY38\_CU111\_UBUNTU20\_04](DeepLearningContainerImage.md#huggingface_pytorch_inference_1_9_1_transformers4_12_3_gpu_py38_cu111_ubuntu20_04)
 - [HUGGINGFACE\_PYTORCH\_INFERENCE\_2\_0\_0\_TRANSFORMERS4\_28\_1\_CPU\_PY310\_UBUNTU20\_04](DeepLearningContainerImage.md#huggingface_pytorch_inference_2_0_0_transformers4_28_1_cpu_py310_ubuntu20_04)
 - [HUGGINGFACE\_PYTORCH\_INFERENCE\_2\_0\_0\_TRANSFORMERS4\_28\_1\_GPU\_PY310\_CU118\_UBUNTU20\_04](DeepLearningContainerImage.md#huggingface_pytorch_inference_2_0_0_transformers4_28_1_gpu_py310_cu118_ubuntu20_04)
+- [HUGGINGFACE\_PYTORCH\_INFERENCE\_2\_1\_0\_TRANSFORMERS4\_37\_0\_CPU\_PY310\_UBUNTU22\_04](DeepLearningContainerImage.md#huggingface_pytorch_inference_2_1_0_transformers4_37_0_cpu_py310_ubuntu22_04)
+- [HUGGINGFACE\_PYTORCH\_INFERENCE\_2\_1\_0\_TRANSFORMERS4\_37\_0\_GPU\_PY310\_CU118\_UBUNTU20\_04](DeepLearningContainerImage.md#huggingface_pytorch_inference_2_1_0_transformers4_37_0_gpu_py310_cu118_ubuntu20_04)
 - [HUGGINGFACE\_PYTORCH\_INFERENCE\_NEURONX\_1\_13\_0\_TRANSFORMERS4\_28\_1\_NEURONX\_PY38\_SDK2\_9\_1\_UBUNTU20\_04](DeepLearningContainerImage.md#huggingface_pytorch_inference_neuronx_1_13_0_transformers4_28_1_neuronx_py38_sdk2_9_1_ubuntu20_04)
 - [HUGGINGFACE\_PYTORCH\_INFERENCE\_NEURONX\_1\_13\_1\_TRANSFORMERS4\_34\_1\_NEURONX\_PY310\_SDK2\_15\_0\_UBUNTU20\_04](DeepLearningContainerImage.md#huggingface_pytorch_inference_neuronx_1_13_1_transformers4_34_1_neuronx_py310_sdk2_15_0_ubuntu20_04)
+- [HUGGINGFACE\_PYTORCH\_INFERENCE\_NEURONX\_1\_13\_1\_TRANSFORMERS4\_36\_2\_NEURONX\_PY310\_SDK2\_16\_1\_UBUNTU20\_04](DeepLearningContainerImage.md#huggingface_pytorch_inference_neuronx_1_13_1_transformers4_36_2_neuronx_py310_sdk2_16_1_ubuntu20_04)
 - [HUGGINGFACE\_PYTORCH\_TGI\_INFERENCE\_2\_0\_0\_TGI0\_6\_0\_GPU\_PY39\_CU118\_UBUNTU20\_04](DeepLearningContainerImage.md#huggingface_pytorch_tgi_inference_2_0_0_tgi0_6_0_gpu_py39_cu118_ubuntu20_04)
 - [HUGGINGFACE\_PYTORCH\_TGI\_INFERENCE\_2\_0\_0\_TGI0\_8\_2\_GPU\_PY39\_CU118\_UBUNTU20\_04](DeepLearningContainerImage.md#huggingface_pytorch_tgi_inference_2_0_0_tgi0_8_2_gpu_py39_cu118_ubuntu20_04)
 - [HUGGINGFACE\_PYTORCH\_TGI\_INFERENCE\_2\_0\_1\_TGI0\_9\_3\_GPU\_PY39\_CU118\_UBUNTU20\_04](DeepLearningContainerImage.md#huggingface_pytorch_tgi_inference_2_0_1_tgi0_9_3_gpu_py39_cu118_ubuntu20_04)
 - [HUGGINGFACE\_PYTORCH\_TGI\_INFERENCE\_2\_0\_1\_TGI1\_0\_3\_GPU\_PY39\_CU118\_UBUNTU20\_04](DeepLearningContainerImage.md#huggingface_pytorch_tgi_inference_2_0_1_tgi1_0_3_gpu_py39_cu118_ubuntu20_04)
 - [HUGGINGFACE\_PYTORCH\_TGI\_INFERENCE\_2\_0\_1\_TGI1\_1\_0\_GPU\_PY39\_CU118\_UBUNTU20\_04](DeepLearningContainerImage.md#huggingface_pytorch_tgi_inference_2_0_1_tgi1_1_0_gpu_py39_cu118_ubuntu20_04)
+- [HUGGINGFACE\_PYTORCH\_TGI\_INFERENCE\_2\_1\_1\_TGI1\_2\_0\_GPU\_PY310\_CU121\_UBUNTU20\_04](DeepLearningContainerImage.md#huggingface_pytorch_tgi_inference_2_1_1_tgi1_2_0_gpu_py310_cu121_ubuntu20_04)
+- [HUGGINGFACE\_PYTORCH\_TGI\_INFERENCE\_2\_1\_1\_TGI1\_3\_1\_GPU\_PY310\_CU121\_UBUNTU20\_04](DeepLearningContainerImage.md#huggingface_pytorch_tgi_inference_2_1_1_tgi1_3_1_gpu_py310_cu121_ubuntu20_04)
+- [HUGGINGFACE\_PYTORCH\_TGI\_INFERENCE\_2\_1\_1\_TGI1\_3\_3\_GPU\_PY310\_CU121\_UBUNTU20\_04](DeepLearningContainerImage.md#huggingface_pytorch_tgi_inference_2_1_1_tgi1_3_3_gpu_py310_cu121_ubuntu20_04)
+- [HUGGINGFACE\_PYTORCH\_TGI\_INFERENCE\_2\_1\_1\_TGI1\_4\_0\_GPU\_PY310\_CU121\_UBUNTU20\_04](DeepLearningContainerImage.md#huggingface_pytorch_tgi_inference_2_1_1_tgi1_4_0_gpu_py310_cu121_ubuntu20_04)
 - [HUGGINGFACE\_TENSORFLOW\_INFERENCE\_2\_11\_0\_TRANSFORMERS4\_26\_0\_CPU\_PY39\_UBUNTU20\_04](DeepLearningContainerImage.md#huggingface_tensorflow_inference_2_11_0_transformers4_26_0_cpu_py39_ubuntu20_04)
 - [HUGGINGFACE\_TENSORFLOW\_INFERENCE\_2\_11\_0\_TRANSFORMERS4\_26\_0\_GPU\_PY39\_CU112\_UBUNTU20\_04](DeepLearningContainerImage.md#huggingface_tensorflow_inference_2_11_0_transformers4_26_0_gpu_py39_cu112_ubuntu20_04)
 - [HUGGINGFACE\_TENSORFLOW\_INFERENCE\_2\_11\_1\_TRANSFORMERS4\_26\_0\_CPU\_PY39\_UBUNTU20\_04](DeepLearningContainerImage.md#huggingface_tensorflow_inference_2_11_1_transformers4_26_0_cpu_py39_ubuntu20_04)
@@ -240,6 +249,18 @@ ___
 
 ___
 
+### DJL\_INFERENCE\_0\_26\_0\_DEEPSPEED0\_12\_6\_CU121
+
+▪ `Static` `Readonly` **DJL\_INFERENCE\_0\_26\_0\_DEEPSPEED0\_12\_6\_CU121**: [`ContainerImage`](ContainerImage.md)
+
+___
+
+### DJL\_INFERENCE\_0\_26\_0\_NEURONX\_SDK2\_16\_0
+
+▪ `Static` `Readonly` **DJL\_INFERENCE\_0\_26\_0\_NEURONX\_SDK2\_16\_0**: [`ContainerImage`](ContainerImage.md)
+
+___
+
 ### HUGGINGFACE\_PYTORCH\_INFERENCE\_1\_10\_2\_TRANSFORMERS4\_17\_0\_CPU\_PY38\_UBUNTU20\_04
 
 ▪ `Static` `Readonly` **HUGGINGFACE\_PYTORCH\_INFERENCE\_1\_10\_2\_TRANSFORMERS4\_17\_0\_CPU\_PY38\_UBUNTU20\_04**: [`ContainerImage`](ContainerImage.md)
@@ -348,6 +369,18 @@ ___
 
 ___
 
+### HUGGINGFACE\_PYTORCH\_INFERENCE\_2\_1\_0\_TRANSFORMERS4\_37\_0\_CPU\_PY310\_UBUNTU22\_04
+
+▪ `Static` `Readonly` **HUGGINGFACE\_PYTORCH\_INFERENCE\_2\_1\_0\_TRANSFORMERS4\_37\_0\_CPU\_PY310\_UBUNTU22\_04**: [`ContainerImage`](ContainerImage.md)
+
+___
+
+### HUGGINGFACE\_PYTORCH\_INFERENCE\_2\_1\_0\_TRANSFORMERS4\_37\_0\_GPU\_PY310\_CU118\_UBUNTU20\_04
+
+▪ `Static` `Readonly` **HUGGINGFACE\_PYTORCH\_INFERENCE\_2\_1\_0\_TRANSFORMERS4\_37\_0\_GPU\_PY310\_CU118\_UBUNTU20\_04**: [`ContainerImage`](ContainerImage.md)
+
+___
+
 ### HUGGINGFACE\_PYTORCH\_INFERENCE\_NEURONX\_1\_13\_0\_TRANSFORMERS4\_28\_1\_NEURONX\_PY38\_SDK2\_9\_1\_UBUNTU20\_04
 
 ▪ `Static` `Readonly` **HUGGINGFACE\_PYTORCH\_INFERENCE\_NEURONX\_1\_13\_0\_TRANSFORMERS4\_28\_1\_NEURONX\_PY38\_SDK2\_9\_1\_UBUNTU20\_04**: [`ContainerImage`](ContainerImage.md)
@@ -360,6 +393,12 @@ ___
 
 ___
 
+### HUGGINGFACE\_PYTORCH\_INFERENCE\_NEURONX\_1\_13\_1\_TRANSFORMERS4\_36\_2\_NEURONX\_PY310\_SDK2\_16\_1\_UBUNTU20\_04
+
+▪ `Static` `Readonly` **HUGGINGFACE\_PYTORCH\_INFERENCE\_NEURONX\_1\_13\_1\_TRANSFORMERS4\_36\_2\_NEURONX\_PY310\_SDK2\_16\_1\_UBUNTU20\_04**: [`ContainerImage`](ContainerImage.md)
+
+___
+
 ### HUGGINGFACE\_PYTORCH\_TGI\_INFERENCE\_2\_0\_0\_TGI0\_6\_0\_GPU\_PY39\_CU118\_UBUNTU20\_04
 
 ▪ `Static` `Readonly` **HUGGINGFACE\_PYTORCH\_TGI\_INFERENCE\_2\_0\_0\_TGI0\_6\_0\_GPU\_PY39\_CU118\_UBUNTU20\_04**: [`ContainerImage`](ContainerImage.md)
@@ -390,6 +429,30 @@ ___
 
 ___
 
+### HUGGINGFACE\_PYTORCH\_TGI\_INFERENCE\_2\_1\_1\_TGI1\_2\_0\_GPU\_PY310\_CU121\_UBUNTU20\_04
+
+▪ `Static` `Readonly` **HUGGINGFACE\_PYTORCH\_TGI\_INFERENCE\_2\_1\_1\_TGI1\_2\_0\_GPU\_PY310\_CU121\_UBUNTU20\_04**: [`ContainerImage`](ContainerImage.md)
+
+___
+
+### HUGGINGFACE\_PYTORCH\_TGI\_INFERENCE\_2\_1\_1\_TGI1\_3\_1\_GPU\_PY310\_CU121\_UBUNTU20\_04
+
+▪ `Static` `Readonly` **HUGGINGFACE\_PYTORCH\_TGI\_INFERENCE\_2\_1\_1\_TGI1\_3\_1\_GPU\_PY310\_CU121\_UBUNTU20\_04**: [`ContainerImage`](ContainerImage.md)
+
+___
+
+### HUGGINGFACE\_PYTORCH\_TGI\_INFERENCE\_2\_1\_1\_TGI1\_3\_3\_GPU\_PY310\_CU121\_UBUNTU20\_04
+
+▪ `Static` `Readonly` **HUGGINGFACE\_PYTORCH\_TGI\_INFERENCE\_2\_1\_1\_TGI1\_3\_3\_GPU\_PY310\_CU121\_UBUNTU20\_04**: [`ContainerImage`](ContainerImage.md)
+
+___
+
+### HUGGINGFACE\_PYTORCH\_TGI\_INFERENCE\_2\_1\_1\_TGI1\_4\_0\_GPU\_PY310\_CU121\_UBUNTU20\_04
+
+▪ `Static` `Readonly` **HUGGINGFACE\_PYTORCH\_TGI\_INFERENCE\_2\_1\_1\_TGI1\_4\_0\_GPU\_PY310\_CU121\_UBUNTU20\_04**: [`ContainerImage`](ContainerImage.md)
+
+___
+
 ### HUGGINGFACE\_TENSORFLOW\_INFERENCE\_2\_11\_0\_TRANSFORMERS4\_26\_0\_CPU\_PY39\_UBUNTU20\_04
 
 ▪ `Static` `Readonly` **HUGGINGFACE\_TENSORFLOW\_INFERENCE\_2\_11\_0\_TRANSFORMERS4\_26\_0\_CPU\_PY39\_UBUNTU20\_04**: [`ContainerImage`](ContainerImage.md)