Add override logic in ModelBuilder with task provided

Xiong Zeng · Xiong Zeng · commit bdeb84b683cf · 2024-02-26T19:16:13.000Z
diff --git a/src/sagemaker/serve/builder/model_builder.py b/src/sagemaker/serve/builder/model_builder.py
@@ -118,7 +118,8 @@ class ModelBuilder(Triton, DJL, JumpStart, TGI, Transformers):
             into a stream. All translations between the server and the client are handled
             automatically with the specified input and output.
         model (Optional[Union[object, str]): Model object (with ``predict`` method to perform
-            inference) or a HuggingFace/JumpStart Model ID. Either ``model`` or
+            inference) or a HuggingFace/JumpStart Model ID (followed by ``:task`` if you need
+            to override the task, e.g. bert-base-uncased:fill-mask). Either ``model`` or
             ``inference_spec`` is required for the model builder to build the artifact.
         inference_spec (InferenceSpec): The inference spec file with your customized
             ``invoke`` and ``load`` functions.
@@ -205,6 +206,7 @@ class ModelBuilder(Triton, DJL, JumpStart, TGI, Transformers):
             "help": (
                 'Model object with "predict" method to perform inference '
                 "or HuggingFace/JumpStart Model ID"
+                "or if you need to override task, provide input as ModelID:Task"
             )
         },
     )
@@ -610,6 +612,10 @@ def build(
         self._is_custom_image_uri = self.image_uri is not None
 
         if isinstance(self.model, str):
+            model_task = None
+            if ":" in self.model:
+                model_task = self.model.split(":")[1]
+                self.model = self.model.split(":")[0]
             if self._is_jumpstart_model_id():
                 return self._build_for_jumpstart()
             if self._is_djl():  # pylint: disable=R1705
@@ -619,7 +625,8 @@ def build(
                     self.model, self.env_vars.get("HUGGING_FACE_HUB_TOKEN")
                 )
 
-                model_task = hf_model_md.get("pipeline_tag")
+                if model_task is None:
+                    model_task = hf_model_md.get("pipeline_tag")
                 if self.schema_builder is None and model_task:
                     self._schema_builder_init(model_task)
 
diff --git a/src/sagemaker/serve/schema/task.json b/src/sagemaker/serve/schema/task.json
@@ -1,28 +1,28 @@
 {
 	"fill-mask": {
-        "sample_inputs": {
+    "sample_inputs": {
 			"properties": {
-				"inputs": "Paris is the <mask> of France.",
+				"inputs": "Paris is the [MASK] of France.",
 				"parameters": {}
 			}
         },
-        "sample_outputs": {
+    "sample_outputs": {
 			"properties": [
 				{
 					"sequence": "Paris is the capital of France.",
 					"score": 0.7
 				}
 			]
 		}
-    },
+  },
 	"question-answering": {
-        "sample_inputs": {
+    "sample_inputs": {
 			"properties": {
 				"context": "I have a German Shepherd dog, named Coco.",
 				"question": "What is my dog's breed?"
 			}
-        },
-        "sample_outputs": {
+    },
+    "sample_outputs": {
 			"properties": [
 				{
 					"answer": "German Shepherd",
@@ -32,36 +32,36 @@
 				}
 			]
 		}
-    },
+	},
 	"text-classification": {
-        "sample_inputs": {
+		"sample_inputs": {
 			"properties": {
 				"inputs": "Where is the capital of France?, Paris is the capital of France.",
 				"parameters": {}
 			}
-        },
-        "sample_outputs": {
+		},
+		"sample_outputs": {
 			"properties": [
 				{
 					"label": "entailment",
 					"score": 0.997
 				}
 			]
 		}
-    },
-    "text-generation": {
-        "sample_inputs": {
+	},
+	"text-generation": {
+		"sample_inputs": {
 			"properties": {
 				"inputs": "Hello, I'm a language model",
 				"parameters": {}
 			}
-        },
-        "sample_outputs": {
+		},
+		"sample_outputs": {
 			"properties": [
-				{
-					"generated_text": "Hello, I'm a language modeler. So while writing this, when I went out to meet my wife or come home she told me that my"
-				}
+			{
+				"generated_text": "Hello, I'm a language modeler. So while writing this, when I went out to meet my wife or come home she told me that my"
+			}
 			]
 		}
-    }
+	}
 }
diff --git a/tests/integ/sagemaker/serve/test_schema_builder.py b/tests/integ/sagemaker/serve/test_schema_builder.py
@@ -99,3 +99,58 @@ def test_model_builder_negative_path(sagemaker_session):
         match="Error Message: Schema builder for text-to-image could not be found.",
     ):
         model_builder.build(sagemaker_session=sagemaker_session)
+
+
+@pytest.mark.skipif(
+    PYTHON_VERSION_IS_NOT_310,
+    reason="Testing Schema Builder Simplification feature",
+)
+def test_model_builder_happy_path_with_task_provided(sagemaker_session, gpu_instance_type):
+    model_builder = ModelBuilder(model="bert-base-uncased:fill-mask")
+
+    model = model_builder.build(sagemaker_session=sagemaker_session)
+
+    assert model is not None
+    assert model_builder.schema_builder is not None
+
+    inputs, outputs = task.retrieve_local_schemas("fill-mask")
+    assert model_builder.schema_builder.sample_input == inputs
+    assert model_builder.schema_builder.sample_output == outputs
+
+    with timeout(minutes=SERVE_SAGEMAKER_ENDPOINT_TIMEOUT):
+        caught_ex = None
+        try:
+            iam_client = sagemaker_session.boto_session.client("iam")
+            role_arn = iam_client.get_role(RoleName="SageMakerRole")["Role"]["Arn"]
+
+            logger.info("Deploying and predicting in SAGEMAKER_ENDPOINT mode...")
+            predictor = model.deploy(
+                role=role_arn, instance_count=1, instance_type=gpu_instance_type
+            )
+
+            predicted_outputs = predictor.predict(inputs)
+            assert predicted_outputs is not None
+
+        except Exception as e:
+            caught_ex = e
+        finally:
+            cleanup_model_resources(
+                sagemaker_session=model_builder.sagemaker_session,
+                model_name=model.name,
+                endpoint_name=model.endpoint_name,
+            )
+            if caught_ex:
+                logger.exception(caught_ex)
+                assert (
+                    False
+                ), f"{caught_ex} was thrown when running transformers sagemaker endpoint test"
+
+
+def test_model_builder_negative_path_with_invalid_task(sagemaker_session):
+    model_builder = ModelBuilder(model="bert-base-uncased:invalid-task")
+
+    with pytest.raises(
+        TaskNotFoundException,
+        match="Error Message: Schema builder for invalid-task could not be found.",
+    ):
+        model_builder.build(sagemaker_session=sagemaker_session)
diff --git a/tests/unit/sagemaker/serve/builder/test_model_builder.py b/tests/unit/sagemaker/serve/builder/test_model_builder.py
@@ -1077,3 +1077,91 @@ def test_build_negative_path_when_schema_builder_not_present(
             "Error Message: Schema builder for text-to-image could not be found.",
             lambda: model_builder.build(sagemaker_session=mock_session),
         )
+
+    @patch("sagemaker.serve.builder.tgi_builder.HuggingFaceModel")
+    @patch("sagemaker.image_uris.retrieve")
+    @patch("sagemaker.djl_inference.model.urllib")
+    @patch("sagemaker.djl_inference.model.json")
+    @patch("sagemaker.huggingface.llm_utils.urllib")
+    @patch("sagemaker.huggingface.llm_utils.json")
+    @patch("sagemaker.model_uris.retrieve")
+    @patch("sagemaker.serve.builder.model_builder._ServeSettings")
+    def test_build_happy_path_override_with_task_provided(
+        self,
+        mock_serveSettings,
+        mock_model_uris_retrieve,
+        mock_llm_utils_json,
+        mock_llm_utils_urllib,
+        mock_model_json,
+        mock_model_urllib,
+        mock_image_uris_retrieve,
+        mock_hf_model,
+    ):
+        # Setup mocks
+
+        mock_setting_object = mock_serveSettings.return_value
+        mock_setting_object.role_arn = mock_role_arn
+        mock_setting_object.s3_model_data_url = mock_s3_model_data_url
+
+        # HF Pipeline Tag
+        mock_model_uris_retrieve.side_effect = KeyError
+        mock_llm_utils_json.load.return_value = {"pipeline_tag": "fill-mask"}
+        mock_llm_utils_urllib.request.Request.side_effect = Mock()
+
+        # HF Model config
+        mock_model_json.load.return_value = {"some": "config"}
+        mock_model_urllib.request.Request.side_effect = Mock()
+
+        mock_image_uris_retrieve.return_value = "https://some-image-uri"
+
+        model_builder = ModelBuilder(model="bert-base-uncased:text-generation")
+        model_builder.build(sagemaker_session=mock_session)
+
+        self.assertIsNotNone(model_builder.schema_builder)
+        sample_inputs, sample_outputs = task.retrieve_local_schemas("text-generation")
+        self.assertEqual(
+            sample_inputs["inputs"], model_builder.schema_builder.sample_input["inputs"]
+        )
+        self.assertEqual(sample_outputs, model_builder.schema_builder.sample_output)
+
+    @patch("sagemaker.image_uris.retrieve")
+    @patch("sagemaker.djl_inference.model.urllib")
+    @patch("sagemaker.djl_inference.model.json")
+    @patch("sagemaker.huggingface.llm_utils.urllib")
+    @patch("sagemaker.huggingface.llm_utils.json")
+    @patch("sagemaker.model_uris.retrieve")
+    @patch("sagemaker.serve.builder.model_builder._ServeSettings")
+    def test_build_negative_path_override_with_task_provided(
+        self,
+        mock_serveSettings,
+        mock_model_uris_retrieve,
+        mock_llm_utils_json,
+        mock_llm_utils_urllib,
+        mock_model_json,
+        mock_model_urllib,
+        mock_image_uris_retrieve,
+    ):
+        # Setup mocks
+
+        mock_setting_object = mock_serveSettings.return_value
+        mock_setting_object.role_arn = mock_role_arn
+        mock_setting_object.s3_model_data_url = mock_s3_model_data_url
+
+        # HF Pipeline Tag
+        mock_model_uris_retrieve.side_effect = KeyError
+        mock_llm_utils_json.load.return_value = {"pipeline_tag": "fill-mask"}
+        mock_llm_utils_urllib.request.Request.side_effect = Mock()
+
+        # HF Model config
+        mock_model_json.load.return_value = {"some": "config"}
+        mock_model_urllib.request.Request.side_effect = Mock()
+
+        mock_image_uris_retrieve.return_value = "https://some-image-uri"
+
+        model_builder = ModelBuilder(model="bert-base-uncased:invalid-task")
+
+        self.assertRaisesRegexp(
+            TaskNotFoundException,
+            "Error Message: Schema builder for invalid-task could not be found.",
+            lambda: model_builder.build(sagemaker_session=mock_session),
+        )

Original file line number	Diff line number	Diff line change
`@@ -1,28 +1,28 @@`
`1`	`1`	`{`
`2`	`2`	`"fill-mask": {`
`3`		`- "sample_inputs": {`
	`3`	`+ "sample_inputs": {`
`4`	`4`	`"properties": {`
`5`		`- "inputs": "Paris is the <mask> of France.",`
	`5`	`+ "inputs": "Paris is the [MASK] of France.",`
`6`	`6`	`"parameters": {}`
`7`	`7`	`}`
`8`	`8`	`},`
`9`		`- "sample_outputs": {`
	`9`	`+ "sample_outputs": {`
`10`	`10`	`"properties": [`
`11`	`11`	`{`
`12`	`12`	`"sequence": "Paris is the capital of France.",`
`13`	`13`	`"score": 0.7`
`14`	`14`	`}`
`15`	`15`	`]`
`16`	`16`	`}`
`17`		`- },`
	`17`	`+ },`
`18`	`18`	`"question-answering": {`
`19`		`- "sample_inputs": {`
	`19`	`+ "sample_inputs": {`
`20`	`20`	`"properties": {`
`21`	`21`	`"context": "I have a German Shepherd dog, named Coco.",`
`22`	`22`	`"question": "What is my dog's breed?"`
`23`	`23`	`}`
`24`		`- },`
`25`		`- "sample_outputs": {`
	`24`	`+ },`
	`25`	`+ "sample_outputs": {`
`26`	`26`	`"properties": [`
`27`	`27`	`{`
`28`	`28`	`"answer": "German Shepherd",`
`@@ -32,36 +32,36 @@`
`32`	`32`	`}`
`33`	`33`	`]`
`34`	`34`	`}`
`35`		`- },`
	`35`	`+ },`
`36`	`36`	`"text-classification": {`
`37`		`- "sample_inputs": {`
	`37`	`+ "sample_inputs": {`
`38`	`38`	`"properties": {`
`39`	`39`	`"inputs": "Where is the capital of France?, Paris is the capital of France.",`
`40`	`40`	`"parameters": {}`
`41`	`41`	`}`
`42`		`- },`
`43`		`- "sample_outputs": {`
	`42`	`+ },`
	`43`	`+ "sample_outputs": {`
`44`	`44`	`"properties": [`
`45`	`45`	`{`
`46`	`46`	`"label": "entailment",`
`47`	`47`	`"score": 0.997`
`48`	`48`	`}`
`49`	`49`	`]`
`50`	`50`	`}`
`51`		`- },`
`52`		`- "text-generation": {`
`53`		`- "sample_inputs": {`
	`51`	`+ },`
	`52`	`+ "text-generation": {`
	`53`	`+ "sample_inputs": {`
`54`	`54`	`"properties": {`
`55`	`55`	`"inputs": "Hello, I'm a language model",`
`56`	`56`	`"parameters": {}`
`57`	`57`	`}`
`58`		`- },`
`59`		`- "sample_outputs": {`
	`58`	`+ },`
	`59`	`+ "sample_outputs": {`
`60`	`60`	`"properties": [`
`61`		`- {`
`62`		`- "generated_text": "Hello, I'm a language modeler. So while writing this, when I went out to meet my wife or come home she told me that my"`
`63`		`- }`
	`61`	`+ {`
	`62`	`+ "generated_text": "Hello, I'm a language modeler. So while writing this, when I went out to meet my wife or come home she told me that my"`
	`63`	`+ }`
`64`	`64`	`]`
`65`	`65`	`}`
`66`		`- }`
	`66`	`+ }`
`67`	`67`	`}`