From 8118a81199f3424df3f478925f5e788944301a14 Mon Sep 17 00:00:00 2001
From: Payton Staub <pstaub@amazon.com>
Date: Tue, 22 Feb 2022 15:52:00 -0800
Subject: [PATCH 1/4] fix: Remove sagemaker_job_name from hyperparameters in
 TrainingStep

---
 src/sagemaker/workflow/steps.py               |   1 +
 .../workflow/test_step_collections.py         | 996 ------------------
 tests/unit/sagemaker/workflow/test_steps.py   |   1 -
 3 files changed, 1 insertion(+), 997 deletions(-)

diff --git a/src/sagemaker/workflow/steps.py b/src/sagemaker/workflow/steps.py
index 99f3444f23..1acb82687e 100644
--- a/src/sagemaker/workflow/steps.py
+++ b/src/sagemaker/workflow/steps.py
@@ -301,6 +301,7 @@ def arguments(self) -> RequestType:
         )
         request_dict = self.estimator.sagemaker_session._get_train_request(**train_args)
         request_dict.pop("TrainingJobName")
+        request_dict["HyperParameters"].pop("sagemaker_job_name", None)
 
         return request_dict
 
diff --git a/tests/unit/sagemaker/workflow/test_step_collections.py b/tests/unit/sagemaker/workflow/test_step_collections.py
index d2f1f07059..e69de29bb2 100644
--- a/tests/unit/sagemaker/workflow/test_step_collections.py
+++ b/tests/unit/sagemaker/workflow/test_step_collections.py
@@ -1,996 +0,0 @@
-# Copyright Amazon.com, Inc. or its affiliates. All Rights Reserved.
-#
-# Licensed under the Apache License, Version 2.0 (the "License"). You
-# may not use this file except in compliance with the License. A copy of
-# the License is located at
-#
-#     http://aws.amazon.com/apache2.0/
-#
-# or in the "license" file accompanying this file. This file is
-# distributed on an "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF
-# ANY KIND, either express or implied. See the License for the specific
-# language governing permissions and limitations under the License.
-# language governing permissions and limitations under the License.
-from __future__ import absolute_import
-
-import os
-import tempfile
-import shutil
-import pytest
-
-from sagemaker.drift_check_baselines import DriftCheckBaselines
-from sagemaker.workflow.utilities import list_to_request
-from tests.unit import DATA_DIR
-
-import sagemaker
-
-from mock import (
-    Mock,
-    PropertyMock,
-)
-
-from sagemaker import PipelineModel
-from sagemaker.estimator import Estimator
-from sagemaker.model import Model, FrameworkModel
-from sagemaker.tensorflow import TensorFlow
-from sagemaker.inputs import CreateModelInput, TransformInput
-from sagemaker.model_metrics import (
-    MetricsSource,
-    ModelMetrics,
-)
-from sagemaker.workflow.properties import Properties
-from sagemaker.workflow.steps import (
-    Step,
-    StepTypeEnum,
-)
-from sagemaker.workflow.step_collections import (
-    EstimatorTransformer,
-    StepCollection,
-    RegisterModel,
-)
-from sagemaker.workflow.retry import StepRetryPolicy, StepExceptionTypeEnum
-from tests.unit.sagemaker.workflow.helpers import ordered
-
-REGION = "us-west-2"
-BUCKET = "my-bucket"
-IMAGE_URI = "fakeimage"
-ROLE = "DummyRole"
-MODEL_NAME = "gisele"
-MODEL_REPACKING_IMAGE_URI = (
-    "246618743249.dkr.ecr.us-west-2.amazonaws.com/sagemaker-scikit-learn:0.23-1-cpu-py3"
-)
-
-
-class CustomStep(Step):
-    def __init__(self, name, display_name=None, description=None):
-        super(CustomStep, self).__init__(name, display_name, description, StepTypeEnum.TRAINING)
-        self._properties = Properties(path=f"Steps.{name}")
-
-    @property
-    def arguments(self):
-        return dict()
-
-    @property
-    def properties(self):
-        return self._properties
-
-
-@pytest.fixture
-def boto_session():
-    role_mock = Mock()
-    type(role_mock).arn = PropertyMock(return_value=ROLE)
-
-    resource_mock = Mock()
-    resource_mock.Role.return_value = role_mock
-
-    session_mock = Mock(region_name=REGION)
-    session_mock.resource.return_value = resource_mock
-
-    return session_mock
-
-
-@pytest.fixture
-def client():
-    """Mock client.
-
-    Considerations when appropriate:
-
-        * utilize botocore.stub.Stubber
-        * separate runtime client from client
-    """
-    client_mock = Mock()
-    client_mock._client_config.user_agent = (
-        "Boto3/1.14.24 Python/3.8.5 Linux/5.4.0-42-generic Botocore/1.17.24 Resource"
-    )
-    return client_mock
-
-
-@pytest.fixture
-def sagemaker_session(boto_session, client):
-    return sagemaker.session.Session(
-        boto_session=boto_session,
-        sagemaker_client=client,
-        sagemaker_runtime_client=client,
-        default_bucket=BUCKET,
-    )
-
-
-@pytest.fixture
-def estimator(sagemaker_session):
-    return Estimator(
-        image_uri=IMAGE_URI,
-        role=ROLE,
-        instance_count=1,
-        instance_type="ml.c4.4xlarge",
-        sagemaker_session=sagemaker_session,
-        subnets=["abc", "def"],
-        security_group_ids=["123", "456"],
-    )
-
-
-@pytest.fixture
-def model(sagemaker_session):
-    return FrameworkModel(
-        image_uri=IMAGE_URI,
-        model_data=f"s3://{BUCKET}/model.tar.gz",
-        role=ROLE,
-        sagemaker_session=sagemaker_session,
-        entry_point=f"{DATA_DIR}/dummy_script.py",
-        name="modelName",
-        vpc_config={"Subnets": ["abc", "def"], "SecurityGroupIds": ["123", "456"]},
-    )
-
-
-@pytest.fixture
-def pipeline_model(sagemaker_session, model):
-    return PipelineModel(
-        models=[model],
-        role=ROLE,
-        sagemaker_session=sagemaker_session,
-        vpc_config={"Subnets": ["abc", "def"], "SecurityGroupIds": ["123", "456"]},
-    )
-
-
-@pytest.fixture
-def estimator_tf(sagemaker_session):
-    return TensorFlow(
-        entry_point="/some/script.py",
-        framework_version="1.15.2",
-        py_version="py3",
-        role=ROLE,
-        instance_type="ml.c4.2xlarge",
-        instance_count=1,
-        sagemaker_session=sagemaker_session,
-    )
-
-
-@pytest.fixture
-def model_metrics():
-    return ModelMetrics(
-        model_statistics=MetricsSource(
-            s3_uri=f"s3://{BUCKET}/metrics.csv",
-            content_type="text/csv",
-        )
-    )
-
-
-@pytest.fixture
-def drift_check_baselines():
-    return DriftCheckBaselines(
-        model_constraints=MetricsSource(
-            s3_uri=f"s3://{BUCKET}/constraints_metrics.csv",
-            content_type="text/csv",
-        )
-    )
-
-
-@pytest.fixture
-def source_dir(request):
-    wf = os.path.join(DATA_DIR, "workflow")
-    tmp = tempfile.mkdtemp()
-    shutil.copy2(os.path.join(wf, "inference.py"), os.path.join(tmp, "inference.py"))
-    shutil.copy2(os.path.join(wf, "foo"), os.path.join(tmp, "foo"))
-
-    def fin():
-        shutil.rmtree(tmp)
-
-    request.addfinalizer(fin)
-
-    return tmp
-
-
-def test_step_collection():
-    step_collection = StepCollection(steps=[CustomStep("MyStep1"), CustomStep("MyStep2")])
-    assert step_collection.request_dicts() == [
-        {"Name": "MyStep1", "Type": "Training", "Arguments": dict()},
-        {"Name": "MyStep2", "Type": "Training", "Arguments": dict()},
-    ]
-
-
-def test_step_collection_with_list_to_request():
-    step_collection = StepCollection(steps=[CustomStep("MyStep1"), CustomStep("MyStep2")])
-    custom_step = CustomStep("MyStep3")
-    assert list_to_request([step_collection, custom_step]) == [
-        {"Name": "MyStep1", "Type": "Training", "Arguments": dict()},
-        {"Name": "MyStep2", "Type": "Training", "Arguments": dict()},
-        {"Name": "MyStep3", "Type": "Training", "Arguments": dict()},
-    ]
-
-
-def test_register_model(estimator, model_metrics, drift_check_baselines):
-    model_data = f"s3://{BUCKET}/model.tar.gz"
-    register_model = RegisterModel(
-        name="RegisterModelStep",
-        estimator=estimator,
-        model_data=model_data,
-        content_types=["content_type"],
-        response_types=["response_type"],
-        inference_instances=["inference_instance"],
-        transform_instances=["transform_instance"],
-        image_uri="012345678901.dkr.ecr.us-west-2.amazonaws.com/my-custom-image-uri",
-        model_package_group_name="mpg",
-        model_metrics=model_metrics,
-        drift_check_baselines=drift_check_baselines,
-        approval_status="Approved",
-        description="description",
-        display_name="RegisterModelStep",
-        depends_on=["TestStep"],
-        tags=[{"Key": "myKey", "Value": "myValue"}],
-    )
-    assert ordered(register_model.request_dicts()) == ordered(
-        [
-            {
-                "Name": "RegisterModelStep",
-                "Type": "RegisterModel",
-                "DependsOn": ["TestStep"],
-                "DisplayName": "RegisterModelStep",
-                "Description": "description",
-                "Arguments": {
-                    "InferenceSpecification": {
-                        "Containers": [
-                            {
-                                "Image": "012345678901.dkr.ecr.us-west-2.amazonaws.com/my-custom-image-uri",
-                                "ModelDataUrl": f"s3://{BUCKET}/model.tar.gz",
-                            }
-                        ],
-                        "SupportedContentTypes": ["content_type"],
-                        "SupportedRealtimeInferenceInstanceTypes": ["inference_instance"],
-                        "SupportedResponseMIMETypes": ["response_type"],
-                        "SupportedTransformInstanceTypes": ["transform_instance"],
-                    },
-                    "ModelApprovalStatus": "Approved",
-                    "ModelMetrics": {
-                        "Bias": {},
-                        "Explainability": {},
-                        "ModelQuality": {
-                            "Statistics": {
-                                "ContentType": "text/csv",
-                                "S3Uri": f"s3://{BUCKET}/metrics.csv",
-                            },
-                        },
-                    },
-                    "DriftCheckBaselines": {
-                        "ModelQuality": {
-                            "Constraints": {
-                                "ContentType": "text/csv",
-                                "S3Uri": f"s3://{BUCKET}/constraints_metrics.csv",
-                            }
-                        }
-                    },
-                    "ModelPackageDescription": "description",
-                    "ModelPackageGroupName": "mpg",
-                    "Tags": [{"Key": "myKey", "Value": "myValue"}],
-                },
-            },
-        ]
-    )
-
-
-def test_register_model_tf(estimator_tf, model_metrics, drift_check_baselines):
-    model_data = f"s3://{BUCKET}/model.tar.gz"
-    register_model = RegisterModel(
-        name="RegisterModelStep",
-        estimator=estimator_tf,
-        model_data=model_data,
-        content_types=["content_type"],
-        response_types=["response_type"],
-        inference_instances=["inference_instance"],
-        transform_instances=["transform_instance"],
-        model_package_group_name="mpg",
-        model_metrics=model_metrics,
-        drift_check_baselines=drift_check_baselines,
-        approval_status="Approved",
-        description="description",
-    )
-    assert ordered(register_model.request_dicts()) == ordered(
-        [
-            {
-                "Name": "RegisterModelStep",
-                "Type": "RegisterModel",
-                "Description": "description",
-                "Arguments": {
-                    "InferenceSpecification": {
-                        "Containers": [
-                            {
-                                "Image": "763104351884.dkr.ecr.us-west-2.amazonaws.com/tensorflow-inference:1.15.2-cpu",
-                                "ModelDataUrl": f"s3://{BUCKET}/model.tar.gz",
-                            }
-                        ],
-                        "SupportedContentTypes": ["content_type"],
-                        "SupportedRealtimeInferenceInstanceTypes": ["inference_instance"],
-                        "SupportedResponseMIMETypes": ["response_type"],
-                        "SupportedTransformInstanceTypes": ["transform_instance"],
-                    },
-                    "ModelApprovalStatus": "Approved",
-                    "ModelMetrics": {
-                        "Bias": {},
-                        "Explainability": {},
-                        "ModelQuality": {
-                            "Statistics": {
-                                "ContentType": "text/csv",
-                                "S3Uri": f"s3://{BUCKET}/metrics.csv",
-                            },
-                        },
-                    },
-                    "DriftCheckBaselines": {
-                        "ModelQuality": {
-                            "Constraints": {
-                                "ContentType": "text/csv",
-                                "S3Uri": f"s3://{BUCKET}/constraints_metrics.csv",
-                            }
-                        }
-                    },
-                    "ModelPackageDescription": "description",
-                    "ModelPackageGroupName": "mpg",
-                },
-            },
-        ]
-    )
-
-
-def test_register_model_sip(estimator, model_metrics, drift_check_baselines):
-    model_list = [
-        Model(image_uri="fakeimage1", model_data="Url1", env=[{"k1": "v1"}, {"k2": "v2"}]),
-        Model(image_uri="fakeimage2", model_data="Url2", env=[{"k3": "v3"}, {"k4": "v4"}]),
-    ]
-
-    pipeline_model = PipelineModel(model_list, ROLE)
-
-    register_model = RegisterModel(
-        name="RegisterModelStep",
-        estimator=estimator,
-        content_types=["content_type"],
-        response_types=["response_type"],
-        inference_instances=["inference_instance"],
-        transform_instances=["transform_instance"],
-        model_package_group_name="mpg",
-        model_metrics=model_metrics,
-        drift_check_baselines=drift_check_baselines,
-        approval_status="Approved",
-        description="description",
-        model=pipeline_model,
-        depends_on=["TestStep"],
-    )
-    assert ordered(register_model.request_dicts()) == ordered(
-        [
-            {
-                "Name": "RegisterModelStep",
-                "Type": "RegisterModel",
-                "Description": "description",
-                "DependsOn": ["TestStep"],
-                "Arguments": {
-                    "InferenceSpecification": {
-                        "Containers": [
-                            {
-                                "Image": "fakeimage1",
-                                "ModelDataUrl": "Url1",
-                                "Environment": [{"k1": "v1"}, {"k2": "v2"}],
-                            },
-                            {
-                                "Image": "fakeimage2",
-                                "ModelDataUrl": "Url2",
-                                "Environment": [{"k3": "v3"}, {"k4": "v4"}],
-                            },
-                        ],
-                        "SupportedContentTypes": ["content_type"],
-                        "SupportedRealtimeInferenceInstanceTypes": ["inference_instance"],
-                        "SupportedResponseMIMETypes": ["response_type"],
-                        "SupportedTransformInstanceTypes": ["transform_instance"],
-                    },
-                    "ModelApprovalStatus": "Approved",
-                    "ModelMetrics": {
-                        "Bias": {},
-                        "Explainability": {},
-                        "ModelQuality": {
-                            "Statistics": {
-                                "ContentType": "text/csv",
-                                "S3Uri": f"s3://{BUCKET}/metrics.csv",
-                            },
-                        },
-                    },
-                    "DriftCheckBaselines": {
-                        "ModelQuality": {
-                            "Constraints": {
-                                "ContentType": "text/csv",
-                                "S3Uri": f"s3://{BUCKET}/constraints_metrics.csv",
-                            }
-                        }
-                    },
-                    "ModelPackageDescription": "description",
-                    "ModelPackageGroupName": "mpg",
-                },
-            },
-        ]
-    )
-
-
-def test_register_model_with_model_repack_with_estimator(
-    estimator, model_metrics, drift_check_baselines
-):
-    model_data = f"s3://{BUCKET}/model.tar.gz"
-    dummy_requirements = f"{DATA_DIR}/dummy_requirements.txt"
-    register_model = RegisterModel(
-        name="RegisterModelStep",
-        estimator=estimator,
-        model_data=model_data,
-        content_types=["content_type"],
-        response_types=["response_type"],
-        inference_instances=["inference_instance"],
-        transform_instances=["transform_instance"],
-        model_package_group_name="mpg",
-        model_metrics=model_metrics,
-        drift_check_baselines=drift_check_baselines,
-        approval_status="Approved",
-        description="description",
-        entry_point=f"{DATA_DIR}/dummy_script.py",
-        dependencies=[dummy_requirements],
-        depends_on=["TestStep"],
-        tags=[{"Key": "myKey", "Value": "myValue"}],
-    )
-
-    request_dicts = register_model.request_dicts()
-    assert len(request_dicts) == 2
-
-    for request_dict in request_dicts:
-        if request_dict["Type"] == "Training":
-            assert request_dict["Name"] == "RegisterModelStepRepackModel"
-            assert len(request_dict["DependsOn"]) == 1
-            assert request_dict["DependsOn"][0] == "TestStep"
-            arguments = request_dict["Arguments"]
-            repacker_job_name = arguments["HyperParameters"]["sagemaker_job_name"]
-            assert ordered(arguments) == ordered(
-                {
-                    "AlgorithmSpecification": {
-                        "TrainingImage": MODEL_REPACKING_IMAGE_URI,
-                        "TrainingInputMode": "File",
-                    },
-                    "DebugHookConfig": {
-                        "CollectionConfigurations": [],
-                        "S3OutputPath": f"s3://{BUCKET}/",
-                    },
-                    "HyperParameters": {
-                        "inference_script": '"dummy_script.py"',
-                        "dependencies": f'"{dummy_requirements}"',
-                        "model_archive": '"model.tar.gz"',
-                        "sagemaker_submit_directory": '"s3://{}/{}/source/sourcedir.tar.gz"'.format(
-                            BUCKET, repacker_job_name.replace('"', "")
-                        ),
-                        "sagemaker_program": '"_repack_model.py"',
-                        "sagemaker_container_log_level": "20",
-                        "sagemaker_job_name": repacker_job_name,
-                        "sagemaker_region": f'"{REGION}"',
-                        "source_dir": "null",
-                    },
-                    "InputDataConfig": [
-                        {
-                            "ChannelName": "training",
-                            "DataSource": {
-                                "S3DataSource": {
-                                    "S3DataDistributionType": "FullyReplicated",
-                                    "S3DataType": "S3Prefix",
-                                    "S3Uri": f"s3://{BUCKET}",
-                                }
-                            },
-                        }
-                    ],
-                    "OutputDataConfig": {"S3OutputPath": f"s3://{BUCKET}/"},
-                    "ResourceConfig": {
-                        "InstanceCount": 1,
-                        "InstanceType": "ml.m5.large",
-                        "VolumeSizeInGB": 30,
-                    },
-                    "RoleArn": ROLE,
-                    "StoppingCondition": {"MaxRuntimeInSeconds": 86400},
-                    "Tags": [{"Key": "myKey", "Value": "myValue"}],
-                    "VpcConfig": [
-                        ("SecurityGroupIds", ["123", "456"]),
-                        ("Subnets", ["abc", "def"]),
-                    ],
-                }
-            )
-        elif request_dict["Type"] == "RegisterModel":
-            assert request_dict["Name"] == "RegisterModelStep"
-            assert "DependsOn" not in request_dict
-            arguments = request_dict["Arguments"]
-            assert len(arguments["InferenceSpecification"]["Containers"]) == 1
-            assert (
-                arguments["InferenceSpecification"]["Containers"][0]["Image"]
-                == estimator.training_image_uri()
-            )
-            assert isinstance(
-                arguments["InferenceSpecification"]["Containers"][0]["ModelDataUrl"], Properties
-            )
-            del arguments["InferenceSpecification"]["Containers"]
-            assert ordered(arguments) == ordered(
-                {
-                    "InferenceSpecification": {
-                        "SupportedContentTypes": ["content_type"],
-                        "SupportedRealtimeInferenceInstanceTypes": ["inference_instance"],
-                        "SupportedResponseMIMETypes": ["response_type"],
-                        "SupportedTransformInstanceTypes": ["transform_instance"],
-                    },
-                    "ModelApprovalStatus": "Approved",
-                    "ModelMetrics": {
-                        "Bias": {},
-                        "Explainability": {},
-                        "ModelQuality": {
-                            "Statistics": {
-                                "ContentType": "text/csv",
-                                "S3Uri": f"s3://{BUCKET}/metrics.csv",
-                            },
-                        },
-                    },
-                    "DriftCheckBaselines": {
-                        "ModelQuality": {
-                            "Constraints": {
-                                "ContentType": "text/csv",
-                                "S3Uri": f"s3://{BUCKET}/constraints_metrics.csv",
-                            }
-                        }
-                    },
-                    "ModelPackageDescription": "description",
-                    "ModelPackageGroupName": "mpg",
-                    "Tags": [{"Key": "myKey", "Value": "myValue"}],
-                }
-            )
-        else:
-            raise Exception("A step exists in the collection of an invalid type.")
-
-
-def test_register_model_with_model_repack_with_model(model, model_metrics, drift_check_baselines):
-    model_data = f"s3://{BUCKET}/model.tar.gz"
-    register_model = RegisterModel(
-        name="RegisterModelStep",
-        model=model,
-        model_data=model_data,
-        content_types=["content_type"],
-        response_types=["response_type"],
-        inference_instances=["inference_instance"],
-        transform_instances=["transform_instance"],
-        model_package_group_name="mpg",
-        model_metrics=model_metrics,
-        drift_check_baselines=drift_check_baselines,
-        approval_status="Approved",
-        description="description",
-        depends_on=["TestStep"],
-        tags=[{"Key": "myKey", "Value": "myValue"}],
-    )
-
-    request_dicts = register_model.request_dicts()
-    assert len(request_dicts) == 2
-
-    for request_dict in request_dicts:
-        if request_dict["Type"] == "Training":
-            assert request_dict["Name"] == "modelNameRepackModel"
-            assert len(request_dict["DependsOn"]) == 1
-            assert request_dict["DependsOn"][0] == "TestStep"
-            arguments = request_dict["Arguments"]
-            repacker_job_name = arguments["HyperParameters"]["sagemaker_job_name"]
-            assert ordered(arguments) == ordered(
-                {
-                    "AlgorithmSpecification": {
-                        "TrainingImage": MODEL_REPACKING_IMAGE_URI,
-                        "TrainingInputMode": "File",
-                    },
-                    "DebugHookConfig": {
-                        "CollectionConfigurations": [],
-                        "S3OutputPath": f"s3://{BUCKET}/",
-                    },
-                    "HyperParameters": {
-                        "inference_script": '"dummy_script.py"',
-                        "model_archive": '"model.tar.gz"',
-                        "sagemaker_submit_directory": '"s3://{}/{}/source/sourcedir.tar.gz"'.format(
-                            BUCKET, repacker_job_name.replace('"', "")
-                        ),
-                        "sagemaker_program": '"_repack_model.py"',
-                        "sagemaker_container_log_level": "20",
-                        "sagemaker_job_name": repacker_job_name,
-                        "sagemaker_region": f'"{REGION}"',
-                        "dependencies": "null",
-                        "source_dir": "null",
-                    },
-                    "InputDataConfig": [
-                        {
-                            "ChannelName": "training",
-                            "DataSource": {
-                                "S3DataSource": {
-                                    "S3DataDistributionType": "FullyReplicated",
-                                    "S3DataType": "S3Prefix",
-                                    "S3Uri": f"s3://{BUCKET}",
-                                }
-                            },
-                        }
-                    ],
-                    "OutputDataConfig": {"S3OutputPath": f"s3://{BUCKET}/"},
-                    "ResourceConfig": {
-                        "InstanceCount": 1,
-                        "InstanceType": "ml.m5.large",
-                        "VolumeSizeInGB": 30,
-                    },
-                    "RoleArn": ROLE,
-                    "StoppingCondition": {"MaxRuntimeInSeconds": 86400},
-                    "Tags": [{"Key": "myKey", "Value": "myValue"}],
-                    "VpcConfig": [
-                        ("SecurityGroupIds", ["123", "456"]),
-                        ("Subnets", ["abc", "def"]),
-                    ],
-                }
-            )
-        elif request_dict["Type"] == "RegisterModel":
-            assert request_dict["Name"] == "RegisterModelStep"
-            assert "DependsOn" not in request_dict
-            arguments = request_dict["Arguments"]
-            assert len(arguments["InferenceSpecification"]["Containers"]) == 1
-            assert arguments["InferenceSpecification"]["Containers"][0]["Image"] == model.image_uri
-            assert isinstance(
-                arguments["InferenceSpecification"]["Containers"][0]["ModelDataUrl"], Properties
-            )
-            del arguments["InferenceSpecification"]["Containers"]
-            assert ordered(arguments) == ordered(
-                {
-                    "InferenceSpecification": {
-                        "SupportedContentTypes": ["content_type"],
-                        "SupportedRealtimeInferenceInstanceTypes": ["inference_instance"],
-                        "SupportedResponseMIMETypes": ["response_type"],
-                        "SupportedTransformInstanceTypes": ["transform_instance"],
-                    },
-                    "ModelApprovalStatus": "Approved",
-                    "ModelMetrics": {
-                        "Bias": {},
-                        "Explainability": {},
-                        "ModelQuality": {
-                            "Statistics": {
-                                "ContentType": "text/csv",
-                                "S3Uri": f"s3://{BUCKET}/metrics.csv",
-                            },
-                        },
-                    },
-                    "DriftCheckBaselines": {
-                        "ModelQuality": {
-                            "Constraints": {
-                                "ContentType": "text/csv",
-                                "S3Uri": f"s3://{BUCKET}/constraints_metrics.csv",
-                            }
-                        }
-                    },
-                    "ModelPackageDescription": "description",
-                    "ModelPackageGroupName": "mpg",
-                    "Tags": [{"Key": "myKey", "Value": "myValue"}],
-                }
-            )
-        else:
-            raise Exception("A step exists in the collection of an invalid type.")
-
-
-def test_register_model_with_model_repack_with_pipeline_model(
-    pipeline_model, model_metrics, drift_check_baselines
-):
-    model_data = f"s3://{BUCKET}/model.tar.gz"
-    service_fault_retry_policy = StepRetryPolicy(
-        exception_types=[StepExceptionTypeEnum.SERVICE_FAULT], max_attempts=10
-    )
-    register_model = RegisterModel(
-        name="RegisterModelStep",
-        model=pipeline_model,
-        model_data=model_data,
-        content_types=["content_type"],
-        response_types=["response_type"],
-        inference_instances=["inference_instance"],
-        transform_instances=["transform_instance"],
-        model_package_group_name="mpg",
-        model_metrics=model_metrics,
-        drift_check_baselines=drift_check_baselines,
-        approval_status="Approved",
-        description="description",
-        depends_on=["TestStep"],
-        repack_model_step_retry_policies=[service_fault_retry_policy],
-        register_model_step_retry_policies=[service_fault_retry_policy],
-        tags=[{"Key": "myKey", "Value": "myValue"}],
-    )
-
-    request_dicts = register_model.request_dicts()
-    assert len(request_dicts) == 2
-
-    for request_dict in request_dicts:
-        if request_dict["Type"] == "Training":
-            assert request_dict["Name"] == "modelNameRepackModel"
-            assert len(request_dict["DependsOn"]) == 1
-            assert request_dict["DependsOn"][0] == "TestStep"
-            arguments = request_dict["Arguments"]
-            repacker_job_name = arguments["HyperParameters"]["sagemaker_job_name"]
-            assert ordered(arguments) == ordered(
-                {
-                    "AlgorithmSpecification": {
-                        "TrainingImage": MODEL_REPACKING_IMAGE_URI,
-                        "TrainingInputMode": "File",
-                    },
-                    "DebugHookConfig": {
-                        "CollectionConfigurations": [],
-                        "S3OutputPath": f"s3://{BUCKET}/",
-                    },
-                    "HyperParameters": {
-                        "dependencies": "null",
-                        "inference_script": '"dummy_script.py"',
-                        "model_archive": '"model.tar.gz"',
-                        "sagemaker_submit_directory": '"s3://{}/{}/source/sourcedir.tar.gz"'.format(
-                            BUCKET, repacker_job_name.replace('"', "")
-                        ),
-                        "sagemaker_program": '"_repack_model.py"',
-                        "sagemaker_container_log_level": "20",
-                        "sagemaker_job_name": repacker_job_name,
-                        "sagemaker_region": f'"{REGION}"',
-                        "source_dir": "null",
-                    },
-                    "InputDataConfig": [
-                        {
-                            "ChannelName": "training",
-                            "DataSource": {
-                                "S3DataSource": {
-                                    "S3DataDistributionType": "FullyReplicated",
-                                    "S3DataType": "S3Prefix",
-                                    "S3Uri": f"s3://{BUCKET}",
-                                }
-                            },
-                        }
-                    ],
-                    "OutputDataConfig": {"S3OutputPath": f"s3://{BUCKET}/"},
-                    "ResourceConfig": {
-                        "InstanceCount": 1,
-                        "InstanceType": "ml.m5.large",
-                        "VolumeSizeInGB": 30,
-                    },
-                    "RoleArn": ROLE,
-                    "StoppingCondition": {"MaxRuntimeInSeconds": 86400},
-                    "Tags": [{"Key": "myKey", "Value": "myValue"}],
-                    "VpcConfig": [
-                        ("SecurityGroupIds", ["123", "456"]),
-                        ("Subnets", ["abc", "def"]),
-                    ],
-                }
-            )
-        elif request_dict["Type"] == "RegisterModel":
-            assert request_dict["Name"] == "RegisterModelStep"
-            assert "DependsOn" not in request_dict
-            arguments = request_dict["Arguments"]
-            assert len(arguments["InferenceSpecification"]["Containers"]) == 1
-            assert (
-                arguments["InferenceSpecification"]["Containers"][0]["Image"]
-                == pipeline_model.models[0].image_uri
-            )
-            assert isinstance(
-                arguments["InferenceSpecification"]["Containers"][0]["ModelDataUrl"], Properties
-            )
-            del arguments["InferenceSpecification"]["Containers"]
-            assert ordered(arguments) == ordered(
-                {
-                    "InferenceSpecification": {
-                        "SupportedContentTypes": ["content_type"],
-                        "SupportedRealtimeInferenceInstanceTypes": ["inference_instance"],
-                        "SupportedResponseMIMETypes": ["response_type"],
-                        "SupportedTransformInstanceTypes": ["transform_instance"],
-                    },
-                    "ModelApprovalStatus": "Approved",
-                    "ModelMetrics": {
-                        "Bias": {},
-                        "Explainability": {},
-                        "ModelQuality": {
-                            "Statistics": {
-                                "ContentType": "text/csv",
-                                "S3Uri": f"s3://{BUCKET}/metrics.csv",
-                            },
-                        },
-                    },
-                    "DriftCheckBaselines": {
-                        "ModelQuality": {
-                            "Constraints": {
-                                "ContentType": "text/csv",
-                                "S3Uri": f"s3://{BUCKET}/constraints_metrics.csv",
-                            }
-                        }
-                    },
-                    "ModelPackageDescription": "description",
-                    "ModelPackageGroupName": "mpg",
-                    "Tags": [{"Key": "myKey", "Value": "myValue"}],
-                }
-            )
-        else:
-            raise Exception("A step exists in the collection of an invalid type.")
-
-
-def test_estimator_transformer(estimator):
-    model_data = f"s3://{BUCKET}/model.tar.gz"
-    model_inputs = CreateModelInput(
-        instance_type="c4.4xlarge",
-        accelerator_type="ml.eia1.medium",
-    )
-    service_fault_retry_policy = StepRetryPolicy(
-        exception_types=[StepExceptionTypeEnum.SERVICE_FAULT], max_attempts=10
-    )
-    transform_inputs = TransformInput(data=f"s3://{BUCKET}/transform_manifest")
-    estimator_transformer = EstimatorTransformer(
-        name="EstimatorTransformerStep",
-        estimator=estimator,
-        model_data=model_data,
-        model_inputs=model_inputs,
-        instance_count=1,
-        instance_type="ml.c4.4xlarge",
-        transform_inputs=transform_inputs,
-        depends_on=["TestStep"],
-        model_step_retry_policies=[service_fault_retry_policy],
-        transform_step_retry_policies=[service_fault_retry_policy],
-        repack_model_step_retry_policies=[service_fault_retry_policy],
-    )
-    request_dicts = estimator_transformer.request_dicts()
-    assert len(request_dicts) == 2
-
-    for request_dict in request_dicts:
-        if request_dict["Type"] == "Model":
-            assert request_dict == {
-                "Name": "EstimatorTransformerStepCreateModelStep",
-                "Type": "Model",
-                "DependsOn": ["TestStep"],
-                "RetryPolicies": [service_fault_retry_policy.to_request()],
-                "Arguments": {
-                    "ExecutionRoleArn": "DummyRole",
-                    "PrimaryContainer": {
-                        "Environment": {},
-                        "Image": "fakeimage",
-                        "ModelDataUrl": "s3://my-bucket/model.tar.gz",
-                    },
-                },
-            }
-        elif request_dict["Type"] == "Transform":
-            assert request_dict["Name"] == "EstimatorTransformerStepTransformStep"
-            assert request_dict["RetryPolicies"] == [service_fault_retry_policy.to_request()]
-            arguments = request_dict["Arguments"]
-            assert isinstance(arguments["ModelName"], Properties)
-            arguments.pop("ModelName")
-            assert "DependsOn" not in request_dict
-            assert arguments == {
-                "TransformInput": {
-                    "DataSource": {
-                        "S3DataSource": {
-                            "S3DataType": "S3Prefix",
-                            "S3Uri": f"s3://{BUCKET}/transform_manifest",
-                        }
-                    }
-                },
-                "TransformOutput": {"S3OutputPath": None},
-                "TransformResources": {"InstanceCount": 1, "InstanceType": "ml.c4.4xlarge"},
-            }
-        else:
-            raise Exception("A step exists in the collection of an invalid type.")
-
-
-def test_estimator_transformer_with_model_repack_with_estimator(estimator):
-    model_data = f"s3://{BUCKET}/model.tar.gz"
-    model_inputs = CreateModelInput(
-        instance_type="c4.4xlarge",
-        accelerator_type="ml.eia1.medium",
-    )
-    service_fault_retry_policy = StepRetryPolicy(
-        exception_types=[StepExceptionTypeEnum.SERVICE_FAULT], max_attempts=10
-    )
-    transform_inputs = TransformInput(data=f"s3://{BUCKET}/transform_manifest")
-    estimator_transformer = EstimatorTransformer(
-        name="EstimatorTransformerStep",
-        estimator=estimator,
-        model_data=model_data,
-        model_inputs=model_inputs,
-        instance_count=1,
-        instance_type="ml.c4.4xlarge",
-        transform_inputs=transform_inputs,
-        depends_on=["TestStep"],
-        model_step_retry_policies=[service_fault_retry_policy],
-        transform_step_retry_policies=[service_fault_retry_policy],
-        repack_model_step_retry_policies=[service_fault_retry_policy],
-        entry_point=f"{DATA_DIR}/dummy_script.py",
-    )
-    request_dicts = estimator_transformer.request_dicts()
-    assert len(request_dicts) == 3
-
-    for request_dict in request_dicts:
-        if request_dict["Type"] == "Training":
-            assert request_dict["Name"] == "EstimatorTransformerStepRepackModel"
-            assert request_dict["DependsOn"] == ["TestStep"]
-            assert request_dict["RetryPolicies"] == [service_fault_retry_policy.to_request()]
-            arguments = request_dict["Arguments"]
-            # pop out the dynamic generated fields
-            arguments["HyperParameters"].pop("sagemaker_submit_directory")
-            arguments["HyperParameters"].pop("sagemaker_job_name")
-            assert arguments == {
-                "AlgorithmSpecification": {
-                    "TrainingInputMode": "File",
-                    "TrainingImage": "246618743249.dkr.ecr.us-west-2.amazonaws.com/"
-                    + "sagemaker-scikit-learn:0.23-1-cpu-py3",
-                },
-                "OutputDataConfig": {"S3OutputPath": "s3://my-bucket/"},
-                "StoppingCondition": {"MaxRuntimeInSeconds": 86400},
-                "ResourceConfig": {
-                    "InstanceCount": 1,
-                    "InstanceType": "ml.m5.large",
-                    "VolumeSizeInGB": 30,
-                },
-                "RoleArn": "DummyRole",
-                "InputDataConfig": [
-                    {
-                        "DataSource": {
-                            "S3DataSource": {
-                                "S3DataType": "S3Prefix",
-                                "S3Uri": "s3://my-bucket",
-                                "S3DataDistributionType": "FullyReplicated",
-                            }
-                        },
-                        "ChannelName": "training",
-                    }
-                ],
-                "HyperParameters": {
-                    "inference_script": '"dummy_script.py"',
-                    "model_archive": '"model.tar.gz"',
-                    "dependencies": "null",
-                    "source_dir": "null",
-                    "sagemaker_program": '"_repack_model.py"',
-                    "sagemaker_container_log_level": "20",
-                    "sagemaker_region": '"us-west-2"',
-                },
-                "VpcConfig": {"Subnets": ["abc", "def"], "SecurityGroupIds": ["123", "456"]},
-                "DebugHookConfig": {
-                    "S3OutputPath": "s3://my-bucket/",
-                    "CollectionConfigurations": [],
-                },
-            }
-        elif request_dict["Type"] == "Model":
-            assert request_dict["Name"] == "EstimatorTransformerStepCreateModelStep"
-            assert request_dict["RetryPolicies"] == [service_fault_retry_policy.to_request()]
-            arguments = request_dict["Arguments"]
-            assert isinstance(arguments["PrimaryContainer"]["ModelDataUrl"], Properties)
-            arguments["PrimaryContainer"].pop("ModelDataUrl")
-            assert "DependsOn" not in request_dict
-            assert arguments == {
-                "ExecutionRoleArn": "DummyRole",
-                "PrimaryContainer": {
-                    "Environment": {},
-                    "Image": "fakeimage",
-                },
-            }
-        elif request_dict["Type"] == "Transform":
-            assert request_dict["Name"] == "EstimatorTransformerStepTransformStep"
-            assert request_dict["RetryPolicies"] == [service_fault_retry_policy.to_request()]
-            arguments = request_dict["Arguments"]
-            assert isinstance(arguments["ModelName"], Properties)
-            arguments.pop("ModelName")
-            assert "DependsOn" not in request_dict
-            assert arguments == {
-                "TransformInput": {
-                    "DataSource": {
-                        "S3DataSource": {
-                            "S3DataType": "S3Prefix",
-                            "S3Uri": f"s3://{BUCKET}/transform_manifest",
-                        }
-                    }
-                },
-                "TransformOutput": {"S3OutputPath": None},
-                "TransformResources": {"InstanceCount": 1, "InstanceType": "ml.c4.4xlarge"},
-            }
-        else:
-            raise Exception("A step exists in the collection of an invalid type.")
diff --git a/tests/unit/sagemaker/workflow/test_steps.py b/tests/unit/sagemaker/workflow/test_steps.py
index 674c715617..fd3bd7d0b9 100644
--- a/tests/unit/sagemaker/workflow/test_steps.py
+++ b/tests/unit/sagemaker/workflow/test_steps.py
@@ -399,7 +399,6 @@ def test_training_step_tensorflow(sagemaker_session):
         name="MyTrainingStep", estimator=estimator, inputs=inputs, cache_config=cache_config
     )
     step_request = step.to_request()
-    step_request["Arguments"]["HyperParameters"].pop("sagemaker_job_name", None)
     step_request["Arguments"]["HyperParameters"].pop("sagemaker_program", None)
     step_request["Arguments"].pop("ProfilerRuleConfigurations", None)
     assert step_request == {

From 6ff0c7ae44e71ab1d7b2ee01295fd567e1e415e6 Mon Sep 17 00:00:00 2001
From: Payton Staub <pstaub@amazon.com>
Date: Wed, 2 Mar 2022 10:34:36 -0800
Subject: [PATCH 2/4] Fix unit tests

---
 .../workflow/test_step_collections.py         | 986 ++++++++++++++++++
 1 file changed, 986 insertions(+)

diff --git a/tests/unit/sagemaker/workflow/test_step_collections.py b/tests/unit/sagemaker/workflow/test_step_collections.py
index e69de29bb2..bad879b5e5 100644
--- a/tests/unit/sagemaker/workflow/test_step_collections.py
+++ b/tests/unit/sagemaker/workflow/test_step_collections.py
@@ -0,0 +1,986 @@
+# Copyright Amazon.com, Inc. or its affiliates. All Rights Reserved.
+#
+# Licensed under the Apache License, Version 2.0 (the "License"). You
+# may not use this file except in compliance with the License. A copy of
+# the License is located at
+#
+#     http://aws.amazon.com/apache2.0/
+#
+# or in the "license" file accompanying this file. This file is
+# distributed on an "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF
+# ANY KIND, either express or implied. See the License for the specific
+# language governing permissions and limitations under the License.
+# language governing permissions and limitations under the License.
+from __future__ import absolute_import
+
+import os
+import tempfile
+import shutil
+import pytest
+
+from sagemaker.drift_check_baselines import DriftCheckBaselines
+from sagemaker.workflow.utilities import list_to_request
+from tests.unit import DATA_DIR
+
+import sagemaker
+
+from mock import (
+    Mock,
+    PropertyMock,
+)
+
+from sagemaker import PipelineModel
+from sagemaker.estimator import Estimator
+from sagemaker.model import Model, FrameworkModel
+from sagemaker.tensorflow import TensorFlow
+from sagemaker.inputs import CreateModelInput, TransformInput
+from sagemaker.model_metrics import (
+    MetricsSource,
+    ModelMetrics,
+)
+from sagemaker.workflow.properties import Properties
+from sagemaker.workflow.steps import (
+    Step,
+    StepTypeEnum,
+)
+from sagemaker.workflow.step_collections import (
+    EstimatorTransformer,
+    StepCollection,
+    RegisterModel,
+)
+from sagemaker.workflow.retry import StepRetryPolicy, StepExceptionTypeEnum
+from tests.unit.sagemaker.workflow.helpers import ordered
+
+REGION = "us-west-2"
+BUCKET = "my-bucket"
+IMAGE_URI = "fakeimage"
+ROLE = "DummyRole"
+MODEL_NAME = "gisele"
+MODEL_REPACKING_IMAGE_URI = (
+    "246618743249.dkr.ecr.us-west-2.amazonaws.com/sagemaker-scikit-learn:0.23-1-cpu-py3"
+)
+
+
+class CustomStep(Step):
+    def __init__(self, name, display_name=None, description=None):
+        super(CustomStep, self).__init__(name, display_name, description, StepTypeEnum.TRAINING)
+        self._properties = Properties(path=f"Steps.{name}")
+
+    @property
+    def arguments(self):
+        return dict()
+
+    @property
+    def properties(self):
+        return self._properties
+
+
+@pytest.fixture
+def boto_session():
+    role_mock = Mock()
+    type(role_mock).arn = PropertyMock(return_value=ROLE)
+
+    resource_mock = Mock()
+    resource_mock.Role.return_value = role_mock
+
+    session_mock = Mock(region_name=REGION)
+    session_mock.resource.return_value = resource_mock
+
+    return session_mock
+
+
+@pytest.fixture
+def client():
+    """Mock client.
+
+    Considerations when appropriate:
+
+        * utilize botocore.stub.Stubber
+        * separate runtime client from client
+    """
+    client_mock = Mock()
+    client_mock._client_config.user_agent = (
+        "Boto3/1.14.24 Python/3.8.5 Linux/5.4.0-42-generic Botocore/1.17.24 Resource"
+    )
+    return client_mock
+
+
+@pytest.fixture
+def sagemaker_session(boto_session, client):
+    return sagemaker.session.Session(
+        boto_session=boto_session,
+        sagemaker_client=client,
+        sagemaker_runtime_client=client,
+        default_bucket=BUCKET,
+    )
+
+
+@pytest.fixture
+def estimator(sagemaker_session):
+    return Estimator(
+        image_uri=IMAGE_URI,
+        role=ROLE,
+        instance_count=1,
+        instance_type="ml.c4.4xlarge",
+        sagemaker_session=sagemaker_session,
+        subnets=["abc", "def"],
+        security_group_ids=["123", "456"],
+    )
+
+
+@pytest.fixture
+def model(sagemaker_session):
+    return FrameworkModel(
+        image_uri=IMAGE_URI,
+        model_data=f"s3://{BUCKET}/model.tar.gz",
+        role=ROLE,
+        sagemaker_session=sagemaker_session,
+        entry_point=f"{DATA_DIR}/dummy_script.py",
+        name="modelName",
+        vpc_config={"Subnets": ["abc", "def"], "SecurityGroupIds": ["123", "456"]},
+    )
+
+
+@pytest.fixture
+def pipeline_model(sagemaker_session, model):
+    return PipelineModel(
+        models=[model],
+        role=ROLE,
+        sagemaker_session=sagemaker_session,
+        vpc_config={"Subnets": ["abc", "def"], "SecurityGroupIds": ["123", "456"]},
+    )
+
+
+@pytest.fixture
+def estimator_tf(sagemaker_session):
+    return TensorFlow(
+        entry_point="/some/script.py",
+        framework_version="1.15.2",
+        py_version="py3",
+        role=ROLE,
+        instance_type="ml.c4.2xlarge",
+        instance_count=1,
+        sagemaker_session=sagemaker_session,
+    )
+
+
+@pytest.fixture
+def model_metrics():
+    return ModelMetrics(
+        model_statistics=MetricsSource(
+            s3_uri=f"s3://{BUCKET}/metrics.csv",
+            content_type="text/csv",
+        )
+    )
+
+
+@pytest.fixture
+def drift_check_baselines():
+    return DriftCheckBaselines(
+        model_constraints=MetricsSource(
+            s3_uri=f"s3://{BUCKET}/constraints_metrics.csv",
+            content_type="text/csv",
+        )
+    )
+
+
+@pytest.fixture
+def source_dir(request):
+    wf = os.path.join(DATA_DIR, "workflow")
+    tmp = tempfile.mkdtemp()
+    shutil.copy2(os.path.join(wf, "inference.py"), os.path.join(tmp, "inference.py"))
+    shutil.copy2(os.path.join(wf, "foo"), os.path.join(tmp, "foo"))
+
+    def fin():
+        shutil.rmtree(tmp)
+
+    request.addfinalizer(fin)
+
+    return tmp
+
+
+def test_step_collection():
+    step_collection = StepCollection(steps=[CustomStep("MyStep1"), CustomStep("MyStep2")])
+    assert step_collection.request_dicts() == [
+        {"Name": "MyStep1", "Type": "Training", "Arguments": dict()},
+        {"Name": "MyStep2", "Type": "Training", "Arguments": dict()},
+    ]
+
+
+def test_step_collection_with_list_to_request():
+    step_collection = StepCollection(steps=[CustomStep("MyStep1"), CustomStep("MyStep2")])
+    custom_step = CustomStep("MyStep3")
+    assert list_to_request([step_collection, custom_step]) == [
+        {"Name": "MyStep1", "Type": "Training", "Arguments": dict()},
+        {"Name": "MyStep2", "Type": "Training", "Arguments": dict()},
+        {"Name": "MyStep3", "Type": "Training", "Arguments": dict()},
+    ]
+
+
+def test_register_model(estimator, model_metrics, drift_check_baselines):
+    model_data = f"s3://{BUCKET}/model.tar.gz"
+    register_model = RegisterModel(
+        name="RegisterModelStep",
+        estimator=estimator,
+        model_data=model_data,
+        content_types=["content_type"],
+        response_types=["response_type"],
+        inference_instances=["inference_instance"],
+        transform_instances=["transform_instance"],
+        image_uri="012345678901.dkr.ecr.us-west-2.amazonaws.com/my-custom-image-uri",
+        model_package_group_name="mpg",
+        model_metrics=model_metrics,
+        drift_check_baselines=drift_check_baselines,
+        approval_status="Approved",
+        description="description",
+        display_name="RegisterModelStep",
+        depends_on=["TestStep"],
+        tags=[{"Key": "myKey", "Value": "myValue"}],
+    )
+    assert ordered(register_model.request_dicts()) == ordered(
+        [
+            {
+                "Name": "RegisterModelStep",
+                "Type": "RegisterModel",
+                "DependsOn": ["TestStep"],
+                "DisplayName": "RegisterModelStep",
+                "Description": "description",
+                "Arguments": {
+                    "InferenceSpecification": {
+                        "Containers": [
+                            {
+                                "Image": "012345678901.dkr.ecr.us-west-2.amazonaws.com/my-custom-image-uri",
+                                "ModelDataUrl": f"s3://{BUCKET}/model.tar.gz",
+                            }
+                        ],
+                        "SupportedContentTypes": ["content_type"],
+                        "SupportedRealtimeInferenceInstanceTypes": ["inference_instance"],
+                        "SupportedResponseMIMETypes": ["response_type"],
+                        "SupportedTransformInstanceTypes": ["transform_instance"],
+                    },
+                    "ModelApprovalStatus": "Approved",
+                    "ModelMetrics": {
+                        "Bias": {},
+                        "Explainability": {},
+                        "ModelQuality": {
+                            "Statistics": {
+                                "ContentType": "text/csv",
+                                "S3Uri": f"s3://{BUCKET}/metrics.csv",
+                            },
+                        },
+                    },
+                    "DriftCheckBaselines": {
+                        "ModelQuality": {
+                            "Constraints": {
+                                "ContentType": "text/csv",
+                                "S3Uri": f"s3://{BUCKET}/constraints_metrics.csv",
+                            }
+                        }
+                    },
+                    "ModelPackageDescription": "description",
+                    "ModelPackageGroupName": "mpg",
+                    "Tags": [{"Key": "myKey", "Value": "myValue"}],
+                },
+            },
+        ]
+    )
+
+
+def test_register_model_tf(estimator_tf, model_metrics, drift_check_baselines):
+    model_data = f"s3://{BUCKET}/model.tar.gz"
+    register_model = RegisterModel(
+        name="RegisterModelStep",
+        estimator=estimator_tf,
+        model_data=model_data,
+        content_types=["content_type"],
+        response_types=["response_type"],
+        inference_instances=["inference_instance"],
+        transform_instances=["transform_instance"],
+        model_package_group_name="mpg",
+        model_metrics=model_metrics,
+        drift_check_baselines=drift_check_baselines,
+        approval_status="Approved",
+        description="description",
+    )
+    assert ordered(register_model.request_dicts()) == ordered(
+        [
+            {
+                "Name": "RegisterModelStep",
+                "Type": "RegisterModel",
+                "Description": "description",
+                "Arguments": {
+                    "InferenceSpecification": {
+                        "Containers": [
+                            {
+                                "Image": "763104351884.dkr.ecr.us-west-2.amazonaws.com/tensorflow-inference:1.15.2-cpu",
+                                "ModelDataUrl": f"s3://{BUCKET}/model.tar.gz",
+                            }
+                        ],
+                        "SupportedContentTypes": ["content_type"],
+                        "SupportedRealtimeInferenceInstanceTypes": ["inference_instance"],
+                        "SupportedResponseMIMETypes": ["response_type"],
+                        "SupportedTransformInstanceTypes": ["transform_instance"],
+                    },
+                    "ModelApprovalStatus": "Approved",
+                    "ModelMetrics": {
+                        "Bias": {},
+                        "Explainability": {},
+                        "ModelQuality": {
+                            "Statistics": {
+                                "ContentType": "text/csv",
+                                "S3Uri": f"s3://{BUCKET}/metrics.csv",
+                            },
+                        },
+                    },
+                    "DriftCheckBaselines": {
+                        "ModelQuality": {
+                            "Constraints": {
+                                "ContentType": "text/csv",
+                                "S3Uri": f"s3://{BUCKET}/constraints_metrics.csv",
+                            }
+                        }
+                    },
+                    "ModelPackageDescription": "description",
+                    "ModelPackageGroupName": "mpg",
+                },
+            },
+        ]
+    )
+
+
+def test_register_model_sip(estimator, model_metrics, drift_check_baselines):
+    model_list = [
+        Model(image_uri="fakeimage1", model_data="Url1", env=[{"k1": "v1"}, {"k2": "v2"}]),
+        Model(image_uri="fakeimage2", model_data="Url2", env=[{"k3": "v3"}, {"k4": "v4"}]),
+    ]
+
+    pipeline_model = PipelineModel(model_list, ROLE)
+
+    register_model = RegisterModel(
+        name="RegisterModelStep",
+        estimator=estimator,
+        content_types=["content_type"],
+        response_types=["response_type"],
+        inference_instances=["inference_instance"],
+        transform_instances=["transform_instance"],
+        model_package_group_name="mpg",
+        model_metrics=model_metrics,
+        drift_check_baselines=drift_check_baselines,
+        approval_status="Approved",
+        description="description",
+        model=pipeline_model,
+        depends_on=["TestStep"],
+    )
+    assert ordered(register_model.request_dicts()) == ordered(
+        [
+            {
+                "Name": "RegisterModelStep",
+                "Type": "RegisterModel",
+                "Description": "description",
+                "DependsOn": ["TestStep"],
+                "Arguments": {
+                    "InferenceSpecification": {
+                        "Containers": [
+                            {
+                                "Image": "fakeimage1",
+                                "ModelDataUrl": "Url1",
+                                "Environment": [{"k1": "v1"}, {"k2": "v2"}],
+                            },
+                            {
+                                "Image": "fakeimage2",
+                                "ModelDataUrl": "Url2",
+                                "Environment": [{"k3": "v3"}, {"k4": "v4"}],
+                            },
+                        ],
+                        "SupportedContentTypes": ["content_type"],
+                        "SupportedRealtimeInferenceInstanceTypes": ["inference_instance"],
+                        "SupportedResponseMIMETypes": ["response_type"],
+                        "SupportedTransformInstanceTypes": ["transform_instance"],
+                    },
+                    "ModelApprovalStatus": "Approved",
+                    "ModelMetrics": {
+                        "Bias": {},
+                        "Explainability": {},
+                        "ModelQuality": {
+                            "Statistics": {
+                                "ContentType": "text/csv",
+                                "S3Uri": f"s3://{BUCKET}/metrics.csv",
+                            },
+                        },
+                    },
+                    "DriftCheckBaselines": {
+                        "ModelQuality": {
+                            "Constraints": {
+                                "ContentType": "text/csv",
+                                "S3Uri": f"s3://{BUCKET}/constraints_metrics.csv",
+                            }
+                        }
+                    },
+                    "ModelPackageDescription": "description",
+                    "ModelPackageGroupName": "mpg",
+                },
+            },
+        ]
+    )
+
+
+def test_register_model_with_model_repack_with_estimator(
+    estimator, model_metrics, drift_check_baselines
+):
+    model_data = f"s3://{BUCKET}/model.tar.gz"
+    dummy_requirements = f"{DATA_DIR}/dummy_requirements.txt"
+    register_model = RegisterModel(
+        name="RegisterModelStep",
+        estimator=estimator,
+        model_data=model_data,
+        content_types=["content_type"],
+        response_types=["response_type"],
+        inference_instances=["inference_instance"],
+        transform_instances=["transform_instance"],
+        model_package_group_name="mpg",
+        model_metrics=model_metrics,
+        drift_check_baselines=drift_check_baselines,
+        approval_status="Approved",
+        description="description",
+        entry_point=f"{DATA_DIR}/dummy_script.py",
+        dependencies=[dummy_requirements],
+        depends_on=["TestStep"],
+        tags=[{"Key": "myKey", "Value": "myValue"}],
+    )
+
+    request_dicts = register_model.request_dicts()
+    assert len(request_dicts) == 2
+
+    for request_dict in request_dicts:
+        if request_dict["Type"] == "Training":
+            assert request_dict["Name"] == "RegisterModelStepRepackModel"
+            assert len(request_dict["DependsOn"]) == 1
+            assert request_dict["DependsOn"][0] == "TestStep"
+            arguments = request_dict["Arguments"]
+            assert BUCKET in arguments["HyperParameters"]["sagemaker_submit_directory"] 
+            arguments["HyperParameters"].pop("sagemaker_submit_directory")
+            assert ordered(arguments) == ordered(
+                {
+                    "AlgorithmSpecification": {
+                        "TrainingImage": MODEL_REPACKING_IMAGE_URI,
+                        "TrainingInputMode": "File",
+                    },
+                    "DebugHookConfig": {
+                        "CollectionConfigurations": [],
+                        "S3OutputPath": f"s3://{BUCKET}/",
+                    },
+                    "HyperParameters": {
+                        "inference_script": '"dummy_script.py"',
+                        "dependencies": f'"{dummy_requirements}"',
+                        "model_archive": '"model.tar.gz"',
+                        "sagemaker_program": '"_repack_model.py"',
+                        "sagemaker_container_log_level": "20",
+                        "sagemaker_region": f'"{REGION}"',
+                        "source_dir": "null",
+                    },
+                    "InputDataConfig": [
+                        {
+                            "ChannelName": "training",
+                            "DataSource": {
+                                "S3DataSource": {
+                                    "S3DataDistributionType": "FullyReplicated",
+                                    "S3DataType": "S3Prefix",
+                                    "S3Uri": f"s3://{BUCKET}",
+                                }
+                            },
+                        }
+                    ],
+                    "OutputDataConfig": {"S3OutputPath": f"s3://{BUCKET}/"},
+                    "ResourceConfig": {
+                        "InstanceCount": 1,
+                        "InstanceType": "ml.m5.large",
+                        "VolumeSizeInGB": 30,
+                    },
+                    "RoleArn": ROLE,
+                    "StoppingCondition": {"MaxRuntimeInSeconds": 86400},
+                    "Tags": [{"Key": "myKey", "Value": "myValue"}],
+                    "VpcConfig": [
+                        ("SecurityGroupIds", ["123", "456"]),
+                        ("Subnets", ["abc", "def"]),
+                    ],
+                }
+            )
+        elif request_dict["Type"] == "RegisterModel":
+            assert request_dict["Name"] == "RegisterModelStep"
+            assert "DependsOn" not in request_dict
+            arguments = request_dict["Arguments"]
+            assert len(arguments["InferenceSpecification"]["Containers"]) == 1
+            assert (
+                arguments["InferenceSpecification"]["Containers"][0]["Image"]
+                == estimator.training_image_uri()
+            )
+            assert isinstance(
+                arguments["InferenceSpecification"]["Containers"][0]["ModelDataUrl"], Properties
+            )
+            del arguments["InferenceSpecification"]["Containers"]
+            assert ordered(arguments) == ordered(
+                {
+                    "InferenceSpecification": {
+                        "SupportedContentTypes": ["content_type"],
+                        "SupportedRealtimeInferenceInstanceTypes": ["inference_instance"],
+                        "SupportedResponseMIMETypes": ["response_type"],
+                        "SupportedTransformInstanceTypes": ["transform_instance"],
+                    },
+                    "ModelApprovalStatus": "Approved",
+                    "ModelMetrics": {
+                        "Bias": {},
+                        "Explainability": {},
+                        "ModelQuality": {
+                            "Statistics": {
+                                "ContentType": "text/csv",
+                                "S3Uri": f"s3://{BUCKET}/metrics.csv",
+                            },
+                        },
+                    },
+                    "DriftCheckBaselines": {
+                        "ModelQuality": {
+                            "Constraints": {
+                                "ContentType": "text/csv",
+                                "S3Uri": f"s3://{BUCKET}/constraints_metrics.csv",
+                            }
+                        }
+                    },
+                    "ModelPackageDescription": "description",
+                    "ModelPackageGroupName": "mpg",
+                    "Tags": [{"Key": "myKey", "Value": "myValue"}],
+                }
+            )
+        else:
+            raise Exception("A step exists in the collection of an invalid type.")
+
+
+def test_register_model_with_model_repack_with_model(model, model_metrics, drift_check_baselines):
+    model_data = f"s3://{BUCKET}/model.tar.gz"
+    register_model = RegisterModel(
+        name="RegisterModelStep",
+        model=model,
+        model_data=model_data,
+        content_types=["content_type"],
+        response_types=["response_type"],
+        inference_instances=["inference_instance"],
+        transform_instances=["transform_instance"],
+        model_package_group_name="mpg",
+        model_metrics=model_metrics,
+        drift_check_baselines=drift_check_baselines,
+        approval_status="Approved",
+        description="description",
+        depends_on=["TestStep"],
+        tags=[{"Key": "myKey", "Value": "myValue"}],
+    )
+
+    request_dicts = register_model.request_dicts()
+    assert len(request_dicts) == 2
+
+    for request_dict in request_dicts:
+        if request_dict["Type"] == "Training":
+            assert request_dict["Name"] == "modelNameRepackModel"
+            assert len(request_dict["DependsOn"]) == 1
+            assert request_dict["DependsOn"][0] == "TestStep"
+            arguments = request_dict["Arguments"]
+            assert BUCKET in arguments["HyperParameters"]["sagemaker_submit_directory"] 
+            arguments["HyperParameters"].pop("sagemaker_submit_directory")
+            assert ordered(arguments) == ordered(
+                {
+                    "AlgorithmSpecification": {
+                        "TrainingImage": MODEL_REPACKING_IMAGE_URI,
+                        "TrainingInputMode": "File",
+                    },
+                    "DebugHookConfig": {
+                        "CollectionConfigurations": [],
+                        "S3OutputPath": f"s3://{BUCKET}/",
+                    },
+                    "HyperParameters": {
+                        "inference_script": '"dummy_script.py"',
+                        "model_archive": '"model.tar.gz"',
+                        "sagemaker_program": '"_repack_model.py"',
+                        "sagemaker_container_log_level": "20",
+                        "sagemaker_region": f'"{REGION}"',
+                        "dependencies": "null",
+                        "source_dir": "null",
+                    },
+                    "InputDataConfig": [
+                        {
+                            "ChannelName": "training",
+                            "DataSource": {
+                                "S3DataSource": {
+                                    "S3DataDistributionType": "FullyReplicated",
+                                    "S3DataType": "S3Prefix",
+                                    "S3Uri": f"s3://{BUCKET}",
+                                }
+                            },
+                        }
+                    ],
+                    "OutputDataConfig": {"S3OutputPath": f"s3://{BUCKET}/"},
+                    "ResourceConfig": {
+                        "InstanceCount": 1,
+                        "InstanceType": "ml.m5.large",
+                        "VolumeSizeInGB": 30,
+                    },
+                    "RoleArn": ROLE,
+                    "StoppingCondition": {"MaxRuntimeInSeconds": 86400},
+                    "Tags": [{"Key": "myKey", "Value": "myValue"}],
+                    "VpcConfig": [
+                        ("SecurityGroupIds", ["123", "456"]),
+                        ("Subnets", ["abc", "def"]),
+                    ],
+                }
+            )
+        elif request_dict["Type"] == "RegisterModel":
+            assert request_dict["Name"] == "RegisterModelStep"
+            assert "DependsOn" not in request_dict
+            arguments = request_dict["Arguments"]
+            assert len(arguments["InferenceSpecification"]["Containers"]) == 1
+            assert arguments["InferenceSpecification"]["Containers"][0]["Image"] == model.image_uri
+            assert isinstance(
+                arguments["InferenceSpecification"]["Containers"][0]["ModelDataUrl"], Properties
+            )
+            del arguments["InferenceSpecification"]["Containers"]
+            assert ordered(arguments) == ordered(
+                {
+                    "InferenceSpecification": {
+                        "SupportedContentTypes": ["content_type"],
+                        "SupportedRealtimeInferenceInstanceTypes": ["inference_instance"],
+                        "SupportedResponseMIMETypes": ["response_type"],
+                        "SupportedTransformInstanceTypes": ["transform_instance"],
+                    },
+                    "ModelApprovalStatus": "Approved",
+                    "ModelMetrics": {
+                        "Bias": {},
+                        "Explainability": {},
+                        "ModelQuality": {
+                            "Statistics": {
+                                "ContentType": "text/csv",
+                                "S3Uri": f"s3://{BUCKET}/metrics.csv",
+                            },
+                        },
+                    },
+                    "DriftCheckBaselines": {
+                        "ModelQuality": {
+                            "Constraints": {
+                                "ContentType": "text/csv",
+                                "S3Uri": f"s3://{BUCKET}/constraints_metrics.csv",
+                            }
+                        }
+                    },
+                    "ModelPackageDescription": "description",
+                    "ModelPackageGroupName": "mpg",
+                    "Tags": [{"Key": "myKey", "Value": "myValue"}],
+                }
+            )
+        else:
+            raise Exception("A step exists in the collection of an invalid type.")
+
+
+def test_register_model_with_model_repack_with_pipeline_model(
+    pipeline_model, model_metrics, drift_check_baselines
+):
+    model_data = f"s3://{BUCKET}/model.tar.gz"
+    service_fault_retry_policy = StepRetryPolicy(
+        exception_types=[StepExceptionTypeEnum.SERVICE_FAULT], max_attempts=10
+    )
+    register_model = RegisterModel(
+        name="RegisterModelStep",
+        model=pipeline_model,
+        model_data=model_data,
+        content_types=["content_type"],
+        response_types=["response_type"],
+        inference_instances=["inference_instance"],
+        transform_instances=["transform_instance"],
+        model_package_group_name="mpg",
+        model_metrics=model_metrics,
+        drift_check_baselines=drift_check_baselines,
+        approval_status="Approved",
+        description="description",
+        depends_on=["TestStep"],
+        repack_model_step_retry_policies=[service_fault_retry_policy],
+        register_model_step_retry_policies=[service_fault_retry_policy],
+        tags=[{"Key": "myKey", "Value": "myValue"}],
+    )
+
+    request_dicts = register_model.request_dicts()
+    assert len(request_dicts) == 2
+
+    for request_dict in request_dicts:
+        if request_dict["Type"] == "Training":
+            assert request_dict["Name"] == "modelNameRepackModel"
+            assert len(request_dict["DependsOn"]) == 1
+            assert request_dict["DependsOn"][0] == "TestStep"
+            arguments = request_dict["Arguments"]
+            assert BUCKET in arguments["HyperParameters"]["sagemaker_submit_directory"] 
+            arguments["HyperParameters"].pop("sagemaker_submit_directory")
+            assert ordered(arguments) == ordered(
+                {
+                    "AlgorithmSpecification": {
+                        "TrainingImage": MODEL_REPACKING_IMAGE_URI,
+                        "TrainingInputMode": "File",
+                    },
+                    "DebugHookConfig": {
+                        "CollectionConfigurations": [],
+                        "S3OutputPath": f"s3://{BUCKET}/",
+                    },
+                    "HyperParameters": {
+                        "dependencies": "null",
+                        "inference_script": '"dummy_script.py"',
+                        "model_archive": '"model.tar.gz"',
+                        "sagemaker_program": '"_repack_model.py"',
+                        "sagemaker_container_log_level": "20",
+                        "sagemaker_region": f'"{REGION}"',
+                        "source_dir": "null",
+                    },
+                    "InputDataConfig": [
+                        {
+                            "ChannelName": "training",
+                            "DataSource": {
+                                "S3DataSource": {
+                                    "S3DataDistributionType": "FullyReplicated",
+                                    "S3DataType": "S3Prefix",
+                                    "S3Uri": f"s3://{BUCKET}",
+                                }
+                            },
+                        }
+                    ],
+                    "OutputDataConfig": {"S3OutputPath": f"s3://{BUCKET}/"},
+                    "ResourceConfig": {
+                        "InstanceCount": 1,
+                        "InstanceType": "ml.m5.large",
+                        "VolumeSizeInGB": 30,
+                    },
+                    "RoleArn": ROLE,
+                    "StoppingCondition": {"MaxRuntimeInSeconds": 86400},
+                    "Tags": [{"Key": "myKey", "Value": "myValue"}],
+                    "VpcConfig": [
+                        ("SecurityGroupIds", ["123", "456"]),
+                        ("Subnets", ["abc", "def"]),
+                    ],
+                }
+            )
+        elif request_dict["Type"] == "RegisterModel":
+            assert request_dict["Name"] == "RegisterModelStep"
+            assert "DependsOn" not in request_dict
+            arguments = request_dict["Arguments"]
+            assert len(arguments["InferenceSpecification"]["Containers"]) == 1
+            assert (
+                arguments["InferenceSpecification"]["Containers"][0]["Image"]
+                == pipeline_model.models[0].image_uri
+            )
+            assert isinstance(
+                arguments["InferenceSpecification"]["Containers"][0]["ModelDataUrl"], Properties
+            )
+            del arguments["InferenceSpecification"]["Containers"]
+            assert ordered(arguments) == ordered(
+                {
+                    "InferenceSpecification": {
+                        "SupportedContentTypes": ["content_type"],
+                        "SupportedRealtimeInferenceInstanceTypes": ["inference_instance"],
+                        "SupportedResponseMIMETypes": ["response_type"],
+                        "SupportedTransformInstanceTypes": ["transform_instance"],
+                    },
+                    "ModelApprovalStatus": "Approved",
+                    "ModelMetrics": {
+                        "Bias": {},
+                        "Explainability": {},
+                        "ModelQuality": {
+                            "Statistics": {
+                                "ContentType": "text/csv",
+                                "S3Uri": f"s3://{BUCKET}/metrics.csv",
+                            },
+                        },
+                    },
+                    "DriftCheckBaselines": {
+                        "ModelQuality": {
+                            "Constraints": {
+                                "ContentType": "text/csv",
+                                "S3Uri": f"s3://{BUCKET}/constraints_metrics.csv",
+                            }
+                        }
+                    },
+                    "ModelPackageDescription": "description",
+                    "ModelPackageGroupName": "mpg",
+                    "Tags": [{"Key": "myKey", "Value": "myValue"}],
+                }
+            )
+        else:
+            raise Exception("A step exists in the collection of an invalid type.")
+
+
+def test_estimator_transformer(estimator):
+    model_data = f"s3://{BUCKET}/model.tar.gz"
+    model_inputs = CreateModelInput(
+        instance_type="c4.4xlarge",
+        accelerator_type="ml.eia1.medium",
+    )
+    service_fault_retry_policy = StepRetryPolicy(
+        exception_types=[StepExceptionTypeEnum.SERVICE_FAULT], max_attempts=10
+    )
+    transform_inputs = TransformInput(data=f"s3://{BUCKET}/transform_manifest")
+    estimator_transformer = EstimatorTransformer(
+        name="EstimatorTransformerStep",
+        estimator=estimator,
+        model_data=model_data,
+        model_inputs=model_inputs,
+        instance_count=1,
+        instance_type="ml.c4.4xlarge",
+        transform_inputs=transform_inputs,
+        depends_on=["TestStep"],
+        model_step_retry_policies=[service_fault_retry_policy],
+        transform_step_retry_policies=[service_fault_retry_policy],
+        repack_model_step_retry_policies=[service_fault_retry_policy],
+    )
+    request_dicts = estimator_transformer.request_dicts()
+    assert len(request_dicts) == 2
+
+    for request_dict in request_dicts:
+        if request_dict["Type"] == "Model":
+            assert request_dict == {
+                "Name": "EstimatorTransformerStepCreateModelStep",
+                "Type": "Model",
+                "DependsOn": ["TestStep"],
+                "RetryPolicies": [service_fault_retry_policy.to_request()],
+                "Arguments": {
+                    "ExecutionRoleArn": "DummyRole",
+                    "PrimaryContainer": {
+                        "Environment": {},
+                        "Image": "fakeimage",
+                        "ModelDataUrl": "s3://my-bucket/model.tar.gz",
+                    },
+                },
+            }
+        elif request_dict["Type"] == "Transform":
+            assert request_dict["Name"] == "EstimatorTransformerStepTransformStep"
+            assert request_dict["RetryPolicies"] == [service_fault_retry_policy.to_request()]
+            arguments = request_dict["Arguments"]
+            assert isinstance(arguments["ModelName"], Properties)
+            arguments.pop("ModelName")
+            assert "DependsOn" not in request_dict
+            assert arguments == {
+                "TransformInput": {
+                    "DataSource": {
+                        "S3DataSource": {
+                            "S3DataType": "S3Prefix",
+                            "S3Uri": f"s3://{BUCKET}/transform_manifest",
+                        }
+                    }
+                },
+                "TransformOutput": {"S3OutputPath": None},
+                "TransformResources": {"InstanceCount": 1, "InstanceType": "ml.c4.4xlarge"},
+            }
+        else:
+            raise Exception("A step exists in the collection of an invalid type.")
+
+
+def test_estimator_transformer_with_model_repack_with_estimator(estimator):
+    model_data = f"s3://{BUCKET}/model.tar.gz"
+    model_inputs = CreateModelInput(
+        instance_type="c4.4xlarge",
+        accelerator_type="ml.eia1.medium",
+    )
+    service_fault_retry_policy = StepRetryPolicy(
+        exception_types=[StepExceptionTypeEnum.SERVICE_FAULT], max_attempts=10
+    )
+    transform_inputs = TransformInput(data=f"s3://{BUCKET}/transform_manifest")
+    estimator_transformer = EstimatorTransformer(
+        name="EstimatorTransformerStep",
+        estimator=estimator,
+        model_data=model_data,
+        model_inputs=model_inputs,
+        instance_count=1,
+        instance_type="ml.c4.4xlarge",
+        transform_inputs=transform_inputs,
+        depends_on=["TestStep"],
+        model_step_retry_policies=[service_fault_retry_policy],
+        transform_step_retry_policies=[service_fault_retry_policy],
+        repack_model_step_retry_policies=[service_fault_retry_policy],
+        entry_point=f"{DATA_DIR}/dummy_script.py",
+    )
+    request_dicts = estimator_transformer.request_dicts()
+    assert len(request_dicts) == 3
+
+    for request_dict in request_dicts:
+        if request_dict["Type"] == "Training":
+            assert request_dict["Name"] == "EstimatorTransformerStepRepackModel"
+            assert request_dict["DependsOn"] == ["TestStep"]
+            assert request_dict["RetryPolicies"] == [service_fault_retry_policy.to_request()]
+            arguments = request_dict["Arguments"]
+            # pop out the dynamic generated fields
+            arguments["HyperParameters"].pop("sagemaker_submit_directory")
+            assert arguments == {
+                "AlgorithmSpecification": {
+                    "TrainingInputMode": "File",
+                    "TrainingImage": "246618743249.dkr.ecr.us-west-2.amazonaws.com/"
+                    + "sagemaker-scikit-learn:0.23-1-cpu-py3",
+                },
+                "OutputDataConfig": {"S3OutputPath": "s3://my-bucket/"},
+                "StoppingCondition": {"MaxRuntimeInSeconds": 86400},
+                "ResourceConfig": {
+                    "InstanceCount": 1,
+                    "InstanceType": "ml.m5.large",
+                    "VolumeSizeInGB": 30,
+                },
+                "RoleArn": "DummyRole",
+                "InputDataConfig": [
+                    {
+                        "DataSource": {
+                            "S3DataSource": {
+                                "S3DataType": "S3Prefix",
+                                "S3Uri": "s3://my-bucket",
+                                "S3DataDistributionType": "FullyReplicated",
+                            }
+                        },
+                        "ChannelName": "training",
+                    }
+                ],
+                "HyperParameters": {
+                    "inference_script": '"dummy_script.py"',
+                    "model_archive": '"model.tar.gz"',
+                    "dependencies": "null",
+                    "source_dir": "null",
+                    "sagemaker_program": '"_repack_model.py"',
+                    "sagemaker_container_log_level": "20",
+                    "sagemaker_region": '"us-west-2"',
+                },
+                "VpcConfig": {"Subnets": ["abc", "def"], "SecurityGroupIds": ["123", "456"]},
+                "DebugHookConfig": {
+                    "S3OutputPath": "s3://my-bucket/",
+                    "CollectionConfigurations": [],
+                },
+            }
+        elif request_dict["Type"] == "Model":
+            assert request_dict["Name"] == "EstimatorTransformerStepCreateModelStep"
+            assert request_dict["RetryPolicies"] == [service_fault_retry_policy.to_request()]
+            arguments = request_dict["Arguments"]
+            assert isinstance(arguments["PrimaryContainer"]["ModelDataUrl"], Properties)
+            arguments["PrimaryContainer"].pop("ModelDataUrl")
+            assert "DependsOn" not in request_dict
+            assert arguments == {
+                "ExecutionRoleArn": "DummyRole",
+                "PrimaryContainer": {
+                    "Environment": {},
+                    "Image": "fakeimage",
+                },
+            }
+        elif request_dict["Type"] == "Transform":
+            assert request_dict["Name"] == "EstimatorTransformerStepTransformStep"
+            assert request_dict["RetryPolicies"] == [service_fault_retry_policy.to_request()]
+            arguments = request_dict["Arguments"]
+            assert isinstance(arguments["ModelName"], Properties)
+            arguments.pop("ModelName")
+            assert "DependsOn" not in request_dict
+            assert arguments == {
+                "TransformInput": {
+                    "DataSource": {
+                        "S3DataSource": {
+                            "S3DataType": "S3Prefix",
+                            "S3Uri": f"s3://{BUCKET}/transform_manifest",
+                        }
+                    }
+                },
+                "TransformOutput": {"S3OutputPath": None},
+                "TransformResources": {"InstanceCount": 1, "InstanceType": "ml.c4.4xlarge"},
+            }
+        else:
+            raise Exception("A step exists in the collection of an invalid type.")

From dbddcc22af523094ebb8d9e053f2430366a17500 Mon Sep 17 00:00:00 2001
From: Payton Staub <pstaub@amazon.com>
Date: Wed, 2 Mar 2022 10:49:15 -0800
Subject: [PATCH 3/4] black-format

---
 tests/unit/sagemaker/workflow/test_step_collections.py | 6 +++---
 1 file changed, 3 insertions(+), 3 deletions(-)

diff --git a/tests/unit/sagemaker/workflow/test_step_collections.py b/tests/unit/sagemaker/workflow/test_step_collections.py
index bad879b5e5..ea810796f4 100644
--- a/tests/unit/sagemaker/workflow/test_step_collections.py
+++ b/tests/unit/sagemaker/workflow/test_step_collections.py
@@ -457,7 +457,7 @@ def test_register_model_with_model_repack_with_estimator(
             assert len(request_dict["DependsOn"]) == 1
             assert request_dict["DependsOn"][0] == "TestStep"
             arguments = request_dict["Arguments"]
-            assert BUCKET in arguments["HyperParameters"]["sagemaker_submit_directory"] 
+            assert BUCKET in arguments["HyperParameters"]["sagemaker_submit_directory"]
             arguments["HyperParameters"].pop("sagemaker_submit_directory")
             assert ordered(arguments) == ordered(
                 {
@@ -582,7 +582,7 @@ def test_register_model_with_model_repack_with_model(model, model_metrics, drift
             assert len(request_dict["DependsOn"]) == 1
             assert request_dict["DependsOn"][0] == "TestStep"
             arguments = request_dict["Arguments"]
-            assert BUCKET in arguments["HyperParameters"]["sagemaker_submit_directory"] 
+            assert BUCKET in arguments["HyperParameters"]["sagemaker_submit_directory"]
             arguments["HyperParameters"].pop("sagemaker_submit_directory")
             assert ordered(arguments) == ordered(
                 {
@@ -711,7 +711,7 @@ def test_register_model_with_model_repack_with_pipeline_model(
             assert len(request_dict["DependsOn"]) == 1
             assert request_dict["DependsOn"][0] == "TestStep"
             arguments = request_dict["Arguments"]
-            assert BUCKET in arguments["HyperParameters"]["sagemaker_submit_directory"] 
+            assert BUCKET in arguments["HyperParameters"]["sagemaker_submit_directory"]
             arguments["HyperParameters"].pop("sagemaker_submit_directory")
             assert ordered(arguments) == ordered(
                 {

From 2dfde229ff6f0789c46cf628e220e57077aec4e7 Mon Sep 17 00:00:00 2001
From: Payton Staub <pstaub@amazon.com>
Date: Wed, 2 Mar 2022 16:04:30 -0800
Subject: [PATCH 4/4] Add property check

---
 src/sagemaker/workflow/steps.py | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/src/sagemaker/workflow/steps.py b/src/sagemaker/workflow/steps.py
index 1acb82687e..1ef63ef915 100644
--- a/src/sagemaker/workflow/steps.py
+++ b/src/sagemaker/workflow/steps.py
@@ -301,7 +301,8 @@ def arguments(self) -> RequestType:
         )
         request_dict = self.estimator.sagemaker_session._get_train_request(**train_args)
         request_dict.pop("TrainingJobName")
-        request_dict["HyperParameters"].pop("sagemaker_job_name", None)
+        if "HyperParameters" in request_dict:
+            request_dict["HyperParameters"].pop("sagemaker_job_name", None)
 
         return request_dict