# Erstellen Sie einen SageMaker-Consumer
sagemaker_client = boto3.shopper(’sagemaker‘)
# Geben Sie den S3-Speicherort des Modellartefakts an
model_artifact = ’s3://your-bucket/your-model/mannequin.tar.gz‘
# Geben Sie die Inferenzcodedatei an
inference_code = ’s3://your-bucket/your-code/inference.py‘
# Erstellen Sie ein SageMaker-Modell
model_name = ‚Ihr-Modellname‘
sagemaker_client.create_model(
ModelName=Modellname,
PrimaryContainer={
‚Picture‘: ‚Ihr-Container-Picture‘,
‚ModelDataUrl‘: model_artifact,
‚Umfeld‘: {
‚SAGEMAKER_PROGRAM‘: Inferenzcode
}
}
)
# Erstellen Sie eine Endpunktkonfiguration
endpoint_config_name = ‚Ihr-Endpunkt-Konfigurationsname‘
sagemaker_client.create_endpoint_config(
EndpointConfigName=endpoint_config_name,
ProductionVariants=[
{
‚VariantName‘: ‚your-variant-name‘,
‚ModelName‘: model_name,
‚InstanceType‘: ‚ml.m4.xlarge‘,
‚InitialInstanceCount‘: 1,
‚InitialVariantWeight‘: 1
}
]
)
# Erstellen Sie einen Endpunkt
endpoint_name = ‚Ihr-Endpunktname‘
sagemaker_client.create_endpoint(
EndpointName=Endpoint_name,
EndpointConfigName=endpoint_config_name
)
# Warten Sie, bis der Endpunkt erstellt und in Betrieb ist
sagemaker_client.get_waiter(‚endpoint_in_service‘).wait(EndpointName=endpoint_name)
# Stellen Sie eine Rückschlussanforderung an den Endpunkt
runtime_client = boto3.shopper(’sagemaker-runtime‘)
endpoint_response = runtime_client.invoke_endpoint(
EndpointName=Endpoint_name,
ContentType=’utility/json‘,
Physique='{„knowledge“: „your-data“}‘
)
# Verarbeiten Sie die Inferenzantwort
inference_result = endpoint_response[‚Body‘].lesen()
print(inference_result)