Implantei um minimodelo GPT 4o ajustado no Azure, região northcentralus
.
Estou recebendo este erro no portal do Azure ao tentar editá-lo (eu queria alterar a taxa máxima de acertos):
Este modelo não está disponível no recurso selecionado do Serviço OpenAI do Azure. Saiba mais sobre a disponibilidade do modelo.
Meu recurso selecionado no portal do Azure está em northcentralus
:
No entanto, https://learn.microsoft.com/en-us/azure/ai-services/openai/concepts/models?tabs=global-standard%2Cstandard-chat-completions#fine-tuning-models afirma que o minimodelo GPT 4o ajustado está disponível no Azure, região northcentralus
:
O que eu perdi? Por que estou recebendo o erro "Este modelo não está disponível no recurso selecionado do Serviço OpenAI do Azure"?
Implantei o minimodelo GPT 4o com ajuste fino seguindo o tutorial do Azure sobre ajuste fino do GPT. Código para a fase de implantação:
# Deploy fine-tuned model
import json
import requests
token = '[redacted]'
subscription = '[redacted]'
resource_group = "[redacted]"
resource_name = "[redacted]"
model_deployment_name = "gpt-4o-mini-2024-07-18-ft" # Custom deployment name you chose for your fine-tuning model
deploy_params = {'api-version': "2023-05-01"}
deploy_headers = {'Authorization': 'Bearer {}'.format(token), 'Content-Type': 'application/json'}
deploy_data = {
"sku": {"name": "standard", "capacity": 1},
"properties": {
"model": {
"format": "OpenAI",
"name": "gpt-4o-mini-2024-07-18.ft-[redacted]", #retrieve this value from the previous call, it will look like gpt-4o-mini-2024-07-18.ft-[redacted]
"version": "1"
}
}
}
deploy_data = json.dumps(deploy_data)
request_url = f'https://management.azure.com/subscriptions/{subscription}/resourceGroups/{resource_group}/providers/Microsoft.CognitiveServices/accounts/{resource_name}/deployments/{model_deployment_name}'
print('Creating a new deployment...')
r = requests.put(request_url, params=deploy_params, headers=deploy_headers, data=deploy_data)
print(r)
print(r.reason)
print(r.json())
O token foi gerado via az account get-access-token
.
Desisti da interface do Azure. Aqui está o código Python para isso. Requer um token gerado via
az account get-access-token
.Demora alguns segundos para ser atualizado.