AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / server / Perguntas / 1179143
Accepted
Franck Dernoncourt
Franck Dernoncourt
Asked: 2025-04-15 15:45:26 +0800 CST2025-04-15 15:45:26 +0800 CST 2025-04-15 15:45:26 +0800 CST

"Este modelo não está disponível no recurso selecionado do Serviço OpenAI do Azure.", mas acho que está. Por que não encontrei?

  • 772

Implantei um minimodelo GPT 4o ajustado no Azure, região northcentralus.

Estou recebendo este erro no portal do Azure ao tentar editá-lo (eu queria alterar a taxa máxima de acertos):

Este modelo não está disponível no recurso selecionado do Serviço OpenAI do Azure. Saiba mais sobre a disponibilidade do modelo.

insira a descrição da imagem aqui

Meu recurso selecionado no portal do Azure está em northcentralus:

insira a descrição da imagem aqui

No entanto, https://learn.microsoft.com/en-us/azure/ai-services/openai/concepts/models?tabs=global-standard%2Cstandard-chat-completions#fine-tuning-models afirma que o minimodelo GPT 4o ajustado está disponível no Azure, região northcentralus:

insira a descrição da imagem aqui

O que eu perdi? Por que estou recebendo o erro "Este modelo não está disponível no recurso selecionado do Serviço OpenAI do Azure"?


Implantei o minimodelo GPT 4o com ajuste fino seguindo o tutorial do Azure sobre ajuste fino do GPT. Código para a fase de implantação:

# Deploy fine-tuned model

import json
import requests

token = '[redacted]'
subscription = '[redacted]'
resource_group = "[redacted]"
resource_name = "[redacted]"
model_deployment_name = "gpt-4o-mini-2024-07-18-ft" # Custom deployment name you chose for your fine-tuning model

deploy_params = {'api-version': "2023-05-01"}
deploy_headers = {'Authorization': 'Bearer {}'.format(token), 'Content-Type': 'application/json'}

deploy_data = {
    "sku": {"name": "standard", "capacity": 1},
    "properties": {
        "model": {
            "format": "OpenAI",
            "name": "gpt-4o-mini-2024-07-18.ft-[redacted]", #retrieve this value from the previous call, it will look like gpt-4o-mini-2024-07-18.ft-[redacted]
            "version": "1"
        }
    }
}
deploy_data = json.dumps(deploy_data)

request_url = f'https://management.azure.com/subscriptions/{subscription}/resourceGroups/{resource_group}/providers/Microsoft.CognitiveServices/accounts/{resource_name}/deployments/{model_deployment_name}'

print('Creating a new deployment...')

r = requests.put(request_url, params=deploy_params, headers=deploy_headers, data=deploy_data)

print(r)
print(r.reason)
print(r.json())

O token foi gerado via az account get-access-token.

azure
  • 1 1 respostas
  • 65 Views

1 respostas

  • Voted
  1. Best Answer
    Franck Dernoncourt
    2025-04-19T06:05:28+08:002025-04-19T06:05:28+08:00

    Desisti da interface do Azure. Aqui está o código Python para isso. Requer um token gerado via  az account get-access-token.

    import json
    import requests
    
    new_capacity = 3 # Change this number to your desired capacity. 3 means 3000 tokens/minute.
    
    # Authentication and resource identification
    token = "YOUR_BEARER_TOKEN"  # Replace with your actual token
    subscription = ''
    resource_group = ""
    resource_name = ""
    model_deployment_name = ""
    
    # API parameters and headers
    update_params = {'api-version': "2023-05-01"}
    update_headers = {'Authorization': 'Bearer {}'.format(token), 'Content-Type': 'application/json'}
    
    # First, get the current deployment to preserve its configuration
    request_url = f'https://management.azure.com/subscriptions/{subscription}/resourceGroups/{resource_group}/providers/Microsoft.CognitiveServices/accounts/{resource_name}/deployments/{model_deployment_name}'
    r = requests.get(request_url, params=update_params, headers=update_headers)
    
    if r.status_code != 200:
        print(f"Failed to get current deployment: {r.status_code}")
        print(r.reason)
        if hasattr(r, 'json'):
            print(r.json())
        exit(1)
    
    # Get the current deployment configuration
    current_deployment = r.json()
    
    # Update only the capacity in the configuration
    update_data = {
        "sku": {
            "name": current_deployment["sku"]["name"],
            "capacity": new_capacity  
        },
        "properties": current_deployment["properties"]
    }
    
    update_data = json.dumps(update_data)
    
    print('Updating deployment capacity...')
    
    # Use PUT to update the deployment
    r = requests.put(request_url, params=update_params, headers=update_headers, data=update_data)
    
    print(f"Status code: {r.status_code}")
    print(f"Reason: {r.reason}")
    if hasattr(r, 'json'):
        print(r.json())
    

    Demora alguns segundos para ser atualizado.

    • 0

relate perguntas

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Você pode passar usuário/passar para autenticação básica HTTP em parâmetros de URL?

    • 5 respostas
  • Marko Smith

    Ping uma porta específica

    • 18 respostas
  • Marko Smith

    Verifique se a porta está aberta ou fechada em um servidor Linux?

    • 7 respostas
  • Marko Smith

    Como automatizar o login SSH com senha?

    • 10 respostas
  • Marko Smith

    Como posso dizer ao Git para Windows onde encontrar minha chave RSA privada?

    • 30 respostas
  • Marko Smith

    Qual é o nome de usuário/senha de superusuário padrão para postgres após uma nova instalação?

    • 5 respostas
  • Marko Smith

    Qual porta o SFTP usa?

    • 6 respostas
  • Marko Smith

    Linha de comando para listar usuários em um grupo do Windows Active Directory?

    • 9 respostas
  • Marko Smith

    O que é um arquivo Pem e como ele difere de outros formatos de arquivo de chave gerada pelo OpenSSL?

    • 3 respostas
  • Marko Smith

    Como determinar se uma variável bash está vazia?

    • 15 respostas
  • Martin Hope
    Davie Ping uma porta específica 2009-10-09 01:57:50 +0800 CST
  • Martin Hope
    kernel O scp pode copiar diretórios recursivamente? 2011-04-29 20:24:45 +0800 CST
  • Martin Hope
    Robert ssh retorna "Proprietário incorreto ou permissões em ~/.ssh/config" 2011-03-30 10:15:48 +0800 CST
  • Martin Hope
    Eonil Como automatizar o login SSH com senha? 2011-03-02 03:07:12 +0800 CST
  • Martin Hope
    gunwin Como lidar com um servidor comprometido? 2011-01-03 13:31:27 +0800 CST
  • Martin Hope
    Tom Feiner Como posso classificar a saída du -h por tamanho 2009-02-26 05:42:42 +0800 CST
  • Martin Hope
    Noah Goodrich O que é um arquivo Pem e como ele difere de outros formatos de arquivo de chave gerada pelo OpenSSL? 2009-05-19 18:24:42 +0800 CST
  • Martin Hope
    Brent Como determinar se uma variável bash está vazia? 2009-05-13 09:54:48 +0800 CST

Hot tag

linux nginx windows networking ubuntu domain-name-system amazon-web-services active-directory apache-2.4 ssh

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve