当前位置：波球体育直播官网 · 首页 > 新闻资讯

微软Azure OpenAI服务是什么？微软Azure OpenAI服务普遍的问题解答

来源：波球体育直播官网发布时间：2024-07-23 19:46:59

包括但不限于内容生成、汇总、图像理解、语义搜索和自然语言到代码的转换。你能够最终靠 REST API、Python SDK 或 Azure OpenAI Studio 中基于 Web 的界面访问该服务。

由于需要应对很高的需求、即将推出的产品改进以及履行Microsoft 对负责任 AI 做出的承诺，我们目前会限制访问。当前，我们正在与已经同 Microsoft 建立了合作伙伴关系的客户、用例风险较低的客户以及承诺融入缓解措施的客户合作。

申请表单中包含了更具体的信息。感谢你们的耐心，我们将努力以负责的态度实现 Azure OpenAI 的更多样化访问方式。

通过微软官方合作伙伴获取服务，企业用户都能够合规、稳定地使用ChatGPT，满足国内发票需求，同时也能解决连接不稳定/响应速度慢/并发配额低等问题。

作为微软的合作伙伴，全云在线可为企业开通绿色申请通道！包括最新版本GPT-4o、Dalle-3等，只要企业有需求，全云在线都能协助快速开通！

补全终结点是 API 服务的核心组件。此 API 提供对模型的文本输入、文本输出接口的访问。用户只需提供一个包含英文文本命令的输入提示，模型就会生成文本补全。

Azure OpenAI 通过将文本分解为标记来处理文本。标记可以是单词，也可以是字符块。例如，单词“hamburger”将分解为标记“ham”、“bur”和“ger”，而“pear”之类的常见短单词只是一个单个标记。许多标记以空格开头，例如“ hello”和“ bye”。

给定请求中处理的标记总数取决于输入、输出和请求参数的长度。处理的标记数量也会影响模型的响应延迟和吞吐量。

输入图像的标记成本取决于两个重要的因素：图像的大小以及用于每个图像的细节设置（低或高）。下面是其工作原理的明细：

通过低细节，API 可以返回更快的响应，并且对于不需要高细节的用例，能够正常的使用更少的输入标记。

示例：4096 x 8192 图像（低细节）：成本为固定的 85 个标记，因为它是一个低细节图像，并且大小不可能影响此模式下的成本。

利用高细节，API 能够最终靠将图像裁剪为较小的方块更详细地查看图像。每个方块可使用更多标记来生成文本。

首先缩放图像，以适合 2048 x 2048 方形，同时保持其纵横比。

将图像分为 512 像素方形图块，这些图块（部分图块向上舍入）的数量决定了最终成本。每个图块的成本为 170 个标记。

创建 Azure OpenAI 资源后，必须先部署模型，然后才能开始发出 API 调用和生成文本。能够正常的使用部署 API 来完成此操作。这些 API 允许指定要使用的模型。

OpenAI 中的 GPT-3、GPT-3.5 和 GPT-4 模型是基于提示的。使用基于提示的模型时，用户通过输入文本提示与模型交互，该文本提示通过文本补全进行响应。补全是模型的输入文本的延续。

虽然这些模型很强大，但它们的行为对提示也非常敏感。这使得提示工程成为一项重要的开发技能。

提示构造可能很困难。在实践中，提示的作用是配置模型权重以完成所需的任务，但它更像艺术而不是科学，常常要经验和直觉来制作成功的提示。

DALL-E 模型（有一些为预览版，请参阅模型）基于用户更好的提供的文本提示生成图像。

Azure OpenAI 不使用客户数据来重新训练模型。有关详情信息，请参阅Azure OpenAI 数据、隐私和安全指南。

GPT-4 Turbo 预览版是(1106-preview) 模型。若要部署此模型，请在“部署”下选择模型 gpt-4。对于“模型版本”，请选择“1106-preview”。若要检查该模型在哪些区域可用，请参阅模型页面。

是的，作为 Azure AI 服务的一部分，Azure OpenAI 支持 VNET 和专用终结点。若要了解详情信息，请参阅Azure AI 服务虚拟网络指南。

否，GPT-4 由 OpenAI 设计为多模式，但目前仅支持文本输入和输出。

以前，添加新用例的过程要求客户重新应用到服务。现在，我们将发布一个新流程，允许你快速添加新用例以使用服务。此过程遵循 Azure AI 服务中既定的受限访问流程。现有客户能在此处证明任何和所有新用例。注意，每当你想要将服务用于最初未申请的新用例时，都需要这样做。

我尝试使用嵌入内容时受到错误“InvalidRequestError: 输入太多。最大输入数为 16。如何修复此问题？

尝试发送一批文本以将其作为数组嵌入到单个 API 请求中时，通常会发生此错误。目前，Azure OpenAI 仅支持具有版本 2 模型的多个输入的嵌入数组。此模型版本支持每个 API 请求最多包含 16 个输入的数组。使用 text-embedding-ada-002（版本 2）模型时，数组长度最多可为 8,191 个令牌。

在哪里能了解使用 Azure OpenAI 从服务获取所需响应的更好方法？

查看我们的提示工程简介。虽然这些模型很强大，但它们的行为对从用户处收到的提示也非常敏感。这使得提示构造成为开发的重要技能。完成此简介后，请查看关于高级提示工程技术的文章。

我的来宾帐户已被授予对 Azure OpenAI 资源的访问权限，但我无法在 Azure OpenAI Studio 中访问该资源。怎么来实现访问？

或者，如果已从 Azure OpenAI 资源的“概览”窗格中登录到Azure 门户，则可以再一次进行选择“转到 Azure OpenAI Studio”以使用适当的组织上下文自动登录。

当我问 GPT-4 它正在运行什么模型时，它告诉我正在运行 GPT-3。为何发生这种情况？

Azure OpenAI 模型（包括 GPT-4）无法正确识别“正在运行什么模型”是预期行为。

最终，模型将执行下一个令牌预测来回答你的问题。该模型没有一点本机功能来查询当前运行的是哪个模型版本，因此无法回答你的问题。要回答这样的一个问题，始终可以转到 Azure OpenAI Studio “管理”“部署”，然后查阅模型名称列，确认哪个模型当前与给定部署名称相关联。

“你运行的是哪个模型？”或“OpenAI 的最新模型是什么？”这样的问题与问模型今天天气怎么样所产生的结果的质量差不多。它可能会返回正确的结果，但这纯粹是偶然的。除训练/训练数据的那部分之外，模型本身没有实际信息。就 GPT-4 而言，截至 2023 年 8 月，基础训练数据只截止到 2021 年 9 月。 GPT-4 在 2023 年 3 月才发布，因此，除非 OpenAI 发布使用更新后训练数据的新版本，或发布经过微调可回答这些特定问题的新版本，否则 GPT-4 的预期行为是，回复说 GPT-3 是 OpenAI 的最新模型版本。

如果你希望帮助基于 GPT 的模型准确回答“你正在运行什么模型？”这样的一个问题，则一定要通过模型系统消息的提示工程和检索增强生成 (RAG)（这是Azure OpenAI对数据所使用的技术，采用该技术，查询时会将最新信息注入到系统消息中）等技术向模型提供该信息，或者通过微调来微调模型的特定版本，以便根据模型版本以某种方式回答该问题。

我询问该模型其知识截止时间是何时，它给出的答案与 Azure OpenAI 模型页面上的答案不同。为何发生这种情况？

这是预期的行为。这些模型无法回答有关其自身的问题。若要了解模型训练数据的知识截止时间，请参阅模型页面。

我向模型询问了一个关于知识截止之前刚发生的事情的问题，它得到了错误的答案。为何发生这种情况？

这是预期的行为。首先，不能确保最近发生的每个事件都是模型训练数据的一部分。即使信息是训练数据的一部分，如果不使用检索增强生成 (RAG) 之类的其他技术来帮助确定模型的响应，也总是有可能发生不可靠的响应。 Azure OpenAI 的“使用你的数据”功能和必应聊天均将 Azure OpenAI 模型与检索增强生成配合使用来帮助进一步确定模型响应。

向最新的 GPT-4 Turbo 预览版模型询问最近发生明显的变化的事情（例如“新西兰总理是谁？”），可能会得到捏造的响应。然而，询问模型“何时辞去总理职务？”往往会产生准确的响应，表明训练数据知识至少截止到 2023 年 1 月。

因此，虽能通过问题来探测模型，从而猜测其训练数据知识截止时间，但模型页面是检查模型知识截止时间的最佳位置。

我们注意到，API 调用未能完成，并出现状态代码 400，但也出现了相关的费用。为什么失败的 API 调用会产生费用？

如果服务执行处理，则即使状态代码为不成功（不是 200），也可能向你收取费用。常见示例包括：由于内容筛选器或输入限制导致的 400 错误，或由于超时导致的 408 错误。当收到了以及的时，也会产生费用。在这种情况下，提示没有一点问题，但检测到模型生成的补全内容违反了内容筛选规则，导致补全内容被筛除。如果服务不做处理，则不需要支付费用。例如，由于身份验证导致的 401 错误或由于超过速率限值导致的 429 错误。

下一篇:“全国低碳日”北京主场活动举办要点碳排放单位成北京绿电消纳主力