MiniMax Chat

Spring AI 支持 MiniMax 提供的各种 AI 语言模型。您可以与 MiniMax 语言模型交互,并基于 MiniMax 模型构建多语言对话助手。

前提条件

您需要在 MiniMax 创建 API 才能访问 MiniMax 语言模型。

MiniMax 注册页面 创建账户,并在 API Keys page 生成 token。Spring AI 项目定义了一个名为 spring.ai.minimax.api-key 的配置属性,您应将其设置为从 API Keys page 获取的 API Key 的值。导出环境变量是设置该配置属性的一种方式。

export SPRING_AI_MINIMAX_API_KEY=<INSERT KEY HERE>

添加仓库和 BOM

Spring AI 的构件(artifact)发布在 Maven Central 和 Spring Snapshot 仓库中。请参考仓库部分,将这些仓库添加到您的构建系统。

为了帮助进行依赖管理,Spring AI 提供了一个 BOM (bill of materials),以确保在整个项目中使用一致版本的 Spring AI。请参考依赖管理部分,将 Spring AI BOM 添加到您的构建系统。

自动配置

Spring AI 自动配置、starter 模块的构件名称发生了重大变化。请参考升级注意事项获取更多信息。

Spring AI 为 MiniMax Chat Client 提供了 Spring Boot 自动配置。要启用它,请将以下依赖添加到项目的 Maven pom.xml 文件中

<dependency>
    <groupId>org.springframework.ai</groupId>
    <artifactId>spring-ai-starter-model-minimax</artifactId>
</dependency>

或添加到您的 Gradle build.gradle 构建文件中。

dependencies {
    implementation 'org.springframework.ai:spring-ai-starter-model-minimax'
}
请参考依赖管理部分,将 Spring AI BOM 添加到您的构建文件中。

对话属性

重试属性

前缀 spring.ai.retry 用作属性前缀,允许您配置 MiniMax 对话模型的重试机制。

属性 描述 默认值

spring.ai.retry.max-attempts

最大重试次数。

10

spring.ai.retry.backoff.initial-interval

指数回退策略的初始睡眠时长。

2 秒。

spring.ai.retry.backoff.multiplier

回退间隔乘数。

5

spring.ai.retry.backoff.max-interval

最大回退时长。

3 分钟。

spring.ai.retry.on-client-errors

如果为 false,则抛出 NonTransientAiException,且不尝试重试 4xx 客户端错误码。

false

spring.ai.retry.exclude-on-http-codes

不应触发重试的 HTTP 状态码列表(例如,抛出 NonTransientAiException)。

spring.ai.retry.on-http-codes

应触发重试的 HTTP 状态码列表(例如,抛出 TransientAiException)。

连接属性

前缀 spring.ai.minimax 用作属性前缀,允许您连接到 MiniMax。

属性 描述 默认值

spring.ai.minimax.base-url

要连接的 URL

api.minimax.chat

spring.ai.minimax.api-key

API 密钥

-

配置属性

对话自动配置的启用和禁用现在通过前缀为 spring.ai.model.chat 的顶级属性进行配置。

要启用,spring.ai.model.chat=minimax (默认启用)

要禁用,spring.ai.model.chat=none (或任何与 minimax 不匹配的值)

进行此更改是为了允许配置多个模型。

前缀 spring.ai.minimax.chat 是属性前缀,允许您配置 MiniMax 的对话模型实现。

属性 描述 默认值

spring.ai.minimax.chat.enabled (已移除且不再有效)

启用 MiniMax 对话模型。

true

spring.ai.model.chat

启用 MiniMax 对话模型。

minimax

spring.ai.minimax.chat.base-url

可选地覆盖 spring.ai.minimax.base-url 以提供对话特定的 URL

api.minimax.chat

spring.ai.minimax.chat.api-key

可选地覆盖 spring.ai.minimax.api-key 以提供对话特定的 api-key

-

spring.ai.minimax.chat.options.model

这是要使用的 MiniMax 对话模型

abab6.5g-chat (其中的 abab5.5-chat, abab5.5s-chat, abab6.5-chat, abab6.5g-chat, abab6.5t-chatabab6.5s-chat 指向最新的模型版本)

spring.ai.minimax.chat.options.maxTokens

在对话补全中生成的最大 token 数量。输入 token 和生成 token 的总长度受模型的上下文长度限制。

-

spring.ai.minimax.chat.options.temperature

用于控制生成补全的表观创造力的采样温度。值越高,输出越随机;值越低,结果越集中和确定。不建议在同一补全请求中同时修改 temperature 和 top_p,因为这两个设置的交互作用难以预测。

0.7

spring.ai.minimax.chat.options.topP

采样温度的替代方法,称为核采样(nucleus sampling),模型会考虑具有 top_p 概率质量的 token 的结果。例如,0.1 表示仅考虑概率质量排名前 10% 的 token。我们通常建议修改其中一个或 temperature,但不要同时修改两者。

1.0

spring.ai.minimax.chat.options.n

为每个输入消息生成多少个对话补全选项。请注意,您将根据所有选项生成的 token 总数付费。默认值为 1,不能大于 5。特别是当 temperature 非常小接近 0 时,我们只能返回 1 个结果。如果此时 n 已经设置且>1,服务将返回非法输入参数错误(invalid_request_error)

1

spring.ai.minimax.chat.options.presencePenalty

介于 -2.0 和 2.0 之间的数字。正值会根据新 token 是否已在文本中出现而对其进行惩罚,从而增加模型谈论新主题的可能性。

0.0f

spring.ai.minimax.chat.options.frequencyPenalty

介于 -2.0 和 2.0 之间的数字。正值会根据新 token 到目前为止在文本中的现有频率对其进行惩罚,从而降低模型重复相同行的可能性。

0.0f

spring.ai.minimax.chat.options.stop

模型将停止生成由 stop 指定的字符,目前仅支持 ["stop_word1"] 格式的单个停止词。

-

您可以为 ChatModel 实现覆盖通用的 spring.ai.minimax.base-urlspring.ai.minimax.api-key。如果设置了 spring.ai.minimax.chat.base-urlspring.ai.minimax.chat.api-key 属性,则它们优先于通用属性。如果您希望为不同的模型和不同的模型端点使用不同的 MiniMax 账户,这将非常有用。
所有以 spring.ai.minimax.chat.options 为前缀的属性都可以在运行时通过向 Prompt 调用添加请求特定的 运行时选项 进行覆盖。

运行时选项

MiniMaxChatOptions.java 提供了模型配置,例如要使用的模型、温度、频率惩罚等。

在启动时,可以通过 MiniMaxChatModel(api, options) 构造函数或 spring.ai.minimax.chat.options.* 属性配置默认选项。

在运行时,您可以通过向 Prompt 调用添加新的、特定于请求的选项来覆盖默认选项。例如,为特定请求覆盖默认模型和温度

ChatResponse response = chatModel.call(
    new Prompt(
        "Generate the names of 5 famous pirates.",
        MiniMaxChatOptions.builder()
            .model(MiniMaxApi.ChatModel.ABAB_6_5_S_Chat.getValue())
            .temperature(0.5)
        .build()
    ));
除了模型特定的 MiniMaxChatOptions,您还可以使用通过 ChatOptionsBuilder#builder() 创建的可移植 ChatOptions 实例。

示例 Controller

创建 一个新的 Spring Boot 项目,并将 spring-ai-starter-model-minimax 添加到您的 pom(或 gradle)依赖项中。

src/main/resources 目录下添加一个 application.properties 文件,以启用和配置 MiniMax 对话模型

spring.ai.minimax.api-key=YOUR_API_KEY
spring.ai.minimax.chat.options.model=abab6.5g-chat
spring.ai.minimax.chat.options.temperature=0.7
api-key 替换为您的 MiniMax 凭据。

这将创建一个 MiniMaxChatModel 实现,您可以将其注入到您的类中。这是一个简单的 @Controller 类使用对话模型生成文本的示例。

@RestController
public class ChatController {

    private final MiniMaxChatModel chatModel;

    @Autowired
    public ChatController(MiniMaxChatModel chatModel) {
        this.chatModel = chatModel;
    }

    @GetMapping("/ai/generate")
    public Map generate(@RequestParam(value = "message", defaultValue = "Tell me a joke") String message) {
        return Map.of("generation", this.chatModel.call(message));
    }

    @GetMapping("/ai/generateStream")
	public Flux<ChatResponse> generateStream(@RequestParam(value = "message", defaultValue = "Tell me a joke") String message) {
        var prompt = new Prompt(new UserMessage(message));
        return this.chatModel.stream(prompt);
    }
}

手动配置

MiniMaxChatModel 实现了 ChatModelStreamingChatModel 接口,并使用低层 MiniMaxApi 客户端连接到 MiniMax 服务。

spring-ai-minimax 依赖添加到项目的 Maven pom.xml 文件中

<dependency>
    <groupId>org.springframework.ai</groupId>
    <artifactId>spring-ai-minimax</artifactId>
</dependency>

或添加到您的 Gradle build.gradle 构建文件中。

dependencies {
    implementation 'org.springframework.ai:spring-ai-minimax'
}
请参考依赖管理部分,将 Spring AI BOM 添加到您的构建文件中。

接下来,创建一个 MiniMaxChatModel 并使用它生成文本

var miniMaxApi = new MiniMaxApi(System.getenv("MINIMAX_API_KEY"));

var chatModel = new MiniMaxChatModel(this.miniMaxApi, MiniMaxChatOptions.builder()
                .model(MiniMaxApi.ChatModel.ABAB_6_5_S_Chat.getValue())
                .temperature(0.4)
                .maxTokens(200)
                .build());

ChatResponse response = this.chatModel.call(
    new Prompt("Generate the names of 5 famous pirates."));

// Or with streaming responses
Flux<ChatResponse> streamResponse = this.chatModel.stream(
    new Prompt("Generate the names of 5 famous pirates."));

MiniMaxChatOptions 提供了对话请求的配置信息。MiniMaxChatOptions.Builder 是一个流式选项构建器。

低层 MiniMaxApi 客户端

MiniMaxApi 提供了一个轻量级的 MiniMax API Java 客户端。

以下是如何以编程方式使用该 API 的简单代码片段

MiniMaxApi miniMaxApi =
    new MiniMaxApi(System.getenv("MINIMAX_API_KEY"));

ChatCompletionMessage chatCompletionMessage =
    new ChatCompletionMessage("Hello world", Role.USER);

// Sync request
ResponseEntity<ChatCompletion> response = this.miniMaxApi.chatCompletionEntity(
    new ChatCompletionRequest(List.of(this.chatCompletionMessage), MiniMaxApi.ChatModel.ABAB_6_5_S_Chat.getValue(), 0.7f, false));

// Streaming request
Flux<ChatCompletionChunk> streamResponse = this.miniMaxApi.chatCompletionStream(
        new ChatCompletionRequest(List.of(this.chatCompletionMessage), MiniMaxApi.ChatModel.ABAB_6_5_S_Chat.getValue(), 0.7f, true));

有关更多信息,请参阅 MiniMaxApi.java 的 JavaDoc。

MiniMax 模型支持 Web 搜索功能。Web 搜索功能允许您搜索 Web 信息并在对话响应中返回结果。

有关 Web 搜索的更多信息,请参阅 MiniMax ChatCompletion

以下是如何使用 Web 搜索的简单代码片段

UserMessage userMessage = new UserMessage(
        "How many gold medals has the United States won in total at the 2024 Olympics?");

List<Message> messages = new ArrayList<>(List.of(this.userMessage));

List<MiniMaxApi.FunctionTool> functionTool = List.of(MiniMaxApi.FunctionTool.webSearchFunctionTool());

MiniMaxChatOptions options = MiniMaxChatOptions.builder()
    .model(MiniMaxApi.ChatModel.ABAB_6_5_S_Chat.value)
    .tools(this.functionTool)
    .build();


// Sync request
ChatResponse response = chatModel.call(new Prompt(this.messages, this.options));

// Streaming request
Flux<ChatResponse> streamResponse = chatModel.stream(new Prompt(this.messages, this.options));

MiniMaxApi 示例

  • MiniMaxApiIT.java 测试提供了一些关于如何使用该轻量级库的通用示例。

  • MiniMaxApiToolFunctionCallIT.java 测试展示了如何使用低层 API 调用工具函数。>