Cohere 嵌入

提供了 Bedrock Cohere 嵌入模型。将生成式 AI 能力集成到关键应用程序和工作流程中,以改善业务成果。

AWS Bedrock Cohere 模型页面Amazon Bedrock 用户指南包含如何使用 AWS 托管模型的详细信息。

先决条件

参考Spring AI 关于 Amazon Bedrock 的文档,以设置 API 访问。

添加仓库和 BOM

Spring AI 的构件发布在 Maven Central 和 Spring Snapshot 仓库中。参考仓库部分,将这些仓库添加到您的构建系统中。

为了帮助依赖管理,Spring AI 提供了一个 BOM(物料清单)以确保整个项目中使用的 Spring AI 版本一致。参考依赖管理部分,将 Spring AI BOM 添加到您的构建系统中。

自动配置

Spring AI 自动配置、starter 模块的构件名称发生了重大变化。请参考升级说明获取更多信息。

spring-ai-starter-model-bedrock 依赖添加到项目的 Maven pom.xml 文件中

<dependency>
  <groupId>org.springframework.ai</groupId>
  <artifactId>spring-ai-starter-model-bedrock</artifactId>
</dependency>

或添加到您的 Gradle build.gradle 构建文件中。

dependencies {
    implementation 'org.springframework.ai:spring-ai-starter-model-bedrock'
}
参考依赖管理部分,将 Spring AI BOM 添加到您的构建文件中。

启用 Cohere 嵌入支持

默认情况下 Cohere 模型是禁用的。要启用它,请将 spring.ai.model.embedding 属性设置为 bedrock-cohere。导出环境变量是设置此配置属性的一种方法

export SPRING_AI_MODEL_EMBEDDING=bedrock-cohere

嵌入属性

spring.ai.bedrock.aws 前缀是用于配置连接到 AWS Bedrock 的属性前缀。

属性 描述 默认值

spring.ai.bedrock.aws.region

要使用的 AWS 区域。

us-east-1

spring.ai.bedrock.aws.access-key

AWS 访问密钥。

-

spring.ai.bedrock.aws.secret-key

AWS 秘密密钥。

-

嵌入自动配置的启用和禁用现在通过前缀为 spring.ai.model.embedding 的顶层属性进行配置。

要启用,设置 spring.ai.model.embedding=bedrock-cohere(默认已启用)

要禁用,设置 spring.ai.model.embedding=none(或任何不匹配 bedrock-cohere 的值)

进行此更改是为了允许配置多个模型。

spring.ai.bedrock.cohere.embedding 前缀(在 BedrockCohereEmbeddingProperties 中定义)是用于配置 Cohere 嵌入模型实现的属性前缀。

属性

描述

默认值

spring.ai.model.embedding

启用或禁用对 Cohere 的支持

bedrock-cohere

spring.ai.bedrock.cohere.embedding.enabled(已移除且不再有效)

启用或禁用对 Cohere 的支持

false

spring.ai.bedrock.cohere.embedding.model

要使用的模型 ID。请参阅CohereEmbeddingModel 了解支持的模型。

cohere.embed-multilingual-v3

spring.ai.bedrock.cohere.embedding.options.input-type

在每种类型前添加特殊标记以区分它们。您不应混合使用不同类型,除非是用于搜索和检索的情况。在这种情况下,请使用 search_document 类型嵌入您的语料库,并使用 search_query 类型嵌入查询。

SEARCH_DOCUMENT

spring.ai.bedrock.cohere.embedding.options.truncate

指定 API 如何处理长于最大令牌长度的输入。如果指定 LEFT 或 RIGHT,模型会丢弃输入直到剩余输入的长度正好等于模型的最大输入令牌长度。

NONE

通过 Amazon Bedrock 访问 Cohere 时,截断功能不可用。这是 Amazon Bedrock 的一个问题。Spring AI 类 BedrockCohereEmbeddingModel 将截断到 2048 个字符长度,这是该模型支持的最大长度。

查看CohereEmbeddingModel 了解其他模型 ID。支持的值有:cohere.embed-multilingual-v3cohere.embed-english-v3。模型 ID 值也可以在AWS Bedrock 文档中找到,用于基本模型 ID。

所有以 spring.ai.bedrock.cohere.embedding.options 为前缀的属性可以通过在 EmbeddingRequest 调用中添加特定于请求的运行时选项来在运行时覆盖。

运行时选项

BedrockCohereEmbeddingOptions.java 提供了模型配置,例如 input-typetruncate

在启动时,默认选项可以通过 BedrockCohereEmbeddingModel(api, options) 构造函数或 spring.ai.bedrock.cohere.embedding.options.* 属性进行配置。

在运行时,您可以通过向 EmbeddingRequest 调用添加新的、特定于请求的选项来覆盖默认选项。例如,为特定请求覆盖默认输入类型

EmbeddingResponse embeddingResponse = embeddingModel.call(
    new EmbeddingRequest(List.of("Hello World", "World is big and salvation is near"),
        BedrockCohereEmbeddingOptions.builder()
        	.withInputType(InputType.SEARCH_DOCUMENT)
        .build()));

示例控制器

创建一个新的 Spring Boot 项目,并将 spring-ai-starter-model-bedrock 添加到您的 pom(或 gradle)依赖项中。

src/main/resources 目录下添加 application.properties 文件,以启用和配置 Cohere 嵌入模型

spring.ai.bedrock.aws.region=eu-central-1
spring.ai.bedrock.aws.access-key=${AWS_ACCESS_KEY_ID}
spring.ai.bedrock.aws.secret-key=${AWS_SECRET_ACCESS_KEY}

spring.ai.model.embedding=bedrock-cohere
spring.ai.bedrock.cohere.embedding.options.input-type=search-document
regionsaccess-keysecret-key 替换为您的 AWS 凭据。

这将创建一个 BedrockCohereEmbeddingModel 实现,您可以将其注入到您的类中。这是一个使用聊天模型生成文本的简单 @Controller 类示例。

@RestController
public class EmbeddingController {

    private final EmbeddingModel embeddingModel;

    @Autowired
    public EmbeddingController(EmbeddingModel embeddingModel) {
        this.embeddingModel = embeddingModel;
    }

    @GetMapping("/ai/embedding")
    public Map embed(@RequestParam(value = "message", defaultValue = "Tell me a joke") String message) {
        EmbeddingResponse embeddingResponse = this.embeddingModel.embedForResponse(List.of(message));
        return Map.of("embedding", embeddingResponse);
    }
}

手动配置

BedrockCohereEmbeddingModel 实现了 EmbeddingModel 接口,并使用低级别 CohereEmbeddingBedrockApi 客户端连接到 Bedrock Cohere 服务。

spring-ai-bedrock 依赖添加到项目的 Maven pom.xml 文件中

<dependency>
    <groupId>org.springframework.ai</groupId>
    <artifactId>spring-ai-bedrock</artifactId>
</dependency>

或添加到您的 Gradle build.gradle 构建文件中。

dependencies {
    implementation 'org.springframework.ai:spring-ai-bedrock'
}
参考依赖管理部分,将 Spring AI BOM 添加到您的构建文件中。

接下来,创建一个 BedrockCohereEmbeddingModel 并使用它进行文本嵌入

var cohereEmbeddingApi =new CohereEmbeddingBedrockApi(
		CohereEmbeddingModel.COHERE_EMBED_MULTILINGUAL_V1.id(),
		EnvironmentVariableCredentialsProvider.create(), Region.US_EAST_1.id(), new ObjectMapper());


var embeddingModel = new BedrockCohereEmbeddingModel(this.cohereEmbeddingApi);

EmbeddingResponse embeddingResponse = this.embeddingModel
	.embedForResponse(List.of("Hello World", "World is big and salvation is near"));

低级别 CohereEmbeddingBedrockApi 客户端

CohereEmbeddingBedrockApi 提供了一个轻量级的 Java 客户端,基于 AWS Bedrock Cohere Command 模型

以下类图说明了 CohereEmbeddingBedrockApi 接口和构建块

bedrock cohere embedding low level api

CohereEmbeddingBedrockApi 支持 cohere.embed-english-v3cohere.embed-multilingual-v3 模型,用于单个和批量嵌入计算。

这是一个如何以编程方式使用该 API 的简单代码片段

CohereEmbeddingBedrockApi api = new CohereEmbeddingBedrockApi(
		CohereEmbeddingModel.COHERE_EMBED_MULTILINGUAL_V1.id(),
		EnvironmentVariableCredentialsProvider.create(),
		Region.US_EAST_1.id(), new ObjectMapper());

CohereEmbeddingRequest request = new CohereEmbeddingRequest(
		List.of("I like to eat apples", "I like to eat oranges"),
		CohereEmbeddingRequest.InputType.search_document,
		CohereEmbeddingRequest.Truncate.NONE);

CohereEmbeddingResponse response = this.api.embedding(this.request);