开始使用语义内核 C# 集成

在此页面上

背景
先决条件
设置环境
在 Atlas 中存储自定义数据。
创建 Atlas Vector Search 索引
运行向量搜索查询
回答有关数据的问题
后续步骤

注意

本教程使用语义内核 C# 库。有关使用 Python 库的教程，请参阅 Semantic Kernel Python 集成入门。

您可以将 Atlas Vector Search 与 Microsoft Semantic Kernel 集成构建 AI 应用程序并实施检索增强生成 (RAG)。本教程演示如何开始使用带有语义内核的Atlas Vector Search ，对数据执行语义Atlas Search并构建 RAG实施。具体来说，您执行以下操作：

设置环境。
在 Atlas 上存储自定义数据。
在您的数据上创建一个 Atlas Vector Search 索引。
对您的数据运行语义搜索查询。
使用 Atlas Vector Search 来回答有关数据的问题，从而实现 RAG。

背景

Semantic Kernel 是一个开源 SDK，可让您将各种 AI 服务和插件与您的应用程序相结合。您可以将语义内核用于各种 AI 使用案例，包括RAG 。

通过将 Atlas Vector Search 与语义内核集成，您可以将 Atlas 用作矢量数据库，并使用 Atlas Vector Search 通过从数据中检索语义相似的文档来实现 RAG。要了解有关 RAG 的更多信息，请参阅使用 Atlas Vector Search 进行检索增强生成 (RAG)。

先决条件

如要完成本教程，您必须具备以下条件：

一个 Atlas 帐户，而其集群运行着 MongoDB 版本 6.0.11、7.0.2 或更高版本（包括 RC）。确保您的 IP 地址包含在 Atlas 项目的访问列表中。如需了解详情，请参阅创建集群。
一个 OpenAI API 密钥。您必须拥有一个 OpenAI 账号，该账号具有可用于 API 请求的信用额度。要了解有关注册 OpenAI 账号的更多信息，请参阅 OpenAI API 网站。
用于运行 .NET 应用程序的终端和代码编辑器。
C#/.NET 已安装。

设置环境

您必须首先为本教程设置环境。要设置环境，请完成以下步骤。

创建您的 .NET 应用程序。

在终端中运行以下命令，创建一个名为 sk-mongodb 的新目录，并初始化应用程序：

mkdir sk-mongodb
cd sk-mongodb
dotnet new console

安装依赖项。

在终端中，运行以下命令以安装本教程的软件包。

dotnet add package Microsoft.SemanticKernel
dotnet add package Microsoft.SemanticKernel.Connectors.MongoDB --prerelease
dotnet add package Microsoft.SemanticKernel.Connectors.OpenAI
dotnet add package Microsoft.SemanticKernel.Memory
dotnet add package Microsoft.SemanticKernel.Plugins.Memory --prerelease

定义环境变量。

在终端中运行以下命令，将 Atlas 集群的 SRV 连接字符串和 OpenAI API 密钥添加到环境中。

export OPENAI_API_KEY="<Your OpenAI API Key>"
export ATLAS_CONNECTION_STRING="<Your MongoDB Atlas SRV Connection String>"

注意

连接字符串应使用以下格式：

mongodb+srv://<db_username>:<db_password>@<clusterName>.<hostname>.mongodb.net

在 Atlas 中存储自定义数据。

在本部分中，您将初始化内核，它是用于管理应用程序的服务和插件的主接口。通过内核，您可以配置 AI 服务，将 Atlas 实例化为向量数据库（也称为内存存储），并将自定义数据加载到 Atlas 集群。

将以下代码复制并粘贴到应用程序的 Program.cs 文件中。

此代码执行以下操作：

导入 Semantic Kernel 和所有必需的包。
通过从环境中检索 SRV 连接字符串，连接到 Atlas 集群。
从环境中检索 OpenAI API 密钥，并创建 OpenAI text-embedding-ada-002 嵌入模型的实例。
初始化 Kernel，然后将以下 AI 服务添加到 Kernel：
- OpenAI 的 gpt-3.5-turbo 作为聊天模型，用于为回答有关数据的问题部分生成响应。
将 Atlas 实例化为内存存储，指定以下参数：
- semantic_kernel_db.test 作为用于存储文档的集合。
- vector_index 作为用于查询内存存储的索引。
初始化一个名为 SemanticTextMemory的类，该类提供了一组原生方法，可帮助您在内存中存储和检索文本。
通过调用 PopulateMemoryAsync 方法在 semantic_kernel_db.test 集合中填充示例文档。

// Import Packages
using Microsoft.SemanticKernel;
using Microsoft.SemanticKernel.Connectors.MongoDB; 
using Microsoft.SemanticKernel.Connectors.OpenAI;
using Microsoft.SemanticKernel.Memory;
using Microsoft.SemanticKernel.Plugins.Memory;
# pragma warning disable SKEXP0010, SKEXP0020, SKEXP0001, SKEXP0050
class Program {
    static async Task Main(string[] args) {
        // Get connection string and OpenAI API Key
        var connectionString = Environment.GetEnvironmentVariable("ATLAS_CONNECTION_STRING");
        if (connectionString == null)
        {
            Console.WriteLine("You must set your 'ATLAS_CONNECTION_STRING' environment variable.");
            Environment.Exit(0);
        }
        var openAIKey = Environment.GetEnvironmentVariable("OPENAI_API_KEY");
        if (openAIKey == null)
        {
            Console.WriteLine("You must set your 'OPENAPI_KEY' environment variable.");
            Environment.Exit(0);
        }        
        
        // Create new OpenAI API Embedding Model 
        var embeddingGenerator = new OpenAITextEmbeddingGenerationService("text-embedding-ada-002", openAIKey);
        // Initialize Kernel
        IKernelBuilder builder = Kernel.CreateBuilder();
        // Add OpenAI Chat Completion to Kernel
        builder.AddOpenAIChatCompletion(
            modelId: "gpt-3.5-turbo",
            apiKey: openAIKey
        ); 
        Kernel kernel = builder.Build();
        // Instantiate Atlas as a memory store.
        MongoDBMemoryStore memoryStore = new(connectionString, "semantic_kernel_db", indexName: "vector_index"); 
        SemanticTextMemory textMemory = new(memoryStore, embeddingGenerator);
        // Populate memory with sample data
        async Task PopulateMemoryAsync(Kernel kernel) {
            await textMemory.SaveInformationAsync(collection: "test", text: "I am a developer", id: "1");
            await textMemory.SaveInformationAsync(collection: "test", text: "I started using MongoDB two years ago", id: "2");
            await textMemory.SaveInformationAsync(collection: "test", text: "I'm using MongoDB Vector Search with Semantic Kernel to implement RAG", id: "3");
            await textMemory.SaveInformationAsync(collection: "test", text: "I like coffee", id: "4");
            
        }
        await PopulateMemoryAsync(kernel);
    }
}

保存文件，然后运行以下命令将数据加载到 Atlas：

dotnet run

提示

运行示例代码后，您可以导航到您的集群中的semantic_kernel_db.test collection，在 Atlas 用户界面中查看向量嵌入。

创建 Atlas Vector Search 索引

要在向量存储上启用向量搜索查询，请在semantic_kernel_db.test集合上创建 Atlas Vector Search 索引。

必需的访问权限

要创建 Atlas Vector Search 索引，您必须对 Atlas 项目具有Project Data Access Admin或更高访问权限。

步骤

AtlasGoClusters在Atlas中，Go项目的页面。

如果尚未显示，请从导航栏上的 Organizations 菜单中选择包含所需项目的组织。
如果尚未显示，请从导航栏的Projects菜单中选择所需的项目。
如果尚未出现，请单击侧边栏中的 Clusters（集群）。
会显示集群页面。

转到集群的 Atlas Search 页面。

您可以从侧边栏、 Data Explorer 或集群详细信息页面转到 Atlas Search 页面。

在侧边栏中，单击 Services 标题下的 Atlas Search。
注意
如果没有集群，则请单击 Create cluster 来创建一个。要了解更多信息，请参阅创建集群。
从 Select data source 下拉菜单中选择您的集群并单击 Go to Atlas Search。
将显示 Atlas Search 页面。

单击集群的对应 Browse Collections 按钮。
展开数据库并选择集合。
单击该集合的 Search Indexes 标签页。
将显示 Atlas Search 页面。

单击集群的名称。
单击 Atlas Search 标签页。
将显示 Atlas Search 页面。

单击 Create Search Index（保存并关闭）。

开始您的索引配置。

在页面上进行以下选择，然后单击 Next。

Search Type	选择 Vector Search 索引类型。
Index Name and Data Source	指定以下信息： Index Name: `vector_index` Database and Collection: `semantic_kernel_db` database `test` 集合
Configuration Method	For a guided experience, select Visual Editor. To edit the raw index definition, select JSON Editor.

定义 Atlas Vector Search 索引。

此索引定义会将 embedding 字段索引为 vector 类型。embedding 字段包含使用 OpenAI 的 text-embedding-ada-002 嵌入式模型创建的嵌入。此索引定义指定了 1536 个向量维度，并使用 cosine 来衡量相似性。

Atlas会自动检测包含向量嵌入的字段及其对应的维度。对于 semantic_kernel_db.test 集合，embedding 字段会显示。

要配置此索引，请从 Similarity Method 下拉菜单中选择 Cosine。

在 JSON 编辑器中粘贴以下索引定义：

1 {
2    "fields": [
3       {
4          "type": "vector",
5          "path": "embedding",
6          "numDimensions": 1536,
7          "similarity": "cosine"
8       }
9    ]
10 }

单击 Next（下一步）以查看索引。

单击 Create Vector Search Index（保存并关闭）。

Atlas 会显示一个模态窗口，让您知道您的索引正在构建中。

通过单击 Close（关闭）按钮关闭 You're All Set!（一切就绪！）模态窗口。

检查状态。

新创建的索引会显示在 Atlas Search 标签页上。在构建索引期间，Status 字段显示为 Build in Progress。索引构建完成后，Status 字段将显示为 Active。

注意

较大的集合需要较长的索引时间。索引构建完成后，您将收到电子邮件通知。

运行向量搜索查询

Atlas构建索引后，您可以对数据运行向量Atlas Search查询。

在 Program.cs 文件的末尾，添加以下代码以对字符串 What is my job title? 执行基本语义搜索。它打印最相关的文档以及介于 0 和 1 之间的相关性分数。

1 var results = textMemory.SearchAsync(collection: "test", query: "What is my job title?");
2 
3 await foreach (var result in results) {
4    Console.WriteLine($"Answer: {result?.Metadata.Text}, {result?.Relevance}");
5 }
6 Console.WriteLine("Search completed.");

保存文件，然后运行以下命令以查看语义搜索的结果：

dotnet run

Answer: I am a developer, 0.8913083076477051
Search completed.

回答有关数据的问题

本节展示了使用 Atlas Vector Search 和 Semantic Kernel 的 RAG 实现示例。现在您已经使用 Atlas Vector Search 检索语义相似的文档，请将以下代码示例粘贴到 Program.cs 的末尾，以提示 LLM 根据这些文档回答问题。