Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

什么是人工智能？

Alexandra Klepper

人工智能 (AI) 涵盖了许多复杂的新兴技术，这些技术以前需要人工输入，现在可以由计算机执行。广义而言，AI 是一种非人类程序或模型，可展现广泛的问题解决能力和创造力。

AI 这个缩写词经常被互换使用，用来表示人工智能领域中的各种类型的技术，但这些技术的范围可能差异很大。

有许多定义人工智能和机器学习的术语和概念，您可能会觉得很有用。您可以在这里找到 Chrome 文档中常见的术语，尤其是与客户端 AI 相关的术语。

客户端 AI

虽然网络上的大多数 AI 功能都依赖于服务器，但客户端 AI 在用户浏览器中运行，并在用户设备上执行推理。这具有诸多优势，包括缩短延迟时间、降低创建功能的成本、提高用户隐私保护水平以及支持离线访问。

客户端 AI 依赖于经过优化的较小模型，这些模型针对性能进行了优化。对于特定任务，此类模型的性能可能优于较大的服务器端模型。评估您的使用情形，以确定哪种解决方案适合您。

内置 AI

内置 AI 是一种客户端 AI，其中较小的模型内置于浏览器中。对于 Chrome，这包括 Gemini Nano 和专家级模型。下载这些模型后，所有使用内置 AI 的网站和 Web 应用都可以跳过下载时间，直接执行功能和本地推理。

内置 AI API 旨在针对适合任务的模型类型运行推理。例如，Prompt API 针对语言模型运行推理，而 Translator API 针对内置的专家模型运行推理。

服务器端 AI

服务器端 AI 涵盖基于云的 AI 服务。将 Gemini 1.5 Pro 视为在云端运行。这些模型往往更大、更强大。对于大语言模型来说，这一点尤其重要。

混合 AI

混合 AI 是指包含客户端和服务器组件的任何解决方案。例如：

客户端模型，可回退到服务器端模型，专为无法在设备上有效完成的任务而构建。
- 设备上可能缺少资源。
- 相应模型或 API 仅在特定环境中提供。
一种在客户端和服务器之间进行模型拆分以实现安全性的模型。
- 例如，您可以拆分模型，使 75% 的执行在客户端进行，而剩余的 25% 在服务器上进行。这不仅能带来客户端优势，还能让部分模型在设备外运行，从而保持私密性。

如果您使用 Prompt API，可以设置采用 Firebase AI Logic 的混合架构。

生成式 AI

生成式 AI 是一种机器学习技术，可帮助用户创建熟悉的内容，并模仿人类的创作方式。生成式 AI 使用语言模型来整理数据，并根据提供的上下文创建或修改文本、图片、视频和音频。生成式 AI 不仅能进行模式匹配和预测，

大语言模型 (LLM) 具有大量（多达数十亿）参数，可用于执行各种任务，例如生成、分类或总结文本或图片。

小型语言模型 (SLM) 的参数数量明显更少，但可以执行类似的任务，并且可能可在客户端使用。

自然语言处理 (NLP)

自然语言处理是一类机器学习技术，专注于帮助计算机理解人类语言，从任何特定语言的规则到个人使用的特有表达方式、方言和俚语。

代理或 AI 代理

智能体是一种软件，它会自主规划和执行一系列操作，以代表用户完成任务，同时适应环境变化。操作可能包括在网页上或通过第三方应用（例如 Project Mariner）执行的 API 函数或数据库查询。

聊天机器人本身并不是代理。聊天机器人会响应消息传递者（无论是人类还是其他实体），并依靠模型生成内容，例如问题的答案；而智能体则会与工具或数据库互动来完成任务。

输入和输出

模型输入和输出可以采用不同的模态，包括文本、图片、音频和视频。模型可以仅接受一种模态，也可以接受多种模态（多模态模型）。在选择模型之前，请务必确认您需要哪些模态。

输入和输出可以以流式传输块或基于请求的方式发送和接收。

流式

流式传输会将您发送或接收的资源分解为较小的块，从而实时提供结果。随着输入内容添加和调整，输出内容也会不断调整。

这是浏览器在接收媒体资源时使用的常见技术，例如视频缓冲或部分加载图片。

基于请求的输出

对于基于请求的输出（或“非流式”），模型会等待生成整个输入，将该输入作为一个整体进行处理，然后生成输出。

例如，在聊天窗口的上下文中，模型不会在用户输入时构建回答，而是会等到用户点击“发送”按钮。发送消息后，模型会考虑所有输入内容，然后做出回答。

其他资源

如果您是刚开始接触 Web AI，请查看我们的 web.dev AI 资源合集。

什么是人工智能？ 使用集合让一切井井有条 根据您的偏好保存内容并对其进行分类。