人工智能 (AI) 涵盖了许多复杂的新兴技术,这些技术过去需要人工输入,现在可以由计算机执行。广义而言,AI 是一种非人类程序或模型,可展现广泛的问题解决能力和创造力。
AI 这个缩写词经常被互换使用,用来表示人工智能领域中的各种类型的技术,但这些技术的范围可能差异很大。
有许多定义人工智能和机器学习的术语和概念,您可能会觉得很有用。您可以在这里找到 Chrome 文档中常见的术语,最重要的是与客户端 AI 相关的术语。
客户端 AI
虽然网络上的大多数 AI 功能都依赖于服务器,但客户端 AI 在用户浏览器中运行,并在用户设备上执行推理。这具有诸多优势,包括缩短延迟时间、降低创建功能的成本、提高用户隐私保护水平以及支持离线访问。
客户端 AI 依赖于经过优化的较小模型,这些模型针对性能进行了优化。对于特定任务,此类模型的性能可能优于较大的服务器端模型。评估您的使用场景,确定适合您的解决方案。
内置 AI

内置 AI 是一种客户端 AI,其中较小的模型内置于浏览器中。对于 Chrome,这包括 Gemini Nano 和专家级模型。下载这些模型后,所有使用内置 AI 的网站和 Web 应用都可以跳过下载时间,直接执行功能和进行本地推理。
内置 AI API 旨在针对任务运行推理,并使用合适的模型类型。例如,Prompt API 对 LLM 运行推理,而 Translator API 对内置的专家模型运行推理。
服务器端 AI
服务器端 AI 涵盖基于云的 AI 服务。将 Gemini 1.5 Pro 视为在云端运行。这些模型往往更大、更强大。对于大语言模型来说,这一点尤其重要。
混合 AI
混合 AI 是指包含客户端和服务器组件的任何解决方案。例如:
- 具有回退到服务器端模型的客户端模型,专为无法在设备上有效完成的任务而构建。
- 设备上可能缺少资源。
- 相应模型或 API 仅在某些环境中可用。
- 一种在客户端和服务器之间进行模型拆分以实现安全性的方法。
- 例如,您可以拆分模型,使 75% 的执行在客户端进行,而剩余的 25% 在服务器上进行。这不仅能带来客户端优势,还能让部分模型在设备外运行,从而保持私密性。
如果您使用 Prompt API,可以设置采用 Firebase AI Logic 的混合架构。
生成式 AI
生成式 AI 是一种机器学习技术,可帮助用户创建熟悉的内容,并模仿人类的创作方式。 生成式 AI 使用大语言模型来整理数据,并根据提供的上下文创建或修改文本、图片、视频和音频。生成式 AI 不仅能进行模式匹配和预测。
大语言模型 (LLM) 具有大量(通常为数十亿)参数,可用于执行各种任务,例如生成、分类或总结文本或图片。
自然语言处理 (NLP)
自然语言处理是一类机器学习技术,专注于帮助计算机理解人类语言,从任何特定语言的规则到个人使用的特有表达方式、方言和俚语。
代理或 AI 代理
代理是一种软件,它能够自主规划和执行一系列操作,代表用户完成任务,同时适应环境变化。操作可能包括在网页上或通过第三方应用(例如 Project Mariner)执行的 API 函数或数据库查询。
聊天机器人本身并不是代理。聊天机器人会响应消息传递者(无论是人类还是其他实体),并依靠模型生成内容(例如问题的答案),而代理会与工具或数据库互动来完成任务。
其他资源
如果您是刚开始接触 Web AI,请查看我们的 web.dev AI 资源合集。