什么是人工智能?

人工智能 (AI) 涵盖了许多复杂的新兴技术,这些技术过去需要人工输入,现在可以由计算机执行。广义而言,AI 是一种非人类程序或模型,可展现广泛的问题解决能力和创造力。

AI 这个缩写词经常被互换使用,用来表示人工智能领域中的各种类型的技术,但这些技术的范围可能差异很大。

有许多定义人工智能和机器学习的术语和概念,您可能会觉得很有用。您可以在这里找到 Chrome 文档中常见的术语,最重要的是与客户端 AI 相关的术语。

客户端 AI

虽然网络上的大多数 AI 功能都依赖于服务器,但客户端 AI 在用户浏览器中运行,并在用户设备上执行推理。这具有诸多优势,包括缩短延迟时间、降低创建功能的成本、提高用户隐私保护水平以及支持离线访问。

客户端 AI 依赖于经过优化的较小模型,这些模型针对性能进行了优化。对于特定任务,此类模型的性能可能优于较大的服务器端模型。评估您的使用场景,确定适合您的解决方案。

内置 AI

借助内置 AI,您的网站可与浏览器 API 连接到本地处理器。浏览器内置模型会发送响应,然后 API 会将该响应返回给您的网站。

内置 AI 是一种客户端 AI,其中较小的模型内置于浏览器中。对于 Chrome,这包括 Gemini Nano 和专家级模型。下载这些模型后,所有使用内置 AI 的网站和 Web 应用都可以跳过下载时间,直接执行功能和进行本地推理。

内置 AI API 旨在针对任务运行推理,并使用合适的模型类型。例如,Prompt API 对 LLM 运行推理,而 Translator API 对内置的专家模型运行推理。

服务器端 AI

服务器端 AI 涵盖基于云的 AI 服务。将 Gemini 1.5 Pro 视为在云端运行。这些模型往往更大、更强大。对于大语言模型来说,这一点尤其重要。

混合 AI

混合 AI 是指包含客户端和服务器组件的任何解决方案。例如:

  • 具有回退到服务器端模型的客户端模型,专为无法在设备上有效完成的任务而构建。
    • 设备上可能缺少资源。
    • 相应模型或 API 仅在某些环境中可用。
  • 一种在客户端和服务器之间进行模型拆分以实现安全性的方法。
    • 例如,您可以拆分模型,使 75% 的执行在客户端进行,而剩余的 25% 在服务器上进行。这不仅能带来客户端优势,还能让部分模型在设备外运行,从而保持私密性。

如果您使用 Prompt API,可以设置采用 Firebase AI Logic 的混合架构。

生成式 AI

生成式 AI 是一种机器学习技术,可帮助用户创建熟悉的内容,并模仿人类的创作方式。 生成式 AI 使用大语言模型来整理数据,并根据提供的上下文创建或修改文本、图片、视频和音频。生成式 AI 不仅能进行模式匹配和预测。

大语言模型 (LLM) 具有大量(通常为数十亿)参数,可用于执行各种任务,例如生成、分类或总结文本或图片。

自然语言处理 (NLP)

自然语言处理是一类机器学习技术,专注于帮助计算机理解人类语言,从任何特定语言的规则到个人使用的特有表达方式、方言和俚语。

代理或 AI 代理

代理是一种软件,它能够自主规划和执行一系列操作,代表用户完成任务,同时适应环境变化。操作可能包括在网页上或通过第三方应用(例如 Project Mariner)执行的 API 函数或数据库查询。

聊天机器人本身并不是代理。聊天机器人会响应消息传递者(无论是人类还是其他实体),并依靠模型生成内容(例如问题的答案),而代理会与工具或数据库互动来完成任务。

其他资源

如果您是刚开始接触 Web AI,请查看我们的 web.dev AI 资源合集