View in English

  • Apple 开发者
    • 入门汇总

    探索“入门汇总”

    • 概览
    • 学习
    • Apple Developer Program

    及时了解最新动态

    • 最新动态
    • 开发者你好
    • 平台

    探索“平台”

    • Apple 平台
    • iOS
    • iPadOS
    • macOS
    • Apple tvOS
    • visionOS
    • watchOS
    • App Store

    精选

    • 设计
    • 分发
    • 游戏
    • 配件
    • 网页
    • Home
    • CarPlay 车载
    • 技术

    探索“技术”

    • 概览
    • Xcode
    • Swift
    • SwiftUI

    精选

    • 辅助功能
    • App Intents
    • Apple 智能
    • 游戏
    • 机器学习与 AI
    • 安全性
    • Xcode Cloud
    • 社区

    探索“社区”

    • 概览
    • “与 Apple 会面交流”活动
    • 社区主导的活动
    • 开发者论坛
    • 开源

    精选

    • WWDC
    • Swift Student Challenge
    • 开发者故事
    • App Store 大奖
    • Apple 设计大奖
    • Apple Developer Centers
    • 文档

    探索“文档”

    • 文档库
    • 技术概述
    • 示例代码
    • 《人机界面指南》
    • 视频

    发布说明

    • 精选更新
    • iOS
    • iPadOS
    • macOS
    • watchOS
    • visionOS
    • Apple tvOS
    • Xcode
    • 下载

    探索“下载”

    • 所有下载
    • 操作系统
    • 应用程序
    • 设计资源

    精选

    • Xcode
    • TestFlight
    • 字体
    • SF Symbols
    • Icon Composer
    • 支持

    探索“支持”

    • 概览
    • 帮助指南
    • 开发者论坛
    • “反馈助理”
    • 联系我们

    精选

    • 《开发者账户帮助》
    • 《App 审核指南》
    • 《App Store Connect 帮助》
    • 即将实行的要求
    • 协议和准则
    • 系统状态
  • 快速链接

    • 活动
    • 新闻
    • 论坛
    • 示例代码
    • 视频
 

视频

打开菜单 关闭菜单
  • 专题
  • 所有视频
  • 关于

返回 WWDC26

  • 简介
  • 概要
  • 转写文稿
  • 代码
  • 利用 Core AI 将设备端 AI 模型整合到你的 App 中

    探索一系列精选的热门开源模型 (包括 Qwen、Mistral、SAM3 等),这些模型已针对 Apple 芯片使用全新 Core AI 框架进行了优化。了解如何将模型下载到 Mac 上运行并进行基准测试,然后只用几行代码将模型整合到你的 App 中。探索模型编译和设备端定制的全新工作流程,从而加快首次模型加载速度。了解如何使用 Xcode 中的 Core AI 工具来分析和优化运行时性能。

    章节

    • 0:00 - Introduction
    • 1:16 - App concept: camera-based vocab learning
    • 2:52 - Model discovery
    • 7:40 - Getting models with the Core AI models repository
    • 8:37 - Integration
    • 10:55 - Writing the Swift integration code
    • 13:05 - Diagnosing model specialization latency
    • 14:40 - Deployment
    • 17:00 - Ahead-of-time (AOT) compilation
    • 18:03 - iOS demo
    • 19:57 - Multiplatform
    • 23:06 - Next steps

    资源

    • Core AI PyTorch Extensions
    • Core AI Python
    • Core AI Optimization
    • Core AI
    • Compiling Core AI models ahead of time
      • 高清视频
      • 标清视频

    相关视频

    WWDC26

    • 使用 MLX 在 Mac 上本地运行 AI 智能体
    • 使用 MLX 探索 Swift 中的数值计算
    • 使用 MLX 探索分布式推理和训练
  • 搜索此视频…

    大家好 欢迎! 我是Carina 来自Core AI团队 今天 让我们一起探索 设备端智能的世界

    在这次演讲中 我将介绍如何使用Core AI 为你的App添加激动人心的新功能

    我将展示如何构建 一款语言学习App 它使用视觉Transformer模型 以及大型语言模型 协同工作 完全在设备端运行

    Core AI是一套全新技术 让你直接将先进的设备端 AI能力集成到App中

    使用Core AI 你可以构建App体验 让用户数据 永远不离开设备 无需管理服务器 无需按令牌付费 也没有云端延迟 如果还没看过 请查阅"Meet Core AI" 你将了解框架背后的核心理念 和设计哲学 以及API的最佳使用方式

    先从简单的开始 我正在开发一款iOS App 帮助学生学习新语言词汇 从普通话开始

    我有一套手工整理的单词卡片 包含单词 翻译 和使用示例 但这很难规模化 需要将所有内容 静态嵌入App中

    我想在App中引入AI 那该多酷啊 如果学生能把摄像头 对准花园里的某样东西 或街道上的某个物体 只需让App 把它从场景中提取出来 然后生成一张 目标语言的单词卡 任何精心整理的卡片组 都跟不上好奇的学生 但摄像头加设备端模型可以

    每张卡片都来自 他们的日常生活 随时随地学习 卡片集随他们一起成长 这一切都在设备端本地运行

    我将首先确定 能为这一体验提供支持的模型 然后编写代码 在App中使用这些模型 接下来 我将探讨 模型部署的实际注意事项 最后 我将构建macOS版本 来扩展这个想法 复用相同代码并借助 更大模型解锁新功能 先来看模型发现

    首先 我需要定义 App的核心功能

    从图片开始 以及用户关于 想学习内容的提示

    根据输入 App需要高亮显示 并从图像中提取 用户请求的内容

    这张分割后的图像 成为卡片上的图形

    根据母语文字输入 App将推断词义 并生成所有词汇信息 翻译 目标语言中 自然的使用示例 以及该用法的英文含义

    基于以上考虑 我的用例 有三个要求 第一是内容 这款App面向真实世界学习 需要应对厨房 街道 和办公室等场景

    第二是语言 模型架构需要从一开始 就支持多种语言

    初始版本 我将聚焦普通话

    第三是设备限制 所有内容在iPhone上 设备端运行 需要控制存储 和内存占用

    这意味着需要 谨慎考虑模型大小 以及部署多少个模型

    我探索了几个方向 查阅了模型文档 运行了一些原型 并与AI助手交流了想法

    结论很明确 将问题分解为 两个小型模型

    第一个是专用视觉模型 负责图像分割

    第二个是多语言 大型语言模型 接收英文标签 生成词汇 翻译 和示例句子

    为何在设备端使用两个模型? 专用于特定任务的模型 质量更好 体积更小 且可 独立升级

    我的目标是每个模型 参数量低于十亿 从而将设备端总占用 控制在可管理范围内

    对于图像分割 我关注SAM 3 即Segment Anything Model 3 SAM 3是基于视觉Transformer 的可提示图像分割模型 这是一个强大的模型 完全满足App的需求

    学生将摄像头对准某物 SAM 3会根据提示 精准隔离该物体 为卡片图形提供 清晰的抠图 提示可为语言模型 提供英文标签

    对于语言模型 流程很简单 输入英文标签 如"Hummingbird" 模型生成目标语言 的词汇信息 所以我需要四样东西 多语言 准确处理翻译 推理能力 获得 具有上下文的示例句子 结构化输出 可靠填充类型字段 紧凑 与视觉模型一起 适配设备端

    许多开源语言模型 具有强大的推理能力 在这个规模范围内 我做了一些快速测试 Qwen脱颖而出 它支持一百一十九种 语言和方言 且是一个推理模型 能生成上下文示例 而不仅仅是翻译 是词汇卡片生成的 绝佳起点

    甚至有一个6亿参数 版本的模型 应该非常适合我的App 我在HuggingFace和GitHub上 找到了这些模型及其文档 那么下一个问题是 如何使用Core AI 将它们引入App?

    一种方法是直接从 PyTorch格式转换它们 使用Core AI PyTorch 扩展包

    也可以使用Core AI优化包 进行模型压缩 如需深入了解这一流程 请查阅"Dive into Core AI model authoring and optimization" 其中甚至展示了 如何转换SAM 3模型!

    Core AI拥有强大的 模型优化工具 转换甚至直接创作功能 然而 对于许多热门模型 还有另一种方法

    Core AI Models代码库 是绝佳的参考资源 其中包含许多热门模型 以及各自的转换脚本 可生成Core AI格式的 优化版模型 以及可选的平台特定变体 一起来看Core AI models代码库

    models/是模型目录 浏览可用模型 找到目标模型 并按照导出说明操作 python/提供可复用的 导出基础工具和实用程序

    我在这里找到了SAM 3 和Qwen系列模型 按照导出说明 获取了Core AI模型

    现在来聊聊集成

    模型导出后 在Finder中 可以看到这些.aimodel文件

    来看看SAM3模型的内部

    在Xcode中可以检查 模型的所有信息 可以看到它是623 MB 对于我的用例 目标平台 为iOS 27.0和macOS 27.0 你可以找到 关于模型的有用信息 如大小 元数据等等

    点击Functions标签 可以看到模型的接口 实际上它暴露了 三个独立的函数 比如 来看imageEncode函数

    输入不只是一张图片 而是具有特定形状 和数据类型的张量 输出是密集特征嵌入

    另一个函数是detect 它接收图像特征 加上文本提示 输出原始蒙版 边界框 和置信度分数 要直接使用这个模型 需要编写所有预处理代码 将相机帧转换为正确格式 以及所有后处理代码 将原始张量转化为有意义的结果

    Core AI Models代码库 可帮我处理模型专属的预处理 以及后处理任务

    除了模型和Python转换工具 代码库还托管了一个Swift包 提供一组运行时库 这些库封装了 输入端文本编码等操作 以及输出端的 蒙版提取和标注 无需处理张量形状 只需调用简洁的Swift API

    我已经克隆了代码库 可以轻松添加coreai-models 作为项目依赖 进行尝试

    将coreai-models URL 添加为Swift Package后 可以选择CoreAILM 和CoreAISegmentation 添加到App目标 就这么简单

    来看将这两个模型 集成到App的代码

    CoreAIImageSegmenter导入了 图像分割库 提供SAM 3模型功能 允许我们从磁盘 加载SAM 3模型 然后根据输入文本提示 执行文本提示分割 例如"flower"

    最后提取最佳分割蒙版

    接下来是语言模型 加载只需一行代码 创建CoreAILanguageModel 并指向模型包 即可就绪 一行代码 — 资源加载 引擎创建 分词器配置 — 全都为你封装好了

    注意这里导入了FoundationModels 这是你可能已经熟悉的 同一个框架

    精彩的部分来了 要使用它 只需创建 一个LanguageModelSession 这与访问Apple设备端 大型语言模型使用的是同一套API 区别在于现在可以 传入自己的模型来使用 相同的session.respond调用 相同的流式支持 相同的结构化输出能力 你获得了Foundation Models API的人机工程学体验 同时可以灵活选择 底层运行的模型

    我们还支持引导生成 这对我们的用例很重要 不让模型生成自由格式文本 而是提供一个@Generable宏 精确描述 词汇卡片的结构 单词字段 翻译字段 和示例句子字段

    来看实际效果 我来拍一张照片…… 正在等待中 分割还没有返回结果 无法进行卡片生成 这里明显有些慢

    从代码中我知道 出现这个加载指示器 是在首次实例化SAM 3模型 并发送提示时 来看看发生了什么

    我用新的Core AI Instruments 进行了追踪 果然 就在那个时间点 有一个模型加载事件 其中有一个大型专项化子事件

    专项化是一个过程 用于准备Core AI模型 在设备端执行 加载模型时 系统会检查 是否已完成专项化并缓存 对于非常大的模型 这个过程可能耗时较长 这就是我们在 Instruments追踪中看到的情况

    之后的加载来自缓存 速度很快 但第一次加载 是我需要提前规划的

    让它发生在 用户体验过程中…… 可能不太好 那应该在什么时候进行? 可以在启动时触发 或在后台运行 但如果用户还没对 这个功能感兴趣 感觉有些浪费

    我认为更好的方法是 创建一个专门的首次运行体验 将这项工作安排在 用户首次了解该功能时进行 从而将模型加载 和专项化排除在 交互流程之外

    不过在做这个改变之前 我想先退一步 更全面地思考 这个功能的部署策略

    有几件事我想做好 这是作为现有App的 更新版本发布的 我希望这个功能可以被发现 但不是必须的 尝试它的用户 应该有良好的体验 不尝试的用户对App的感受 应该和以前一样好

    我的首次运行体验 提供了自然介绍功能的场所 并为顺畅的首次启动做好准备 但我一直假设模型 会直接打包进App

    检查后发现它们 会使下载量增加超过1 GB 这会影响所有更新的用户 甚至包括从不使用该功能的用户

    所以我将在功能介绍页面 添加一个按钮 仅在触发时下载模型 如果用户真正想要尝试的话 我将使用Background Assets实现这一点 如果你想深入了解详情 请查阅"Discover Apple-Hosted Background Assets" 来自去年的WWDC

    来看看它的实际效果

    当用户表示 想尝试这个功能时 我请求模型资源 并显示下载进度

    完成后 启动专项化

    专项化不再打断 主要体验

    但仍然需要一段时间 这对用户体验来说 是一段有些尴尬的等待时间

    好在Core AI有一个很棒的功能 可以帮助解决这个问题

    在专项化过程中 模型经历两个主要转换 首先经过一系列 核心编译步骤

    其次 生成可执行的产物

    这些产物与生成时的 设备和系统版本绑定

    这两个步骤中 编译是最耗资源的 也最耗时

    Core AI工具链允许我 提前进行部分编译 在我的开发机器上 生成模型的已编译版本

    虽然已编译的模型 仍需专项化 以适配用户的特定设备 但需要做的工作少得多 完成速度也快得多

    这通过coreai-build命令完成 你提供一个模型作为输入 根据你的选项 它生成一个或多个 针对特定设备架构的已编译模型

    我对模型执行了此操作 并为每个已编译模型创建了后台资源 我在App中添加了少量代码 用于检测 运行设备的架构 然后据此请求 相应的资源

    你可以找到所有详情 见developer.apple.com上的 "Compiling Core AI models ahead of time"文章

    我已经集成了这一功能 现在超前编译已经完成 我桌上有一些 从旅行中收集的石头 来看实际效果

    现在模型准备步骤 应该只需之前的一小部分时间 用户可以快速开始

    模型给出了一个使用示例

    我可以将它保存到我的收藏中

    来试试更多物体 这里有一块来自大学室友赠送的木头 还有一朵来自我妹妹的向日葵

    这些对我来说 都是有意义的物品 我想在学新语言的过程中 记录它们

    在后续推理时 我们使用缓存的模型资源 因此用户体验是无缝的

    我自己也非常喜欢这个功能 我认为它可以大幅简化 构建更多精选卡片集的工作 比逐个手动输入容易多了 问题是 我大多数内容 都是在Mac上创建的 所以…… 如果把它带到那里去呢? 来聊聊多平台吧

    这是我们目前在iOS上构建的内容 SAM3负责分割 Qwen 0.6B模型 生成词汇卡片 使用Core AI 我可以 复用所有相同代码 直接在Mac上继续构建

    在Mac上 我不是一次学一个单词 我在整理 我可能有一个 近期旅行的照片文件夹 想一次性 为所有照片生成卡片 所以我在上面 添加了批处理层 曾经需要下午时间输入的内容 现在可以完全自动化

    而且因为Mac上 有更多内存和处理能力 我可以升级到 同一模型的更大变体 更多参数意味着 更强的推理和更高质量的输出 对于内容整理 这至关重要 我可以给模型 更丰富的提示 要求多个示例句子 而不是一个 甚至让它生成汉语拼音 相同代码 调用相同API 只是底层模型更强大

    有了更长的上下文 我可以超越单张卡片 我可以给模型一整类单词 让它构建课程体系 从简单到复杂排序 分组成课程 并编写重用早期词汇的示例句子 以巩固学生已学内容 一个提示就能得到 结构化的教学计划

    我最近去了一次公路旅行 我想导入几张拍摄的照片 添加到我的iOS App中

    我想分割蝴蝶 石头 花朵 湖泊 鸟等 我们立即并行处理 分割照片的任务 找到所有照片中的所有物体 这样我就可以 用一张照片创建多张卡片

    完成后 我们用Qwen3 80亿参数模型 开始生成 这是一个更强大的推理模型 可以看到它在 给出输出前先进行思考 实际上 它在检查 每个单词的拼音是否正确 以及示例用法

    因为这些很容易出错 完成后 我们得到了带有多张图片的卡片 供我发布到App中

    甚至还有帮助我教学的课程体系!

    还有许多我想开发的新功能 我该回去继续开发了 我的Agents在召唤我 让我们在这里收尾

    使用Core AI 你可以构建 多平台App体验 让用户数据 永远不离开设备 无需管理服务器 无需按令牌付费 也没有云端延迟 模型已就绪 工具已就绪 使用Core AI 你拥有 所需的一切来实现强大的 隐私智能 在每个Apple平台上 现在 让我们在设备端 构建强大的应用吧!

    • 11:01 - Load and run SAM3 image segmentation

      import CoreAIImageSegmenter
      
      // Load
      let segmenter = try await ImageSegmenter(resourcesAt: sam3ModelURL)
      
      // Use
      let response = try await segmenter.segment(image: inputImage, prompt: "flower")
      let mask = response.segments.first?.mask
    • 11:28 - Load a language model and create a session

      import FoundationModels
      import CoreAILanguageModels
      
      // Create model instance
      let model = try await CoreAILanguageModel(resourcesAt: qwen3ModelURL)
      
      // Create session using the model
      let session = LanguageModelSession(model: model)
      
      // Generate response
      let response = try await session.respond(to: "...")
    • 12:29 - Generate structured output with @Generable

      import FoundationModels
      import CoreAILanguageModels
      
      @Generable
      struct VocabCard {
          let chineseWord: String
          let englishMeaning: String
          let exampleSentence: String
      }
      
      let model = try await CoreAILanguageModel(resourcesAt: modelURL)
      let session = LanguageModelSession(model: model)
      let response = try await session.respond(
          to: "Create a vocab card for flower",
          generating: VocabCard.self
      )
      let card: VocabCard = response.content
    • 17:22 - Compile a Core AI model ahead of time

      $ xcrun coreai-build compile MyModel.aimodel --platform iOS
    • 0:00 - Introduction
    • Overview of Core AI — a new set of technologies that lets you bring advanced on-device AI capabilities to your apps with no server, no cost per token, and no cloud latency.

    • 1:16 - App concept: camera-based vocab learning
    • Introduction to the demo app — an iOS language-learning app where students point their camera at real-world objects to generate vocab cards with translations, example sentences, and segmented images, all running on-device.

    • 2:52 - Model discovery
    • How to define your app's AI requirements — content, language, and device constraints — and select the right models: SAM3 for text-prompted image segmentation and Qwen 0.6B (a 119-language reasoning model) for vocab card generation.

    • 7:40 - Getting models with the Core AI models repository
    • How to use the coreai-models GitHub repository to find popular models with ready-made export recipes — browsing the catalog, running the export script for SAM3 and Qwen, and getting optimized .aimodel files.

    • 8:37 - Integration
    • How to inspect .aimodel files in Xcode (size, platform targets, function signatures, tensor shapes), add the coreai-models Swift package, and select the CoreAILM and CoreAISegmentation libraries as app dependencies.

    • 10:55 - Writing the Swift integration code
    • How to write the Swift code to use both models — loading SAM3 and running text-prompted segmentation, loading Qwen with a single CoreAILanguageModel line, and using the familiar LanguageModelSession API from Foundation Models with structured @Generable output for typed vocab card fields.

    • 13:05 - Diagnosing model specialization latency
    • Using the new Core AI Instruments template to identify that first-run latency is caused by model specialization — the process that compiles a Core AI model for the specific device — and understanding when and how to handle it gracefully.

    • 14:40 - Deployment
    • How to design a deliberate deployment strategy: using a first-run experience to introduce the feature, keeping models out of the app bundle to avoid bloating update size for all users, and triggering on-demand model download via Background Assets only when the user opts in.

    • 17:00 - Ahead-of-time (AOT) compilation
    • How to use the coreai-build command to perform compilation ahead-of-time on your development machine — generating device-architecture-specific compiled model assets that dramatically reduce on-device specialization time during the first-run experience.

    • 18:03 - iOS demo
    • Live demo of the complete iOS experience: fast model preparation with AOT compilation, SAM3 segmenting real objects (rocks, wood, sunflower), and Qwen generating Mandarin vocab cards — with seamless subsequent inferences from the cached model.

    • 19:57 - Multiplatform
    • How the same Swift code runs on macOS with no changes — adding batch processing for folders of photos, stepping up to Qwen3 8B for higher-quality reasoning and pinyin generation, using longer context for curriculum generation, and a live macOS demo processing road trip photos into a full lesson plan.

    • 23:06 - Next steps
    • Summary: Core AI gives you everything you need to build private, multi-platform on-device AI experiences — no server, no cost per token, no cloud latency.

Developer Footer

  • 视频
  • WWDC26
  • 利用 Core AI 将设备端 AI 模型整合到你的 App 中
  • 打开菜单 关闭菜单
    • iOS
    • iPadOS
    • macOS
    • Apple tvOS
    • visionOS
    • watchOS
    打开菜单 关闭菜单
    • Swift
    • SwiftUI
    • Swift Playground
    • TestFlight
    • Xcode
    • Xcode Cloud
    • SF Symbols
    打开菜单 关闭菜单
    • 辅助功能
    • 配件
    • Apple 智能
    • App 扩展
    • App Store
    • 音频与视频 (英文)
    • 增强现实
    • 设计
    • 分发
    • 教育
    • 字体 (英文)
    • 游戏
    • 健康与健身
    • App 内购买项目
    • 本地化
    • 地图与位置
    • 机器学习与 AI
    • 开源资源 (英文)
    • 安全性
    • Safari 浏览器与网页 (英文)
    打开菜单 关闭菜单
    • 完整文档 (英文)
    • 部分主题文档 (简体中文)
    • 教程
    • 下载
    • 论坛 (英文)
    • 视频
    打开菜单 关闭菜单
    • 支持文档
    • 联系我们
    • 错误报告
    • 系统状态 (英文)
    打开菜单 关闭菜单
    • Apple 开发者
    • App Store Connect
    • 证书、标识符和描述文件 (英文)
    • 反馈助理
    打开菜单 关闭菜单
    • Apple Developer Program
    • Apple Developer Enterprise Program
    • App Store Small Business Program
    • MFi Program (英文)
    • Mini Apps Partner Program
    • News Partner Program (英文)
    • Video Partner Program (英文)
    • 安全赏金计划 (英文)
    • Security Research Device Program (英文)
    打开菜单 关闭菜单
    • 与 Apple 会面交流
    • Apple Developer Center
    • App Store 大奖 (英文)
    • Apple 设计大奖
    • Apple Developer Academies (英文)
    • WWDC
    阅读最近新闻。
    获取 Apple Developer App。
    版权所有 © 2026 Apple Inc. 保留所有权利。
    使用条款 隐私政策 协议和准则