Foundation Modelフレームワークの新機能

Foundation Modelフレームワークの新機能

Foundation Modelフレームワークの新機能を紹介します。プライベートクラウドコンピューティングへのアクセス、サードパーティまたはオープンソースのモデルの統合、Visionの各種機能の活用のための方法を確認しましょう。コンテキスト管理のためのAPI、内蔵のセマンティック検索、エージェントを活用した体験をアプリ内で構築する上で役立つ強力なプリミティブについても紹介します。

関連する章
- 0:00 - Introduction
- 2:34 - New on-device model
- 3:21 - Vision: image understanding
- 4:20 - Private Cloud Compute
- 6:46 - Model abstraction layer
- 7:32 - Partner model integrations
- 9:40 - System tools: Vision and Spotlight
- 10:57 - Dynamic Profiles for agentic apps
- 13:46 - Composing models and configurations
- 15:30 - Evaluations framework
- 16:02 - The fm command line tool
- 17:13 - Foundation Models Python SDK
- 17:55 - Open source and framework utilities
- 19:24 - Next steps
リソース
みなさんこんにちは私はErikです私はZhenです昨年は Foundation Models frameworkを紹介しましたガイド付き生成やスナップショットストリーミングなどの機能と強力なツールプロトコルを搭載しましたみなさんの熱狂的な反応に感激しました 1年目から Foundation Model フレームワークを支持していただき今年の内容もさらに喜んでいただけると思います今年フレームワークに加わった全ての新機能をご紹介しますこのリリースは内容が非常に充実しています 2027年リリースはOS内外へのインテグレーションを中心により多様なモデルとエージェント体験を構築するための新しいプリミティブを提供します最も注目のアップデートから始めましょう Foundation Modelフレームワークは本日発表する多くの新しいAPIを含めオープンソースになりますしかも華やかに。コアフレームワークに加えて新しいパッケージも公開します Foundation Modelフレームワークユーティリティは OSリリース間でも更新され新興の実験的なビルディングブロックを提供しますこのセッションでは他の複数のパッケージもエコシステムに加わることをお伝えしますさあ一緒に始めましょうか？新しいモデルに関する全てとフレームワークに加わる新しいモダリティとツールをご紹介します作成した全く新しいAPIもご覧いただきますそれらを最大限に活用するためのAPIです。スケジュールは盛り沢山ですまずモデルのアップデートが多数ありますオンデバイスモデルの更新とサーバーモデルへのアクセスを含みます SpotlightとVisionフレームワークの力を借りたセッションを強化する新しいシステムツールも追加しましたその後 Zhenから Dynamic Profileという強力な新しいAPIについて説明しますエージェント体験を作成するための新しいプリミティブです Zhenはまた全く新しい Evaluationフレームワークと Foundation Modelとの緊密な統合についても説明します
最後に Mac特有の生産性ツールに関する嬉しいニュースをお届けします最後までお楽しみに。新しいモデルから始めましょう。
このリリースには新しいオンデバイスモデルが登場しゼロから再構築されあらゆる面で向上していますより高い知性を持ちロジックとツール呼び出しが優れています iOS 26.4ではモデルのコンテキストサイズを検査する新しいAPIと命令プロンプトトランスクリプトのトークン数をカウントするAPIをリリースしました今後はこれらを活用してアプリを実行中のハードウェアに適応させてくださいガードレールの改善にも注力してきました iOS 26.4での調整にお気づきの方もいるでしょう誤検知を減らすための変更で iOS 27ではさらに多くの改善を続けていますまたオンデバイスモデルに Vision機能も追加されましたこれにより全く新しいアプリケーションのカテゴリが可能になります
APIはシンプルで既存のプロンプトビルダーの自然な拡張です
ここではセッションを作成し右側にある折り紙の写真について質問しますテキストとともに画像添付ファイルをプロンプトに挿入するだけです
これでモデルは画像に関する質問に答えられます
画像添付ファイルは様々な型から作成できます UIImage NSImage
CGImage Core Image型 CoreVideo Pixel Buffer ファイルURLですモデルはあらゆるサイズとアスペクト比の画像をサポートします特定の形状にトリミングやパディングは必要ありません任意の画像サイズを使えますが注意点があります大きな画像ほどトークンを消費しレイテンシが増加しますこれらのアップグレードによりオンデバイスのシステム言語モデルはかつてないほど高性能になりましたさらなる処理能力が必要な場合は全く新しい PrivateCloudComputeLanguageModelで Appleの最強のサーバーモデルを使えます Private Cloud Computeモデルはおなじみの Apple Intelligence機能の多くを支えているのと同じモデルですオンデバイスモデルよりはるかに大きなモデルで 32,000トークンのコンテキストウィンドウを持ちますそして強力な新機能やリーズニングも搭載していますリーズニングモデルは回答前に時間をかけて慎重に考えるよう訓練されていますその結果大幅に優れた成果が得られます Private Cloud Computeは非常に簡単に使えますモデルのインスタンスを作成しそれを使ってlanguage model sessionを初期化するだけですセッションにプロンプトを送る際新しい contextOptions引数でリーズニングレベルを指定できます ReasoningLevelはモデルが応答前に考える量を制御します深いリーズニングは追加の計算と引き換えにより良い応答を生成します Private Cloud Computeの最大の利点の1つはアカウント設定を心配する必要がないことです認証を処理する必要もなく APIキーを保存する必要もありません全て完全にシームレスですもちろん Private Cloud Computeは何よりもプライベートですプロンプトは決して保存されず独立した研究者がこの点を検証できるようにしていますさらに Private Cloud Computeにより Foundation Modelフレームワークを watchOSにも展開できます watchOS 27から最も強力なインテリジェンス機能を手首でご利用いただけます
PCCはクラウドAPIコストなしで利用可能で初回ダウンロード数が200万件未満のデベロッパに提供されますユーザーは毎日 PCCにアクセスでき iCloud+に登録している場合は制限がさらに高くなります PrivateCloudComputeLanguageModelの詳細については必要な権限も含め Private Cloud Computeの構築についての動画をご確認ください刷新されたオンデバイスモデルと新しい Private Cloud Computeモデルに加えてモデル抽象化レイヤーを開放しますほぼあらゆる言語モデルを Foundation Modelフレームワークで使用できるようにするためです抽象化レイヤーは新しい LanguageModelプロトコルを中心に構築されローカルとサーバー両方のモデルが LanguageModelSessionを支えられます SystemLanguageModelや PrivateCloudComputeLanguageModelなどの既存モデルはすでにこのプロトコルに準拠していますさらに 2つの追加実装をオープンソース化します CoreAILanguageModelと MLXLanguageModelです MacのApple Neural EngineとGPUで多数のローカルモデルを実行するためのものです様々なフロンティアサーバーモデルへのアクセスも提供できるよう裏で取り組んできたこともお伝えします AnthropicとGoogleが Swiftパッケージを公開し最新かつ最高のモデルへのアクセスを提供しますモデル抽象化レイヤーによりサードパーティモデルの使用が簡単になります Swift Package Managerで言語モデルパッケージをインポートし使用するモデルを初期化します
そしてセッション作成時に渡すだけです
以降の処理は全て同じです
サードパーティのサーバーモデルを使用する場合認証と請求の両方を処理する必要がありますアプリのバイナリに秘密鍵を保存しないでください OAuthなどの安全な仕組みでアクセストークンを取得し KeyChainを使って安全に保存してくださいデベロッパはサードパーティモデル使用時通常トークンごとに請求されますそのため使用量を簡単に追跡できるようにしましたセッションと応答には usageプロパティが追加され使用されたトークン数を正確に確認できます入力トークンのうちキャッシュから読み込まれた数とリーズニングに使用された応答トークン数も確認できます
LanguageModelsの使い方や独自のLanguageModelパッケージの作成方法については "Bring an LLM provider to the Foundation Models framework" をご覧くださいモデルのアップデートを全てお伝えしました次はシステムツールですこのリリースではいくつかの組み込みツールを導入します LanguageModelSessionsを強化するシステム提供の機能です Foundation Modelに 2つのネイティブツールが追加されました Visionフレームワークの強力な機能に支えられています BarcodeReaderToolはモデルがバーコードから情報を読み取れるようにし OCRToolはモデルが画像から構造化テキストを抽出できるようにしますどちらもモデルが視覚情報をリーズニング能力を高めネイティブではできない方法で行います "What's new in image understanding" の動画ではこれらのツールの活用方法の詳細を説明しています同様に Spotlightを使った検索ツールも導入します完全ローカルな Retrieval-Augmented Generation用ですこれは最もリクエストの多かった機能の1つです Retrieval-Augmented Generation(RAG)はモデルに最新の個人的またはドメイン知識へのアクセスを与える技術で Spotlightインデックスと特別に処理されたクエリを活用しますまさに待ち望んでいた機能なら "LLM search using Core Spotlight" が必見ですこのリリースの全ての新しいモデルを確認したので新しいシステムツールとともに Zhenに引き継ぎますエージェンティックなアプリ体験を構築するための新しいAPIについて説明しますお楽しみに Zhen よろしくありがとう Erik
Dynamic Profileをご紹介しますエージェント体験を構築するための新しいプリミティブです
クラフトアプリの説明から始めましょう Dynamic Profileで可能になる体験の種類を見ていきますアプリ内で折り紙の写真とともに日記のエントリを作成できますアプリはクラフト分析モードで開始するセッションを作成します命令がモデルに画像を分析して見つけたことを記録するよう指示しますクラフトの種類色素材を特定しますそしてツール呼び出しを通じて日記に保存します次にアプリはブレインストーミングモードに切り替わります Private Cloud Computeの推論機能を使って学んだ全てのことを活かし創造的な折り紙プロジェクトのリストを提案します素晴らしいですねこの機能を実装するには LanguageModelSessionを作成するところから始めます次にモデル命令ツールをそれぞれ持つセッションを追加します
しかしモデルに自律的にモードを切り替えさせたい場合は？
複雑になってきます
コンテキストの管理とこのようなエージェントシステムのオーケストレーションには多くのボイラープレートが必要ですそこで Foundation Modelsは新しい宣言的APIを導入します Dynamic Profilesでコンテキストで重要なことに集中でき命令型の制御を気にする必要がなくなります全て単一の言語モデルセッション内で行えますシンプルなDynamic Profileを作成するにはstructを宣言し DynamicProfileプロトコルに準拠させます Profileを含む bodyプロパティを持ちます
言語モデルセッションは DynamicProfileで初期化できます
命令とツールを指定できますその時点でコンテキストに存在すべきものですこれが DynamicProfileの最もシンプルな形式で命令とツールで構成されたデータ構造です 2つの異なるモードを実装したいと思いますクラフト分析モードとブレインストームモードですアプリにはモード変数を保存する observableオブジェクトがありますそれを使って切り替えます
異なる分岐では LanguageModelSessionは異なる命令とツールを持ちます
モデルにツールを与えることもできブレインストームモードのコンテキストへの切り替えをインテリジェントに行えます
コンテキストの管理だけでは不十分な場合もあります異なるタスクに異なるモデルと設定が必要な場合もありますその際でも会話履歴を維持しながら行えます
クラフトアプリには2つのシナリオがありますクラフト分析とブレインストームですそれぞれ既に異なる命令とツールのセットを持っています
クラフトの分析のような素早いタスクには SystemLanguageModelで十分でしょうブレインストーミングに切り替えたい場合は深い推論が設定された Private Cloud Computeを指定できます
これらの設定を記述するにはモディファイアを使います
PCCを指定するモデルモディファイアとモデルに十分に考えさせる reasoningLevelモディファイアですこれで LanguageModelSessionがモデルツール命令を動的に設定できますアプリが異なるモデル機能で異なるコンテキストを処理する必要がある場合 Dynamic Profilesが最適です重要なのは DynamicProfileが常に単一のアクティブな Profileに解決されることです条件分岐でどのProfileをアクティブにするかを選び frameworkが移行を処理しますクラフトアプリで試してみましょうアイデアを選択するとモデルが Private Cloud Computeに切り替わります分析からの完全なコンテキストを持ちながら創造的なプロジェクトアイデアの生成には大きなモデルの機能が役立ちます優れたツール呼び出しと広い世界知識があるからです Profileはコンテキストの管理とセッションの動的な設定をはるかに簡単にしますこのAPIを使用する際はプライバシー境界モデル機能コストを考慮してください詳細はディープダイブセッションをご覧ください "Build agentic app experiences with Foundation Models framework"
これらの機能は強力ですが言語モデルは本質的に非決定論的ですそのため動作の予測が難しくなります
Evaluationフレームワークは新しいSwiftフレームワークでインテリジェンス機能の品質を測定します Evaluationフレームワークを使うとプロンプトを調整しながら精度を定量化できます Evaluationはあなたのようなアプリデベロッパのために構築されており変更の統計的影響を理解するのに役立ちますそして自信を持ってアプリをリリースできます Evaluationの詳細はこれらのセッションをご確認ください
次にツールとオープンソースへの取り組みについてお話しします macOS 27ではモデルがコマンドラインに登場します fm CLIはApple Foundation Modelsを使う全く新しい方法で日常の生産性向上に役立ちます端末からオンデバイスモデルと PCCにアクセスできます fmコマンドを使うだけです
fmには便利なヘルパーがありサポートする全機能を一覧表示します
アプリ機能のためにモデルを試すのに fm chatを使ってきました見せましょう「折り紙の文脈で谷折りとは何を意味するか？」を聞いてみます
簡単ですあっという間に。 fmをシェルスクリプトに組み込んでドキュメントを要約したり情報を抽出したりコンテンツを生成したりできます例えばランダムな名前の写真がいくつかあります IMG_1234のような名前の写真です fmに画像の内容に基づいてファイル名を生成するよう依頼しましょう
見てくださいわかりやすい説明的な名前を付けてくれました
データサイエンティストや研究者で Pythonエコシステムで作業している方には FoundationModels SDK for Pythonが対応しています
Python SDKは全く同じオンデバイスモデルへの直接アクセスを提供します Swift Foundation Modelフレームワークを動かすモデルと同じですモデルの利用可能性を確認したり数行のPythonで応答を生成したりできます SDKにはSwiftフレームワークのコア機能が含まれておりプロンプトから構造化された応答を数秒で得られます詳細は次のセッションをご確認ください "Build AI-powered scripts with the fm CLI and Python SDK" Macの生産性について確認したのでオープンソースについて話しましょう
Foundation Modelsフレームワークユーティリティから始めます
ユーティリティにはビルディングブロックのコレクションが含まれており LLMを使った新興のプラクティスを探索するのに役立ちます
トランスクリプト管理のためのプロファイルモディファイアと手続き型知識読み込みのためのスキルAPIを提供しますまた Chat Completionスタンダードを使ってサーバーと連携できる言語モデルも提供しますこれらは出発点に過ぎませんツールとトレンドは進化し Foundation Model フレームワークユーティリティは共に成長します
ユーリティティパッケージに加えて FoundationModelフレームワークのコアもオープンソースになります Foundation Modelフレームワークをオープンソース化することで LLMとの対話に最適なソリューションとなります Swiftが動く全ての環境 Linuxサーバーも含めて。 AnthropicやGoogleなどの他のモデルプロバイダーと合わせて CoreAIとMLXのインテグレーションも含めどこでも任意のモデルを実行できますお帰りなさい Erik まとめる準備はできてますか？はいよくまとめてくれました Zhen
これらの新機能モデル APIに私たちと同じくらいワクワクしていただければと思いますまだ表面をなぞっただけです詳細については他の動画もご確認くださいここで紹介した全トピックの詳細があります Evaluationフレームワークから Private Cloud Computeまで強化されたXcode instrumentと Dynamic Profileの詳細もあります次のステップとしてサンプルアプリを探索することをお勧めします Dynamic Profileについて詳しく学べますそして Evaluationフレームワークに慣れ親しんでくださいチーム全体を代表してご参加ありがとうございましたありがとうございました

// Context size and token counting
  
  let model = SystemLanguageModel()
  print(model.contextSize)
  // 8192
  
  let count = try await model.tokenCount(for: "What are the Japanese characters for origami?")
  print(count)

3:52 - Attachable image types

// Insert c// Attachable image types

  let response = try await session.respond {
      "What animal is this?"
      Attachment(UIImage(...))
  }ode snippet.

8:45 - Inspecting usage

// Inspecting usage
  
  let response = try await session.respond(
      to: "Recommend a craft that doesn't require scissors.",
      contextOptions: ContextOptions(reasoningLevel: .light)
  )

  print(response.usage.input.totalTokenCount)
  print(response.usage.input.cachedTokenCount)

  print(response.usage.output.totalTokenCount)
  print(response.usage.output.reasoningTokenCount)

11:55 - Routing between craft analysis and brainstorm

// Routing between craft analysis and brainstorm
  
  @Observable
  final class AppStates {
      var mode: Mode
  }

  let appStates: AppStates
  var session: LanguageModelSession?

  func updateSession() {
      let originalTranscript = session?.transcript.dropFirstInstructions() ?? Transcript()

      // Create a new session with new instructions and tools
      switch appStates.mode {
      case .craftAnalysis:
          session = LanguageModelSession(
              tools: [
                  RecordImageAnalysisTool(),
                  SwitchModeTool(states: appStates)
              ],
              instructions: "Analyze the user's craft project...",
              transcript: originalTranscript
          )
      case .brainstorm:
          session = LanguageModelSession(
              tools: [
                  RecordBrainstormTool(),
              ],
              instructions: "Brainstorm some ideas...",
              transcript: originalTranscript
          )
      }
  }
  
  struct SwitchModeTool: Tool {
      let description = "Switch to a different mode."
      let states: AppStates

      @Generable
      struct Arguments {
          let mode: Mode
      }

      func call(arguments: Arguments) async throws -> some PromptRepresentable {
          appStates.mode = arguments.mode
          return "Successfully switched to \(arguments.mode)."
      }
  }
  
  // If mode changes, update the session
  withObservationTracking {
      appStates.mode
  } onChange: {
      updateSession()
  }

12:42 - Describing the profile for craft app

// Describing the profile for craft app

  struct CraftProfile: LanguageModelSession.DynamicProfile {
      var body: some DynamicProfile {
          Profile {
              Instructions {
                  """
                  You are an expert crafting assistant. \
                  Record craft project image analyses   \
                  using the recordImageAnalysis tool.
                  """
              }
              RecordImageAnalysisTool()
          }
      }
  }

  let session = LanguageModelSession(
      profile: CraftProfile()
  )

14:36 - Describing the profile for craft app

// Describing the profile for craft app
  
  struct CraftProfile: LanguageModelSession.DynamicProfile {
      let states: CraftProjectStates

      var body: some DynamicProfile {
          switch states.mode {
          case .craftAnalysis:
              Profile {
                  Instructions { /* ... */ }
                  RecordImageAnalysisTool()
                  SwitchModeTool(states: states)
              }
          case .brainstorm:
              Profile {
                  Instructions { /* ... */ }
                  BrainstormRecordTool()
              }
              .model(states.privateCloudCompute)
              .reasoningLevel(.deep)
          }
      }
  }

18:29 - Foundation Models SDK for Python

# Foundation Models SDK for Python
  
  import apple_fm_sdk as fm

  model = fm.SystemLanguageModel()

  # Check the model's availability
  is_available, reason = model.is_available()

  if is_available:

      # Create a session
      session = fm.LanguageModelSession(model=model)

      # Generate a response
      response = await session.respond(prompt="Hello!")
      print(response)

- 0:00 - Introduction
- Erik Hornberger and Zhen Li introduce this year's Foundation Models release, going open source with a new utilities package, and preview the agenda: model updates, system tools, dynamic profiles, evaluations, and tooling.
- 2:34 - New on-device model
- A rebuilt on-device model with better reasoning and tool calling, plus new APIs (from iOS 26.4) for inspecting context size and counting tokens, and refined guardrails that reduce false positives.
- 3:21 - Vision: image understanding
- The on-device model gains vision. Add image attachments to a prompt to ask about images, accepting UIImage, NSImage, CGImage, Core Image, CoreVideo pixel buffers, and file URLs at any size, though larger images cost more tokens.
- 4:20 - Private Cloud Compute
- Access Apple's server models via PrivateCloudComputeLanguageModel, a 32K context window with reasoning levels, with no account setup, auth, or API keys, fully private, and now available on watchOS 27.
- 6:46 - Model abstraction layer
- A new LanguageModel protocol lets local and server models back a LanguageModelSession. Existing models conform already, plus open-source CoreAILanguageModel and MLXLanguageModel for running local models on the Neural Engine and GPU.
- 7:32 - Partner model integrations
- Anthropic and Google publish Swift packages for their frontier models. Swap models via Swift Package Manager with everything downstream unchanged, handle auth and billing securely with OAuth and Keychain, and track per-token usage including cache and reasoning tokens.
- 9:40 - System tools: Vision and Spotlight
- New built-in tools: BarcodeReaderTool and OCRTool (Vision-backed) for reasoning over visual information, and a Spotlight-powered search tool enabling fully local Retrieval-Augmented Generation (RAG).
- 10:57 - Dynamic Profiles for agentic apps
- Dynamic Profiles, a declarative primitive for agentic experiences. Using the Crafts app, a single session swaps instructions and tools between modes (craft analysis vs. brainstorm) by conforming a struct to DynamicProfile.
- 13:46 - Composing models and configurations
- Use modifiers to vary the model and reasoning level per profile branch, for example SystemLanguageModel for quick analysis and Private Cloud Compute with deep reasoning for brainstorming, while preserving conversation history. A profile resolves to one active profile at a time.
- 15:30 - Evaluations framework
- A new Swift framework to measure the quality of intelligence features, quantifying accuracy as you tweak prompts so you can understand the statistical impact of changes and ship with confidence.
- 16:02 - The fm command line tool
- In macOS 27, the models come to the terminal. The fm CLI gives on-device and PCC access for everyday productivity: fm chat for interactive use and piping into shell scripts to summarize, extract, or generate content.
- 17:13 - Foundation Models Python SDK
- A Python SDK exposes the same on-device model as the Swift framework, checking availability and generating structured responses in a few lines, for data scientists and researchers in the Python ecosystem.
- 17:55 - Open source and framework utilities
- The Foundation Models framework utilities package offers building blocks (transcript management, a skill API, chat-completions interfacing), and the core framework is open-sourced to run wherever Swift runs, including Linux servers.
- 19:24 - Next steps
- Download the sample app, get familiar with dynamic profiles and the Evaluations framework, and watch the deep-dive sessions on PCC, evaluations, the Xcode instrument, and dynamic profiles.

「今すぐ始める」を詳しく見る

最新情報

プラットフォームを詳しく見る

特集

テクノロジーを詳しく見る

特集

コミュニティを詳しく見る

特集

ドキュメントを詳しく見る

リリースノート

ダウンロードを詳しく見る

特集

サポートを詳しく見る

特集

クイックリンク

関連する章

リソース