Add Genie NPU models to Flutter and React Native SDKs + example apps

Siddhesh2377 · Siddhesh2377 · commit 82bd939f0961 · 2026-03-17T23:33:31.000+05:30
- Update NPUChip in Flutter SDK: new base URL, npuSuffix field, tar.gz format
- Update NPUChip in React Native SDK: same changes as Flutter
- Update Flutter example: chip-based dynamic model registration with
  per-chip filtering (Qwen3 4B gen5-only, Llama 3.2 1B both chips)
- Update React Native example: same chip-based registration pattern
- Update doc comments to reflect new URL format
diff --git a/examples/flutter/RunAnywhereAI/lib/app/runanywhere_ai_app.dart b/examples/flutter/RunAnywhereAI/lib/app/runanywhere_ai_app.dart
@@ -10,6 +10,8 @@ import 'package:runanywhere_ai/core/design_system/app_spacing.dart';
 import 'package:runanywhere_ai/core/services/model_manager.dart';
 import 'package:runanywhere_ai/core/utilities/constants.dart';
 import 'package:runanywhere_ai/core/utilities/keychain_helper.dart';
+import 'package:runanywhere/core/types/npu_chip.dart';
+import 'package:runanywhere/public/extensions/runanywhere_device.dart';
 import 'package:runanywhere/public/extensions/rag_module.dart';
 import 'package:runanywhere_llamacpp/runanywhere_llamacpp.dart';
 import 'package:runanywhere_genie/runanywhere_genie.dart';
@@ -208,19 +210,29 @@ class _RunAnywhereAIAppState extends State<RunAnywhereAIApp> {
     // --- GENIE NPU MODULE (Android/Snapdragon only) ---
     if (Genie.isAvailable) {
       await Genie.register(priority: 200);
-      Genie.addModel(
-        id: 'qwen2_5-7b-instruct-genie',
-        name: 'Qwen 2.5 7B (NPU)',
-        url: 'https://huggingface.co/runanywhere/genie-npu-models/resolve/main/qwen2.5-7b-instruct-genie-w8a16.tar.gz',
-        memoryRequirement: 5000000000,
-      );
-      Genie.addModel(
-        id: 'llama-3.2-1b-instruct-genie',
-        name: 'Llama 3.2 1B (NPU)',
-        url: 'https://huggingface.co/runanywhere/genie-npu-models/resolve/main/llama-3.2-1b-instruct-genie-w4.tar.gz',
-        memoryRequirement: 1500000000,
-      );
-      debugPrint('✅ Genie NPU module registered');
+      final chip = await RunAnywhereDevice.getChip();
+      if (chip != null) {
+        // Models with per-chip availability
+        const genieModels = [
+          // Qwen3 4B — Gen 5 only
+          (slug: 'qwen3-4b', name: 'Qwen3 4B', mem: 2800000000, chips: {NPUChip.snapdragon8EliteGen5}),
+          // Llama 3.2 1B Instruct — both chips
+          (slug: 'llama-v3.2-1b-instruct', name: 'Llama 3.2 1B Instruct', mem: 1200000000, chips: {NPUChip.snapdragon8Elite, NPUChip.snapdragon8EliteGen5}),
+        ];
+        for (final m in genieModels) {
+          if (m.chips.contains(chip)) {
+            Genie.addModel(
+              id: '${m.slug}-npu-${chip.identifier}',
+              name: '${m.name} (NPU - ${chip.displayName})',
+              url: chip.downloadUrl(m.slug),
+              memoryRequirement: m.mem,
+            );
+          }
+        }
+        debugPrint('✅ Genie NPU module registered (chip: ${chip.displayName})');
+      } else {
+        debugPrint('ℹ️ Genie available but no supported NPU chip detected');
+      }
     } else {
       debugPrint('ℹ️ Genie NPU not available (non-Snapdragon device)');
     }
diff --git a/examples/react-native/RunAnywhereAI/App.tsx b/examples/react-native/RunAnywhereAI/App.tsx
@@ -42,7 +42,11 @@ import {
   LLMFramework,
   ModelArtifactType,
   initializeNitroModulesGlobally,
+  getChip,
+  getNPUDownloadUrl,
+  NPU_CHIPS,
 } from '@runanywhere/core';
+import type { NPUChip } from '@runanywhere/core';
 
 // Make LlamaCPP optional for ONNX-only builds
 let LlamaCPP: any = null;
@@ -244,22 +248,37 @@ async function registerModulesAndModels(): Promise<void> {
   if (Platform.OS === 'android' && Genie && Genie.isAvailable) {
     Genie.register();
 
-    await Promise.all([
-      RunAnywhere.registerModel({
-        id: 'qwen2_5-7b-instruct-genie',
-        name: 'Qwen 2.5 7B (NPU)',
-        url: 'https://huggingface.co/runanywhere/genie-npu-models/resolve/main/qwen2.5-7b-instruct-genie-w8a16.tar.gz',
-        framework: LLMFramework.Genie,
-        memoryRequirement: 5_000_000_000,
-      }),
-      RunAnywhere.registerModel({
-        id: 'llama-3.2-1b-instruct-genie',
-        name: 'Llama 3.2 1B (NPU)',
-        url: 'https://huggingface.co/runanywhere/genie-npu-models/resolve/main/llama-3.2-1b-instruct-genie-w4.tar.gz',
-        framework: LLMFramework.Genie,
-        memoryRequirement: 1_500_000_000,
-      }),
-    ]);
+    const chip = await getChip();
+    if (chip) {
+      // Models with per-chip availability
+      const genieModels: Array<{
+        slug: string;
+        name: string;
+        mem: number;
+        chips: string[];
+      }> = [
+        // Qwen3 4B — Gen 5 only
+        { slug: 'qwen3-4b', name: 'Qwen3 4B', mem: 2_800_000_000, chips: ['8elite-gen5'] },
+        // Llama 3.2 1B Instruct — both chips
+        { slug: 'llama-v3.2-1b-instruct', name: 'Llama 3.2 1B Instruct', mem: 1_200_000_000, chips: ['8elite', '8elite-gen5'] },
+      ];
+
+      const registrations = genieModels
+        .filter((m) => m.chips.includes(chip.identifier))
+        .map((m) =>
+          RunAnywhere.registerModel({
+            id: `${m.slug}-npu-${chip.identifier}`,
+            name: `${m.name} (NPU - ${chip.displayName})`,
+            url: getNPUDownloadUrl(chip, m.slug),
+            framework: LLMFramework.Genie,
+            memoryRequirement: m.mem,
+          }),
+        );
+      await Promise.all(registrations);
+      console.log(`✅ Genie NPU models registered (chip: ${chip.displayName})`);
+    } else {
+      console.log('ℹ️ Genie available but no supported NPU chip detected');
+    }
   }
 
   // =========================================================================
diff --git a/sdk/runanywhere-flutter/packages/runanywhere/lib/core/types/npu_chip.dart b/sdk/runanywhere-flutter/packages/runanywhere/lib/core/types/npu_chip.dart
@@ -1,34 +1,36 @@
 /// Supported NPU chipsets for on-device Genie model inference.
 ///
-/// Each chip has an [identifier] used to construct dynamic download URLs
-/// for chipset-specific NPU model binaries.
+/// Each chip has an [identifier] used in model IDs and an [npuSuffix] used
+/// to construct download URLs from the HuggingFace model repository.
 ///
 /// Example:
 /// ```dart
 /// final chip = RunAnywhere.getChip();
 /// if (chip != null) {
-///   final url = chip.downloadUrl('qwen');
-///   // → https://huggingface.co/Void2377/npu-models/resolve/main/qwen-gen1.zip?download=true
+///   final url = chip.downloadUrl('qwen3-4b');
+///   // → https://huggingface.co/runanywhere/genie-npu-models/resolve/main/qwen3-4b-genie-w4a16-8elite-gen5.tar.gz
 /// }
 /// ```
 enum NPUChip {
-  snapdragon8Elite('gen1', 'Snapdragon 8 Elite', 'SM8750'),
-  snapdragon8EliteGen5('gen2', 'Snapdragon 8 Elite Gen 5', 'SM8850');
+  snapdragon8Elite('8elite', 'Snapdragon 8 Elite', 'SM8750', '8elite'),
+  snapdragon8EliteGen5('8elite-gen5', 'Snapdragon 8 Elite Gen 5', 'SM8850', '8elite-gen5');
 
   final String identifier;
   final String displayName;
   final String socModel;
+  final String npuSuffix;
 
-  const NPUChip(this.identifier, this.displayName, this.socModel);
+  const NPUChip(this.identifier, this.displayName, this.socModel, this.npuSuffix);
 
   /// Base URL for NPU model downloads on HuggingFace.
   static const baseUrl =
-      'https://huggingface.co/Void2377/npu-models/resolve/main/';
+      'https://huggingface.co/runanywhere/genie-npu-models/resolve/main/';
 
   /// Build a HuggingFace download URL for this chip.
-  /// [modelName] is the model prefix (e.g. "qwen") → produces "qwen-gen1.zip"
-  String downloadUrl(String modelName) =>
-      '$baseUrl$modelName-$identifier.zip?download=true';
+  /// [modelSlug] is the model slug (e.g. "qwen3-4b") → produces
+  ///   "qwen3-4b-genie-w4a16-8elite-gen5.tar.gz"
+  String downloadUrl(String modelSlug) =>
+      '$baseUrl$modelSlug-genie-w4a16-$npuSuffix.tar.gz';
 
   /// Match an NPU chip from a SoC model string (e.g. "SM8750").
   /// Returns null if the SoC is not a supported NPU chipset.
diff --git a/sdk/runanywhere-flutter/packages/runanywhere/lib/public/extensions/runanywhere_device.dart b/sdk/runanywhere-flutter/packages/runanywhere/lib/public/extensions/runanywhere_device.dart
@@ -25,10 +25,10 @@ extension RunAnywhereDevice on RunAnywhere {
   ///
   /// Example:
   /// ```dart
-  /// final chip = RunAnywhereDevice.getChip();
+  /// final chip = await RunAnywhereDevice.getChip();
   /// if (chip != null) {
-  ///   final url = chip.downloadUrl('qwen');
-  ///   RunAnywhere.registerModel(id: 'qwen-npu', name: 'Qwen NPU', url: url, ...);
+  ///   final url = chip.downloadUrl('qwen3-4b');
+  ///   RunAnywhere.registerModel(id: 'qwen3-4b-npu', name: 'Qwen3 4B NPU', url: url, ...);
   /// }
   /// ```
   static Future<NPUChip?> getChip() async {
diff --git a/sdk/runanywhere-react-native/packages/core/src/types/NPUChip.ts b/sdk/runanywhere-react-native/packages/core/src/types/NPUChip.ts
@@ -1,15 +1,15 @@
 /**
  * Supported NPU chipsets for on-device Genie model inference.
  *
- * Each chip has an `identifier` used to construct dynamic download URLs
- * for chipset-specific NPU model binaries.
+ * Each chip has an `identifier` used in model IDs and an `npuSuffix` used
+ * to construct download URLs from the HuggingFace model repository.
  *
  * @example
  * ```typescript
  * const chip = await RunAnywhere.getChip();
  * if (chip) {
- *   const url = getNPUDownloadUrl(chip, 'qwen');
- *   // → https://huggingface.co/Void2377/npu-models/resolve/main/qwen-gen1.zip?download=true
+ *   const url = getNPUDownloadUrl(chip, 'qwen3-4b');
+ *   // → https://huggingface.co/runanywhere/genie-npu-models/resolve/main/qwen3-4b-genie-w4a16-8elite-gen5.tar.gz
  * }
  * ```
  */
@@ -18,33 +18,37 @@ export interface NPUChip {
   identifier: string;
   displayName: string;
   socModel: string;
+  npuSuffix: string;
 }
 
 /** Base URL for NPU model downloads on HuggingFace. */
 export const NPU_BASE_URL =
-  'https://huggingface.co/Void2377/npu-models/resolve/main/';
+  'https://huggingface.co/runanywhere/genie-npu-models/resolve/main/';
 
 /** All supported NPU chipsets. */
 export const NPU_CHIPS: readonly NPUChip[] = [
   {
-    identifier: 'gen1',
+    identifier: '8elite',
     displayName: 'Snapdragon 8 Elite',
     socModel: 'SM8750',
+    npuSuffix: '8elite',
   },
   {
-    identifier: 'gen2',
+    identifier: '8elite-gen5',
     displayName: 'Snapdragon 8 Elite Gen 5',
     socModel: 'SM8850',
+    npuSuffix: '8elite-gen5',
   },
 ] as const;
 
 /**
  * Build a HuggingFace download URL for a chip.
  * @param chip - The detected NPU chip
- * @param modelName - Model prefix (e.g. "qwen") → produces "qwen-gen1.zip"
+ * @param modelSlug - Model slug (e.g. "qwen3-4b") → produces
+ *   "qwen3-4b-genie-w4a16-8elite-gen5.tar.gz"
  */
-export function getNPUDownloadUrl(chip: NPUChip, modelName: string): string {
-  return `${NPU_BASE_URL}${modelName}-${chip.identifier}.zip?download=true`;
+export function getNPUDownloadUrl(chip: NPUChip, modelSlug: string): string {
+  return `${NPU_BASE_URL}${modelSlug}-genie-w4a16-${chip.npuSuffix}.tar.gz`;
 }
 
 /**