Kalkulator Kos NVIDIA Llama 3.3 Nemotron Super 49B V1.5

Model: NVIDIA: Llama 3.3 Nemotron Super 49B V1.5, Konteks: 131072, Kos: $0.1 setiap 1 Juta token input, $0.4 setiap 1 Juta token output

Nota: Pengiraan adalah anggaran berdasarkan data awam. Harga mungkin berubah, semak laman web rasmi.

Kalkulator ini mengira kos penggunaan model Llama-3.3-Nemotron-Super-49B-v1.5. Model ini ialah model penaakulan/sembang berparameter 49B, berpusatkan bahasa Inggeris yang diubah suai daripada Meta Llama-3.3-70B-Instruct dengan konteks 128K. Ia sesuai untuk aliran kerja ejen (RAG, panggilan alat) melalui SFT merentasi matematik, kod, sains dan sembang berbilang giliran, diikuti oleh pelbagai peringkat RL.

Formula pengiraan kos adalah seperti berikut:

  • Kos Input = (Bilangan Token Input / 1,000,000) * Kos per 1 Juta Token Input
  • Kos Output = (Bilangan Token Output / 1,000,000) * Kos per 1 Juta Token Output
  • Jumlah Kos = (Kos Input + Kos Output) * Bilangan Permintaan

Di mana:

  • Kos per 1 Juta Token Input: $0.1
  • Kos per 1 Juta Token Output: $0.4
  • Konteks Model: 131,072 token

Contoh Pengiraan:

Katakan anda menggunakan 150,000 token input dan 75,000 token output untuk 10 permintaan:

  1. Kos input = (150,000 / 1,000,000) * $0.1 = $0.015
  2. Kos output = (75,000 / 1,000,000) * $0.4 = $0.03
  3. Jumlah Kos = ($0.015 + $0.03) * 10 = $0.45

Dengan kalkulator ini, anda boleh menentukan anggaran kos berdasarkan token input dan output serta bilangan permintaan.