Perché il modello di OpenAI è lo standard
L’industria dell’AI affronta sfide uniche che la fatturazione SaaS tradizionale non sempre risolve. Il modello di OpenAI risolve diversi di questi problemi contemporaneamente.- Entrate prevedibili e basso rischio: richiedendo crediti prepagati per l’utilizzo dell’API, OpenAI elimina il rischio che gli utenti accumulino bollette ingenti che non possono pagare. Ottieni i soldi in anticipo e l’utente ottiene il servizio mentre lo utilizza.
- Scalabilità per gli sviluppatori: un top-up da 5 $ è una barriera di ingresso bassa. Man mano che l’applicazione cresce, gli sviluppatori possono automatizzare i ricarichi o acquistare pacchetti più grandi. La frizione per iniziare è quasi zero, ma il limite per la crescita è illimitato.
- Psicologia dell’utente: denominare i crediti in valuta fiat (USD) invece di “token” o “punti” astratti rende il valore chiaro. Si percepisce come un conto bancario per i servizi AI, il che costruisce fiducia e rende più semplice il budgeting per le aziende.
Come fattura OpenAI
OpenAI adotta due modelli di fatturazione distinti pensati per bisogni utente differenti.- API (Pay-as-you-go): l’API utilizza crediti prepagati denominati in valuta fiat. Gli utenti ricaricano i propri conti con 5 $, 10 $, 50 $ o più. Questi crediti mostrano un valore in dollari ma non hanno valore monetario al di fuori di OpenAI. OpenAI fattura per token con tariffe diverse per i token in ingresso e in uscita. I crediti non scadono mai e quando il saldo dell’utente arriva a 0 $, le chiamate API falliscono immediatamente.
- ChatGPT Plus, Team e Enterprise: sono abbonamenti a tariffa fissa. ChatGPT Plus costa 20 $ al mese, mentre il piano Team costa 25 $ per utente al mese. Questi piani hanno limiti di utilizzo morbidi in cui agli utenti viene assegnato un modello più piccolo invece di essere bloccati.
- Fasce tariffarie basate sulla spesa: man mano che spendi più soldi nel tempo, sblocchi limiti di velocità API più elevati. Si tratta di un sistema di scalabilità dell’accesso basato sulla fiducia legato direttamente alla tua storia di fatturazione.
| Modello | Prezzi | Token in ingresso | Token in uscita |
|---|---|---|---|
| GPT-4o | Basato sull’utilizzo | 2,50 $ / 1M | 10,00 $ / 1M |
| GPT-4o-mini | Basato sull’utilizzo | 0,15 $ / 1M | 0,60 $ / 1M |
| o1 | Basato sull’utilizzo | 15,00 $ / 1M | 60,00 $ / 1M |
| Piano | Prezzo | Tipo |
|---|---|---|
| Free | 0 $ | Accesso limitato |
| Plus | 20 $ / mese | Abbonamento con limiti morbidi |
| Team | 25 $ / utente / mese | Abbonamento per postazione |
| Enterprise | Personalizzato | Fatturazione su fattura |
Cosa lo rende unico
La strategia di fatturazione di OpenAI ha diverse caratteristiche chiave che la rendono efficace per i servizi AI.- Crediti denominati in valuta fiat: i crediti si percepiscono come denaro perché sono espressi in USD. Questo rende i prezzi trasparenti e facili da comprendere per gli sviluppatori.
- Nessuna scadenza: saldi che non scadono mai riducono la pressione del “usali o li perdi”. Gli utenti si sentono a proprio agio nel ricaricare cifre maggiori perché sanno che il valore non scomparirà.
- Misurazione multidimensionale: i token in ingresso e in uscita vengono tracciati separatamente ma detratti dallo stesso saldo di credito. Questo permette a OpenAI di prezzi diversi per i token di uscita più costosi rispetto a quelli di ingresso più economici.
- Livelli di fiducia: collegare i limiti di velocità alla spesa totale incoraggia gli utenti a restare sulla piattaforma e premia i clienti a lungo termine con prestazioni migliori.
Vantaggi strategici
Questo modello crea una potente ruota di rinforzo. I costi di ingresso bassi attirano gli sviluppatori. I crediti prepagati forniscono liquidità immediata. La scalabilità basata sull’utilizzo garantisce che, quando gli sviluppatori hanno successo, anche OpenAI abbia successo. Il lato abbonamento fornisce una base di entrate stabile e prevedibile proveniente da utenti non sviluppatori.Costruisci questo con Dodo Payments
Puoi replicare il modello di fatturazione di OpenAI usando Dodo Payments. Useremo Credit-Based Billing per l’API e abbonamenti standard per la parte ChatGPT Plus.Create a Fiat Credit Entitlement
Inizia creando un diritto al credito nel tuo cruscotto Dodo Payments. Questo agirà come saldo centrale per i tuoi utenti.
- Tipo di credito: Crediti fiat (USD)
- Scadenza del credito: Mai
- Rollover: Non necessario (dato che non scadono)
- Overage: Disabilitato
Create Top-Up Products
Crea prodotti di pagamento una tantum per diversi pacchetti di credito. Potresti offrire opzioni da 5 $, 10 $, 50 $ e 100 $. Collega l’assegnazione di credito fiat a ciascun prodotto.Imposta i crediti erogati per prodotto in centesimi. Per un pacchetto da 50 $, erogherai 5000 crediti.
Create Usage Meters
Crea due contatori separati per tracciare l’utilizzo dei token.
llm.input_tokens: aggregazione Sum sulla proprietàtokens.llm.output_tokens: aggregazione Sum sulla proprietàtokens. Collega entrambi i contatori al diritto al credito fiat. Sarà necessario configurare le “Unità del contatore per credito” per ciascuno.
Calcolo delle unità del contatore per credito
Per eguagliare il prezzo GPT-4o di OpenAI (2,50 $ per 1M di token in ingresso), devi calcolare quanti token corrispondono a 1 $ (100 centesimi).- Token in ingresso: 1.000.000 token / 2,50 $ = 400.000 token per 1 $.
- Token in uscita: 1.000.000 token / 10,00 $ = 100.000 token per 1 $. Nel cruscotto Dodo imposteresti le “Unità del contatore per credito” a 400.000 per l’ingresso e a 100.000 per l’uscita.
Send Usage Events
Dopo ogni richiesta LLM, invia i dati di utilizzo a Dodo Payments. Puoi inviare sia gli eventi di ingresso che di uscita in una singola richiesta.
Handle Balance Depletion
Dovresti controllare il saldo dell’utente prima di elaborare una richiesta API. Se il saldo è zero o negativo, restituisci un errore 402.
Gestione dei webhook per saldo basso
Non aspettare che l’utente arrivi a 0 $ per avvisarlo. Usa webhook per attivare un’email o una notifica in-app quando il saldo scende sotto una certa soglia.Build the ChatGPT Subscription Side (Optional)
Se vuoi offrire un piano in abbonamento come ChatGPT Plus, crea un prodotto di abbonamento separato in Dodo Payments. Questi non necessitano di assegnazioni di credito.
Per un piano Team, utilizza la fatturazione basata sui posti aggiungendo add-on per ogni utente aggiuntivo.
Implementare limiti morbidi
Per replicare i limiti morbidi di OpenAI, puoi tracciare l’utilizzo per i tuoi utenti in abbonamento usando gli stessi contatori ma senza collegarli a un diritto al credito. Nella logica applicativa, controlla l’utilizzo per l’attuale periodo di fatturazione.Accelera con il blueprint LLM Ingestion
I passaggi sopra mostrano come costruire manualmente e inviare eventi di utilizzo. Per implementazioni in produzione, il LLM Ingestion Blueprint fornisce un tracciamento automatico dei token che avvolge direttamente il tuo client OpenAI.inputTokens, outputTokens e totalTokens da ogni risposta API e li invia come metadati dell’evento. Configura il tuo contatore per aggregare sulla proprietà token appropriata.
Implementare fasce tariffarie basate sulla spesa
Le fasce tariffarie di OpenAI sono un modo potente per gestire la capacità. Puoi implementarlo tracciando la spesa totale a vita di un cliente.- Monitora la spesa a vita: Ascolta i webhook
payment.succeedede aggiorna un campototal_spendnel tuo database per quel cliente. - Definisci le fasce: Crea una mappatura degli importi spesi ai limiti di velocità.
- Fascia 1: spesa 0 $ - 50 $ -> 3 RPM
- Fascia 2: spesa 50 $ - 250 $ -> 10 RPM
- Fascia 3: spesa superiore a 250 $ -> 50 RPM
- Applica i limiti: Nel middleware API, controlla la fascia del cliente e applica il limite di velocità corrispondente.
Esempio di implementazione completa: il proxy API
In uno scenario reale, avrai probabilmente un proxy API che si interpone tra i tuoi utenti e il provider LLM. Questo proxy gestisce l’autenticazione, i controlli di credito e la segnalazione dell’utilizzo.Gestione dei casi limite
Quando costruisci un sistema di fatturazione complesso come quello di OpenAI, incontrerai diversi casi limite che richiedono attenzione.Condizioni di gara
Se un utente ha un saldo molto basso e invia più richieste simultaneamente, potrebbe superare il limite di credito prima che il primo evento venga elaborato. Per evitarlo, puoi implementare un piccolo “buffer” o usare un lock distribuito sul saldo del cliente durante la richiesta.Latenza nell’ingestione degli eventi
Dodo Payments elabora gli eventi in modo asincrono. Ciò significa che potrebbe esserci un leggero ritardo tra una chiamata API e la detrazione del credito. Per la maggior parte dei casi d’uso, questo è accettabile. Se hai bisogno di un’applicazione in tempo reale rigorosa, puoi mantenere una cache locale del saldo dell’utente e aggiornarla in modo ottimistico.Gestione dei rimborsi
Se rimborsi l’acquisto di un pacchetto di credito, Dodo Payments gestirà automaticamente il diritto al credito se configurato. Tuttavia, dovresti assicurarti che la logica applicativa rifletta immediatamente questa modifica per evitare che gli utenti utilizzino crediti che non possiedono più.Supporto multi-modello
Se supporti più modelli con prezzi diversi, hai due opzioni:- Contatori separati: crea contatori separati per ogni modello (ad esempio
gpt-4o.input_tokens,gpt-4o-mini.input_tokens). - Eventi ponderati: usa un unico contatore ma moltiplica il valore
tokensper un peso prima di inviarlo a Dodo. Ad esempio, se GPT-4o costa 10 volte più di GPT-4o-mini, potresti inviare 10 volte i token per le richieste GPT-4o. OpenAI utilizza internamente l’approccio dei contatori separati per mantenere registrazioni chiare dell’utilizzo per modello.
Panoramica architetturale
I contatori tracciano i token e detrattono il valore corrispondente dal saldo di credito dell’utente in base alle tariffe configurate.Conclusione
Replicare il modello di fatturazione di OpenAI con Dodo Payments ti offre il meglio di entrambi i mondi: la flessibilità della fatturazione basata sull’utilizzo e la prevedibilità dei crediti prepagati. Seguendo questa guida, puoi costruire un sistema di fatturazione che scala con i tuoi utenti proteggendo i tuoi margini. Che tu stia costruendo il prossimo grande LLM o uno strumento AI di nicchia, questi modelli ti aiuteranno a creare un’esperienza professionale e orientata agli sviluppatori. Questo approccio garantisce che la tua infrastruttura di fatturazione sia scalabile e affidabile quanto i modelli AI che offri ai tuoi clienti.Principali funzionalità Dodo utilizzate
Esplora le funzionalità che rendono possibile questa implementazione.Credit-Based Billing
Gestisci crediti fiat prepagati e assegnazioni per i tuoi utenti.
Usage-Based Billing
Traccia l’utilizzo granulare come i token e fatturalo in tempo reale.
One-Time Payments
Vendi pacchetti di credito e ricariche con un flusso di checkout semplice.
Event Ingestion
Invia facilmente dati di utilizzo ad alto volume a Dodo Payments.
Webhooks
Rimani aggiornato sui cambiamenti del saldo credito e sugli avvisi di saldo basso.
LLM Ingestion Blueprint
Tracciamento automatico dei token per OpenAI e altri provider LLM.
Conclusion
Replicating OpenAI’s billing model with Dodo Payments gives you the best of both worlds: the flexibility of usage-based billing and the predictability of prepaid credits. By following this guide, you can build a billing system that scales with your users while protecting your margins. Whether you’re building the next big LLM or a niche AI tool, these patterns will help you create a professional, developer-friendly experience. This approach ensures that your billing infrastructure is as scalable and reliable as the AI models you’re delivering to your customers.Key Dodo Features Used
Explore the features that make this implementation possible.Credit-Based Billing
Manage prepaid fiat credits and entitlements for your users.
Usage-Based Billing
Track granular usage like tokens and bill for it in real-time.
One-Time Payments
Sell credit packs and top-ups with a simple checkout flow.
Event Ingestion
Send high-volume usage data to Dodo Payments with ease.
Webhooks
Stay updated on credit balance changes and low balance alerts.
LLM Ingestion Blueprint
Automatic token tracking for OpenAI and other LLM providers.