لماذا يعد نموذج OpenAI هو المعيار
تواجه صناعة الذكاء الاصطناعي تحديات فريدة لا تُغطيها نماذج فوترة SaaS التقليدية دائمًا. يحل نموذج OpenAI عدة من هذه المشكلات في آنٍ واحد.- إيرادات متوقعة ومخاطر منخفضة: من خلال اشتراط الأرصدة مسبقة الدفع لاستخدام واجهات برمجة التطبيقات، تزيل OpenAI مخاطر تراكم فواتير ضخمة لا يستطيع المستخدمون دفعها. تحصل على المال مقدمًا، ويحصل المستخدم على الخدمة أثناء استخدامه لها.
- قابلية التوسع للمطورين: شحن بقيمة $5 هو حاجز دخول منخفض. ومع نمو تطبيقاتهم، يمكن للمطورين أتمتة عمليات الشحن أو شراء مجموعات أكبر. الاحتكاك للبدء يكاد يكون معدومًا، لكن سقف النمو لا محدود.
- سيكولوجية المستخدم: تداول الأرصدة بعملة نقدية (دولار أمريكي) بدلًا من “الرموز” أو “النقاط” المجردة يجعل القيمة واضحة. يبدو الأمر كأنها حساب مصرفي لخدمات الذكاء الاصطناعي، مما يبني الثقة ويُسهل وضع الميزانية للشركات.
كيف تقوم OpenAI بالفوترة
تدير OpenAI نموذجين فريدين للفوترة يلبيان احتياجات مستخدمين مختلفين.- واجهة برمجة التطبيقات (الدفع عند الاستخدام): تستخدم الواجهة أرصدة مسبقة الدفع مقومة بالعملة النقدية. يُعيد المستخدم شحن حسابه بمبالغ $5 أو $10 أو $50 أو أكثر. تظهر هذه الأرصدة بقيمة الدولار لكنها لا تمتلك قيمة نقدية خارج OpenAI. تقوم OpenAI بالفوترة بناءً على كل رمز، بأسعار مختلفة لرموز الإدخال والإخراج. لا تنتهي صلاحية الأرصدة أبدًا، وعندما يصل رصيد المستخدم إلى $0، تتوقف مكالمات واجهة برمجة التطبيقات فورًا.
- ChatGPT Plus وTeam وEnterprise: هذه خطط اشتراك بسعر ثابت. تبلغ تكلفة ChatGPT Plus $20 شهريًا، بينما خطة الفريق $25 لكل مستخدم شهريًا. تحتوي هذه الخطط على حدود استخدام ناعمة حيث يتم تخفيض المستخدمين إلى نموذج أصغر بدلًا من الحظر.
- طبقات الأسعار المعتمدة على الإنفاق: كلما أنفقت المزيد من المال إجماليًا على مر الزمن، تفتح حدود معدلات أعلى لواجهة برمجة التطبيقات. هذا نظام توسيع وصول يعتمد على الثقة ويرتبط مباشرةً بتاريخ فواتيرك.
| النموذج | التسعير | رموز الإدخال | رموز الإخراج |
|---|---|---|---|
| GPT-4o | حسب الاستخدام | $2.50 / 1M | $10.00 / 1M |
| GPT-4o-mini | حسب الاستخدام | $0.15 / 1M | $0.60 / 1M |
| o1 | حسب الاستخدام | $15.00 / 1M | $60.00 / 1M |
| الخطة | السعر | النوع |
|---|---|---|
| مجاني | $0 | وصول محدود |
| Plus | $20 / شهريًا | اشتراك مع حدود ناعمة |
| Team | $25 / مستخدم / شهريًا | اشتراك لكل مقعد |
| Enterprise | مخصص | فوترة بالفاتورة |
ما الذي يجعله فريدًا
تتمتع استراتيجية فوترة OpenAI بعدة خصائص رئيسة تجعلها فعالة لخدمات الذكاء الاصطناعي.- الأرصدة المُقيمة بالعملة النقدية: تبدو الأرصدة وكأنها نقود لأنها مقيمة بالدولار الأمريكي. هذا يجعل التسعير شفافًا وسهل الفهم للمطورين.
- عدم انتهاء الصلاحية: تزيل الأرصدة التي لا تنتهي أبدًا ضغط “استخدمها أو خسرها”. يشعر المستخدمون بالراحة عند شحن مبالغ أكبر لأنهم يعلمون أن القيمة لن تختفي.
- القياس متعدد الأبعاد: يتم تتبع رموز الإدخال والإخراج بشكل منفصل لكن يتم خصمها من نفس الرصيد. هذا يسمح لـ OpenAI بتسعير رموز الإخراج المكلفة بشكل مختلف عن رموز الإدخال الأرخص.
- طبقات الثقة: ربط حدود المعدل بالإجمالي الذي أنفقته يشجع المستخدمين على البقاء على المنصة ويكافئ العملاء طويل الأمد بأداء أفضل.
المزايا الاستراتيجية
يخلق هذا النموذج حلقة نمو قوية. تكاليف الدخول المنخفضة تجذب المطورين. الأرصدة المسبقة توفر تدفقًا نقديًا فوريًا. يضمن التوسع القائم على الاستخدام أنه كلما نجح المطورون، نجحت OpenAI أيضًا. يوفر الجانب الخاص بالاشتراكات قاعدة إيرادات ثابتة ومتوقعة من غير المطورين.بناء هذا النموذج باستخدام Dodo Payments
يمكنك تكرار نموذج فوترة OpenAI باستخدام Dodo Payments. سنستخدم الفوترة القائمة على الأرصدة الائتمانية لواجهة برمجة التطبيقات والاشتراكات القياسية لجزء ChatGPT Plus.Create a Fiat Credit Entitlement
ابدأ بإنشاء استحقاق رصيد في لوحة تحكم Dodo Payments الخاصة بك. سيكون هذا بمثابة الرصيد المركزي لمستخدميك.
- نوع الرصيد: أرصدة بالعملة النقدية (USD)
- انتهاء صلاحية الرصيد: لا ينتهي
- الترحيل: غير مطلوب (لأنها لا تنتهي صلاحيتها)
- الزيادة: معطلة تعطيل الزيادة يضمن أن مكالمات واجهة برمجة التطبيقات تفشل عند وصول الرصيد إلى $0، تمامًا كما تفعل OpenAI.
Create Top-Up Products
أنشئ منتجات دفع لمرة واحدة لحزم الرصيد المختلفة. قد تعرض خيارات بقيمة $5 و $10 و $50 و $100. اربط استحقاق الرصيد النقدي بكل منتج.
حدد الأرصدة المصدرة لكل منتج بالسنتات. لحزمة بقيمة $50، ستصدر 5000 رصيد.
Create Usage Meters
أنشئ عدادين منفصلين لتتبع استخدام الرموز.
llm.input_tokens: تجميع مجموع على الخاصيةtokens.llm.output_tokens: تجميع مجموع على الخاصيةtokens. اربط العدادين باستحقاق الرصيد النقدي الخاص بك. ستحتاج إلى تكوين “وحدات العداد لكل رصيد” لكل منهما.
حساب وحدات العداد لكل رصيد
لمطابقة تسعير GPT-4o الخاص بـ OpenAI ($2.50 لكل 1M رمز إدخال)، تحتاج إلى حساب عدد الرموز التي تساوي $1 (100 سنت).- رموز الإدخال: 1,000,000 رمز / $2.50 = 400,000 رمز لكل $1.
- رموز الإخراج: 1,000,000 رمز / $10.00 = 100,000 رمز لكل $1. في لوحة Dodo، ستقوم بتعيين “وحدات العداد لكل رصيد” إلى 400,000 للإدخال و100,000 للإخراج.
Send Usage Events
بعد كل طلب لـ LLM، أرسل بيانات الاستخدام إلى Dodo Payments. يمكنك إرسال أحداث الإدخال والإخراج في طلب واحد.
Handle Balance Depletion
يجب عليك التحقق من رصيد المستخدم قبل معالجة طلب واجهة برمجة التطبيقات. إذا كان الرصيد صفرًا أو سالبًا، أعد خطأ 402.
معالجة ويب هوك انخفاض الرصيد
لا تنتظر حتى يصل المستخدم إلى $0 لإبلاغه. استخدم ويب هوكس لبدء رسالة بريد إلكتروني أو إشعار داخل التطبيق عندما ينخفض رصيده تحت عتبة معينة.Build the ChatGPT Subscription Side (Optional)
إذا أردت تقديم خطة اشتراك مثل ChatGPT Plus، أنشئ منتج اشتراك منفصل في Dodo Payments. هذه لا تحتاج إلى استحقاقات رصيد.
لخطة Team، استخدم فوترة تستند إلى المقاعد بإضافة ملحقات لكل مستخدم إضافي.
تنفيذ الحدود الناعمة
لتكرار الحدود الناعمة الخاصة بـ OpenAI، يمكنك تتبع استخدام مشتركيك باستخدام نفس العدادات ولكن بدون ربطها باستحقاق الرصيد. في منطق التطبيق، تحقق من الاستخدام للفترة المالية الحالية.سرّع باستخدام مخطط إدخال LLM
تُظهر الخطوات أعلاه كيفية بناء وإرسال أحداث الاستخدام يدويًا. بالنسبة لنشر الإنتاج، يوفر LLM Ingestion Blueprint تتبعًا تلقائيًا للرموز يلتف حول عميل OpenAI الخاص بك مباشرةً.inputTokens وoutputTokens وtotalTokens من كل استجابة لواجهة برمجة التطبيقات ويرسلها كبيانات وصفية للحدث. قم بتكوين العداد الخاص بك لتجميع الخاصية المناسبة للرموز.
تنفيذ طبقات الأسعار المعتمدة على الإنفاق
تشكل طبقات الأسعار لدى OpenAI وسيلة قوية لإدارة السعة. يمكنك تنفيذ ذلك من خلال تتبع إجمالي إنفاق العميل طوال الحياة.- تتبع الإنفاق طوال الحياة: استمع إلى ويب هوكس
payment.succeededوقم بتحديث حقلtotal_spendفي قاعدة بياناتك لذلك العميل. - تعريف الطبقات: أنشئ خريطة تربط مبالغ الإنفاق بحدود المعدل.
- الطبقة 1: إنفاق $0 - $50 -> 3 طلبات في الدقيقة
- الطبقة 2: إنفاق $50 - $250 -> 10 طلبات في الدقيقة
- الطبقة 3: إنفاق $250+ -> 50 طلبًا في الدقيقة
- فرض الحدود: في طبقة الوسيط لواجهة برمجة التطبيقات، تحقق من طبقة العميل وطبق حد المعدل المقابل.
مثال تنفيذ كامل: الوكيل الخاص بواجهة برمجة التطبيقات
في سيناريو واقعي، من المحتمل أن يكون لديك وكيل لواجهة برمجة التطبيقات يتوسط بين مستخدميك ومزود LLM. يتولى هذا الوكيل المصادقة والتحقق من الأرصدة والإبلاغ عن الاستخدام.التعامل مع الحالات الخاصة
عند بناء نظام فوترة معقد مثل نظام OpenAI، ستواجه العديد من الحالات الخاصة التي تحتاج إلى تعامل دقيق.حالات التنافس
إذا كان لدى المستخدم رصيد منخفض جدًا وأرسل عدة طلبات في نفس الوقت، فقد يتجاوز حد الرصيد قبل معالجة الحدث الأول. لمنع ذلك، يمكنك تنفيذ “وسادة” صغيرة أو استخدام قفل موزع على رصيد العميل أثناء الطلب.تأخر امتصاص الأحداث
تعالج Dodo Payments الأحداث بشكل غير متزامن. وهذا يعني أنه قد يكون هناك تأخير بسيط بين نداء واجهة برمجة التطبيقات وخصم الرصيد. بالنسبة لمعظم الحالات، هذا مقبول. إذا كنت تحتاج إلى تطبيق صارم في الوقت الحقيقي، يمكنك الحفاظ على ذاكرة تخزين محلية لرصيد المستخدم وتحديثها بتفاؤل.معالجة الاسترداد
إذا قمت برد عملية شراء حزمة رصيد، ستتعامل Dodo Payments تلقائيًا مع استحقاق الرصيد إذا تم تكوينه. ومع ذلك، يجب أن تضمن أن منطق التطبيق يعكس هذا التغيير فورًا لمنع المستخدمين من استخدام أرصدة لم يعودوا يمتلكونها.دعم النماذج المتعددة
إذا كنت تدعم نماذج متعددة بأسعار مختلفة، أمامك خياران:- عدادات منفصلة: أنشئ عدادات منفصلة لكل نموذج (مثل
gpt-4o.input_tokensوgpt-4o-mini.input_tokens). - الأحداث الموزونة: استخدم عدادًا واحدًا لكن اضرب القيمة
tokensفي وزن قبل إرسالها إلى Dodo. على سبيل المثال، إذا كان GPT-4o أغلى بعشرة أضعاف من GPT-4o-mini، يمكنك إرسال 10 أضعاف الرموز لطلبات GPT-4o.
نظرة عامة على البنية
تقوم العدادات بتتبع الرموز وخصم القيمة المقابلة من رصيد المستخدم بناءً على الأسعار التي قمت بتكوينها.الخاتمة
إعادة إنشاء نموذج فوترة OpenAI باستخدام Dodo Payments يمنحك أفضل ما في العالمين: مرونة الفوترة القائمة على الاستخدام وتوقعية الأرصدة المسبقة الدفع. من خلال اتباع هذا الدليل، يمكنك بناء نظام فوترة يتوسع مع مستخدميك مع حماية هوامشك. سواء كنت تبني LLM القادم أو أداة ذكاء اصطناعي متخصصة، ستساعدك هذه الأنماط على إنشاء تجربة احترافية صديقة للمطورين. يضمن هذا النهج أن تكون بنيتك التحتية للفوترة قابلة للتوسع وموثوقة مثل نماذج الذكاء الاصطناعي التي تقدمها لعملائك.الميزات الرئيسية في Dodo المستخدمة
استكشف الميزات التي تجعل هذا التنفيذ ممكنًا.Credit-Based Billing
إدارة الأرصدة النقدية المسبقة والاستحقاقات لمستخدميك.
Usage-Based Billing
تتبع الاستخدام المفصل مثل الرموز واحتساب الفواتير في الوقت الفعلي.
One-Time Payments
بيع حزم الرصيد وإعادة الشحن بتجربة دفع بسيطة.
Event Ingestion
إرسال بيانات الاستخدام ذات الحجم الكبير إلى Dodo Payments بسهولة.
Webhooks
البقاء على اطلاع بتغيرات الرصيد والتنبيهات عند انخفاضه.
LLM Ingestion Blueprint
تتبع تلقائي للرموز لـ OpenAI ومزودي LLM الآخرين.
Race Conditions
If a user has a very low balance and sends multiple requests simultaneously, they might exceed their credit limit before the first event is processed. To prevent this, you can implement a small “buffer” or use a distributed lock on the customer’s balance during the request.Event Ingestion Latency
Dodo Payments processes events asynchronously. This means there might be a slight delay between an API call and the credit deduction. For most use cases, this is acceptable. If you need strict real-time enforcement, you can maintain a local cache of the user’s balance and update it optimistically.Refund Handling
If you refund a credit pack purchase, Dodo Payments will automatically handle the credit entitlement if configured. However, you should ensure your application logic reflects this change immediately to prevent users from using credits they no longer have.Multi-Model Support
If you support multiple models with different pricing, you have two options:- Separate Meters: Create separate meters for each model (e.g.,
gpt-4o.input_tokens,gpt-4o-mini.input_tokens). - Weighted Events: Use a single meter but multiply the
tokensvalue by a weight before sending it to Dodo. For example, if GPT-4o is 10x more expensive than GPT-4o-mini, you could send 10x the tokens for GPT-4o requests.
Architecture Overview
The meters track tokens and deduct the corresponding value from the user’s credit balance based on your configured rates.Conclusion
Replicating OpenAI’s billing model with Dodo Payments gives you the best of both worlds: the flexibility of usage-based billing and the predictability of prepaid credits. By following this guide, you can build a billing system that scales with your users while protecting your margins. Whether you’re building the next big LLM or a niche AI tool, these patterns will help you create a professional, developer-friendly experience. This approach ensures that your billing infrastructure is as scalable and reliable as the AI models you’re delivering to your customers.Key Dodo Features Used
Explore the features that make this implementation possible.Credit-Based Billing
Manage prepaid fiat credits and entitlements for your users.
Usage-Based Billing
Track granular usage like tokens and bill for it in real-time.
One-Time Payments
Sell credit packs and top-ups with a simple checkout flow.
Event Ingestion
Send high-volume usage data to Dodo Payments with ease.
Webhooks
Stay updated on credit balance changes and low balance alerts.
LLM Ingestion Blueprint
Automatic token tracking for OpenAI and other LLM providers.