Tại sao mô hình của OpenAI là tiêu chuẩn
Ngành công nghiệp AI đối mặt với những thách thức riêng mà các mô hình thanh toán SaaS truyền thống không phải lúc nào cũng giải quyết được. Mô hình của OpenAI đồng thời giải quyết nhiều vấn đề này.- Doanh thu dự đoán và rủi ro thấp: Bằng cách yêu cầu tín dụng trả trước cho việc sử dụng API, OpenAI loại bỏ rủi ro người dùng tạo ra hóa đơn khổng lồ mà không thể trả. Bạn nhận được tiền trước, và người dùng dùng dịch vụ khi họ sử dụng.
- Khả năng mở rộng cho nhà phát triển: Việc nạp lại $5 là rào cản thấp để bắt đầu. Khi ứng dụng phát triển, nhà phát triển có thể tự động nạp lại hoặc mua gói lớn hơn. Các bước bắt đầu gần như bằng không, nhưng giới hạn để mở rộng thì không giới hạn.
- Tâm lý người dùng: Việc quy đổi tín dụng theo tiền tệ (USD) thay vì các “token” hay “điểm” trừu tượng khiến giá trị trở nên rõ ràng. Nó giống như một tài khoản ngân hàng dành cho dịch vụ AI, giúp xây dựng niềm tin và dễ lập ngân sách hơn cho các công ty.
Cách OpenAI lập hóa đơn
OpenAI vận hành hai mô hình thanh toán khác biệt để phục vụ các nhu cầu người dùng khác nhau.- API (Trả tiền theo mức sử dụng): API sử dụng tín dụng trả trước quy đổi theo tiền tệ fiat. Người dùng nạp tiền vào tài khoản với các mức $5, $10, $50 hoặc lớn hơn. Những tín dụng này hiển thị giá trị bằng đô la nhưng không có giá trị tiền tệ bên ngoài OpenAI. OpenAI lập hóa đơn theo token với các mức giá khác nhau cho token đầu vào và đầu ra. Tín dụng không bao giờ hết hạn, và khi số dư người dùng về $0, các cuộc gọi API sẽ thất bại ngay lập tức.
- ChatGPT Plus, Team và Enterprise: Đây là các gói đăng ký với mức phí cố định. ChatGPT Plus có giá $20 mỗi tháng, trong khi gói Team là $25 cho mỗi người dùng mỗi tháng. Các gói này có ngưỡng sử dụng mềm, nơi người dùng bị giảm cấp xuống mô hình nhỏ hơn thay vì bị chặn hoàn toàn.
- Các tầng mức giới hạn dựa trên chi tiêu: Khi bạn chi nhiều tiền hơn theo thời gian, bạn mở khóa giới hạn tỷ lệ API cao hơn. Đây là hệ thống mở rộng truy cập dựa trên niềm tin gắn trực tiếp với lịch sử thanh toán của bạn.
| Mô hình | Giá | Token đầu vào | Token đầu ra |
|---|---|---|---|
| GPT-4o | Dựa trên mức sử dụng | $2.50 / 1M | $10.00 / 1M |
| GPT-4o-mini | Dựa trên mức sử dụng | $0.15 / 1M | $0.60 / 1M |
| o1 | Dựa trên mức sử dụng | $15.00 / 1M | $60.00 / 1M |
| Gói | Giá | Loại |
|---|---|---|
| Free | $0 | Truy cập giới hạn |
| Plus | $20 / tháng | Đăng ký với ngưỡng mềm |
| Team | $25 / người dùng / tháng | Đăng ký theo ghế |
| Enterprise | Tùy chỉnh | Thanh toán bằng hóa đơn |
Những điểm độc đáo
Chiến lược thanh toán của OpenAI có một số đặc điểm chính khiến nó hiệu quả đối với dịch vụ AI.- Tín dụng quy đổi theo tiền tệ: Tín dụng cảm giác giống tiền vì được quy đổi theo USD. Điều này khiến giá cả minh bạch và dễ hiểu đối với các nhà phát triển.
- Không hết hạn: Số dư không bao giờ hết hạn giảm áp lực “dùng ngay hoặc mất”. Người dùng cảm thấy thoải mái khi nạp số tiền lớn hơn vì biết giá trị không biến mất.
- Đo lường đa chiều: Token đầu vào và đầu ra được theo dõi riêng nhưng trừ vào cùng một số dư tín dụng. Điều này cho phép OpenAI định giá token đầu ra đắt hơn khác với token đầu vào rẻ hơn.
- Các tầng mức tin cậy: Liên kết giới hạn tỷ lệ với tổng chi tiêu khuyến khích người dùng ở lại nền tảng và thưởng cho khách hàng dài hạn bằng hiệu suất tốt hơn.
Lợi thế chiến lược
Mô hình này tạo ra một vòng xoáy mạnh mẽ. Chi phí đầu vào thấp thu hút nhà phát triển. Tín dụng trả trước cung cấp dòng tiền ngay. Mở rộng theo mức sử dụng đảm bảo khi nhà phát triển thành công, OpenAI cũng thành công. Phần đăng ký cung cấp nền doanh thu ổn định và dự đoán được từ người dùng không phải nhà phát triển.Xây dựng điều này với Dodo Payments
Bạn có thể tái tạo mô hình thanh toán của OpenAI bằng Dodo Payments. Chúng ta sẽ dùng Credit-Based Billing cho API và các gói đăng ký tiêu chuẩn cho phía ChatGPT Plus.Create a Fiat Credit Entitlement
Bắt đầu bằng cách tạo một quyền lợi tín dụng trong bảng điều khiển Dodo Payments của bạn. Đây sẽ là số dư trung tâm cho người dùng của bạn.
- Loại tín dụng: Tín dụng Fiat (USD)
- Hạn dùng tín dụng: Không bao giờ
- Chuyển tiếp: Không cần (vì chúng không bao giờ hết hạn)
- Vượt hạn: Tắt
Create Top-Up Products
Tạo các sản phẩm thanh toán một lần cho các gói tín dụng khác nhau. Bạn có thể cung cấp các lựa chọn $5, $10, $50 và $100. Gắn quyền lợi tín dụng fiat của bạn vào từng sản phẩm.Đặt số tín dụng cấp phát mỗi sản phẩm theo đơn vị xu. Với gói $50, bạn sẽ cấp 5000 tín dụng.
Create Usage Meters
Tạo hai bộ đo riêng biệt để theo dõi việc sử dụng token.
llm.input_tokens: Tính tổng trên thuộc tínhtokens.llm.output_tokens: Tính tổng trên thuộc tínhtokens. Kết nối cả hai bộ đo với quyền lợi tín dụng fiat của bạn. Bạn sẽ cần cấu hình “Đơn vị bộ đo trên mỗi tín dụng” cho từng bộ.
Tính toán Đơn vị bộ đo trên mỗi tín dụng
Để khớp với giá GPT-4o của OpenAI ($2.50 cho 1M token đầu vào), bạn cần tính xem bao nhiêu token tương ứng với $1 (100 xu).- Token đầu vào: 1.000.000 token / $2.50 = 400.000 token cho $1.
- Token đầu ra: 1.000.000 token / $10.00 = 100.000 token cho $1. Trong bảng Dodo, bạn sẽ đặt “Đơn vị bộ đo trên mỗi tín dụng” là 400.000 cho đầu vào và 100.000 cho đầu ra.
Send Usage Events
Sau mỗi yêu cầu LLM, gửi dữ liệu sử dụng về Dodo Payments. Bạn có thể gửi cả sự kiện đầu vào và đầu ra trong cùng một yêu cầu.
Handle Balance Depletion
Bạn nên kiểm tra số dư người dùng trước khi xử lý yêu cầu API. Nếu số dư bằng hoặc thấp hơn 0, trả về lỗi 402.
Xử lý webhook khi số dư thấp
Đừng đợi đến khi người dùng chạm $0 mới thông báo cho họ. Dùng webhook để kích hoạt email hoặc thông báo trong ứng dụng khi số dư của họ giảm xuống dưới ngưỡng nhất định.Build the ChatGPT Subscription Side (Optional)
Nếu bạn muốn cung cấp gói đăng ký như ChatGPT Plus, hãy tạo một sản phẩm đăng ký riêng trong Dodo Payments. Những sản phẩm này không cần quyền lợi tín dụng.
Với gói Team, sử dụng thanh toán theo ghế bằng cách thêm phần mở rộng cho mỗi người dùng bổ sung.
Triển khai ngưỡng mềm
Để sao chép các ngưỡng mềm của OpenAI, bạn có thể theo dõi mức sử dụng của người dùng đăng ký bằng cùng các bộ đo nhưng không liên kết với quyền lợi tín dụng. Trong logic ứng dụng, kiểm tra mức sử dụng trong kỳ thanh toán hiện tại.Tăng tốc với LLM Ingestion Blueprint
Các bước ở trên cho thấy cách thủ công xây dựng và gửi các sự kiện sử dụng. Đối với triển khai sản xuất, LLM Ingestion Blueprint cung cấp theo dõi token tự động gói trực tiếp client OpenAI của bạn.inputTokens, outputTokens và totalTokens từ mọi phản hồi API và gửi chúng dưới dạng siêu dữ liệu sự kiện. Cấu hình bộ đo của bạn để tổng hợp theo thuộc tính token phù hợp.
Triển khai các tầng giới hạn dựa trên chi tiêu
Các tầng giới hạn của OpenAI là cách mạnh mẽ để quản lý năng lực. Bạn có thể triển khai điều này bằng cách theo dõi tổng chi tiêu suốt đời của khách hàng.- Theo dõi chi tiêu suốt đời: Lắng nghe webhook
payment.succeededvà cập nhật trườngtotal_spendtrong cơ sở dữ liệu cho khách hàng đó. - Định nghĩa các tầng: Tạo ánh xạ từ mức chi tiêu đến giới hạn tỷ lệ.
- Tầng 1: chi tiêu $0 - $50 -> 3 RPM
- Tầng 2: chi tiêu $50 - $250 -> 10 RPM
- Tầng 3: chi tiêu $250+ -> 50 RPM
- Thực thi giới hạn: Trong middleware API của bạn, kiểm tra tầng của khách hàng và áp dụng giới hạn tỷ lệ tương ứng.
Ví dụ triển khai đầy đủ: Proxy API
Trong kịch bản thực tế, bạn có thể có một proxy API đứng giữa người dùng và nhà cung cấp LLM. Proxy này xử lý xác thực, kiểm tra tín dụng và báo cáo sử dụng.Xử lý các trường hợp ngoại lệ
Khi xây dựng một hệ thống thanh toán phức tạp như OpenAI, bạn sẽ gặp một số trường hợp ngoại lệ cần xử lý cẩn thận.Điều kiện đua
Nếu người dùng có số dư rất thấp và gửi nhiều yêu cầu đồng thời, họ có thể vượt quá giới hạn tín dụng trước khi sự kiện đầu tiên được xử lý. Để ngăn chặn điều này, bạn có thể triển khai một “bộ đệm” nhỏ hoặc sử dụng khóa phân tán trên số dư khách hàng trong quá trình xử lý yêu cầu.Độ trễ hập dữ liệu sự kiện
Dodo Payments xử lý sự kiện bất đồng bộ. Điều này có nghĩa đôi khi có độ trễ nhỏ giữa cuộc gọi API và việc trừ tín dụng. Với hầu hết trường hợp sử dụng, điều này là chấp nhận được. Nếu bạn cần thực thi thời gian thực nghiêm ngặt, bạn có thể duy trì bộ nhớ đệm cục bộ số dư người dùng và cập nhật một cách lạc quan.Xử lý hoàn tiền
Nếu bạn hoàn tiền cho việc mua gói tín dụng, Dodo Payments sẽ xử lý quyền lợi tín dụng đó tự động nếu được cấu hình. Tuy nhiên, bạn nên đảm bảo logic ứng dụng phản ánh thay đổi này ngay lập tức để ngăn người dùng sử dụng tín dụng họ không còn có.Hỗ trợ đa mô hình
Nếu bạn hỗ trợ nhiều mô hình với định giá khác nhau, bạn có hai lựa chọn:- Các bộ đo riêng biệt: Tạo các bộ đo riêng cho từng mô hình (ví dụ:
gpt-4o.input_tokens,gpt-4o-mini.input_tokens). - Sự kiện cân bằng: Dùng một bộ đo duy nhất nhưng nhân giá trị
tokensvới trọng số trước khi gửi đến Dodo. Ví dụ, nếu GPT-4o đắt gấp 10 lần GPT-4o-mini, bạn có thể gửi 10 lần số token cho các yêu cầu GPT-4o.
Tổng quan kiến trúc
Các bộ đo theo dõi token và trừ giá trị tương ứng từ số dư tín dụng của người dùng dựa trên các mức giá bạn cấu hình.Kết luận
Tái tạo mô hình thanh toán của OpenAI với Dodo Payments mang lại cả hai lợi thế: sự linh hoạt của thanh toán theo mức sử dụng và sự dự đoán được của tín dụng trả trước. Bằng cách theo dõi hướng dẫn này, bạn có thể xây dựng hệ thống thanh toán cùng phát triển theo người dùng đồng thời bảo vệ biên lợi nhuận. Dù bạn đang xây dựng LLM tiếp theo hay một công cụ AI chuyên biệt, những kiểu mẫu này sẽ giúp bạn tạo trải nghiệm chuyên nghiệp, thân thiện với nhà phát triển. Cách tiếp cận này đảm bảo hạ tầng thanh toán của bạn bền vững và đáng tin cậy như các mô hình AI mà bạn cung cấp cho khách hàng.Các tính năng Dodo chính được sử dụng
Khám phá các tính năng làm cho việc triển khai này trở nên khả thi.Credit-Based Billing
Quản lý tín dụng fiat trả trước và quyền lợi cho người dùng của bạn.
Usage-Based Billing
Theo dõi mức sử dụng chi tiết như token và lập hóa đơn theo thời gian thực.
One-Time Payments
Bán gói tín dụng và nạp tiền với luồng thanh toán đơn giản.
Event Ingestion
Gửi dữ liệu sử dụng lưu lượng lớn đến Dodo Payments một cách dễ dàng.
Webhooks
Luôn cập nhật khi số dư tín dụng thay đổi và cảnh báo số dư thấp.
LLM Ingestion Blueprint
Theo dõi token tự động cho OpenAI và các nhà cung cấp LLM khác.
Key Dodo Features Used
Explore the features that make this implementation possible.Credit-Based Billing
Manage prepaid fiat credits and entitlements for your users.
Usage-Based Billing
Track granular usage like tokens and bill for it in real-time.
One-Time Payments
Sell credit packs and top-ups with a simple checkout flow.
Event Ingestion
Send high-volume usage data to Dodo Payments with ease.
Webhooks
Stay updated on credit balance changes and low balance alerts.
LLM Ingestion Blueprint
Automatic token tracking for OpenAI and other LLM providers.