Cleao Core API ENTERPRISE
Dokumentacja techniczna dla integracji systemowych. API Cleao pozwala na bezpośrednie połączenie infrastruktury klienta z naszymi klastrami obliczeniowymi H100.
https://api.cleao.io/v1
Dostęp i Limity
Poniższa tabela przedstawia uprawnienia dostępu do endpointów API w zależności od posiadanej subskrypcji.
| Plan Subskrypcji | Dostęp do API | Rate Limit (RPM) |
|---|---|---|
| Cleao Lite (Free) | ✕ Brak Dostępu | - |
| Cleao Pro | ✕ Brak Dostępu | - |
| Cleao Enterprise | ✓ Pełny Dostęp | Nielimitowane / Custom |
Jeśli posiadasz plan Enterprise, Twoje limity są ustalane indywidualnie w kontrakcie SLA. Skontaktuj się z opiekunem klienta, aby zwiększyć przepustowość.
Autoryzacja
Klucze API są wydawane wyłącznie zweryfikowanym klientom biznesowym. Klucz należy przekazywać w nagłówku Authorization każdego zapytania.
curl https://api.cleao.io/v1/models \
-H "Authorization: Bearer sk-enterprise-klucz" \
-H "Content-Type: application/json"
Dostępne Modele
Poniżej znajduje się lista modeli dostępnych dla kont Enterprise. Zalecamy migrację ze starych modeli.
| Model ID | Opis i Zastosowanie | Kontekst |
|---|---|---|
cleao-9.6-pro |
Flagowy model. Najwyższa zdolność wnioskowania (reasoning), kodowanie w Python/C++, analiza złożonych dokumentów. |
128k Tokenów |
cleao-9.6-lite |
Model zoptymalizowany. Bardzo szybki czas reakcji, niski koszt. Idealny do chatbotów i prostych streszczeń. |
32k Tokenów |
cleao-8.9 |
Legacy (Stary model). Poprzednia generacja. Utrzymywana tylko dla kompatybilności wstecznej. Nie zalecana do nowych wdrożeń. |
16k Tokenów |
Chat Completions
Główny endpoint do komunikacji z modelem językowym.
Body Parameters
| modelstring | Wymagane. ID modelu (np. cleao-9.6-pro). |
| messagesarray | Wymagane. Historia rozmowy. |
| temperaturefloat | Opcjonalne (0.0 - 2.0). Kreatywność odpowiedzi. |
{
"model": "cleao-9.6-pro",
"messages": [
{"role": "system", "content": "Jesteś analitykiem finansowym."},
{"role": "user", "content": "Przeanalizuj ten bilans..."}
]
}
{
"id": "chat-xyz...",
"choices": [
{
"message": {
"role": "assistant",
"content": "Na podstawie danych..."
}
}
]
}
Embeddings
Generowanie wektorów dla systemów wyszukiwania semantycznego.
{
"model": "text-embed-v2",
"input": "Enterprise AI integration"
}
Generowanie Obrazów
{
"prompt": "Data center server room, blue neon, 4k",
"n": 1,
"size": "1024x1024"
}
Obsługa Błędów
Kody HTTP specyficzne dla dostępu Enterprise.
| Kod | Znaczenie |
|---|---|
403 Forbidden |
Próba dostępu z klucza nieaktywnego lub niebędącego Enterprise. |
429 Too Many Requests |
Przekroczono limit ustalony w kontrakcie SLA. |
500 Server Error |
Błąd wewnętrzny klastra obliczeniowego. |