Cleao Core API ENTERPRISE

Dokumentacja techniczna dla integracji systemowych. API Cleao pozwala na bezpośrednie połączenie infrastruktury klienta z naszymi klastrami obliczeniowymi H100.

Ważna informacja Dostęp do API jest funkcją ekskluzywną dla planów Enterprise. Użytkownicy planów darmowych i Pro mogą korzystać wyłącznie z interfejsu webowego (Chat).
Base URL https://api.cleao.io/v1

Dostęp i Limity

Poniższa tabela przedstawia uprawnienia dostępu do endpointów API w zależności od posiadanej subskrypcji.

Plan Subskrypcji Dostęp do API Rate Limit (RPM)
Cleao Lite (Free) ✕ Brak Dostępu -
Cleao Pro ✕ Brak Dostępu -
Cleao Enterprise ✓ Pełny Dostęp Nielimitowane / Custom

Jeśli posiadasz plan Enterprise, Twoje limity są ustalane indywidualnie w kontrakcie SLA. Skontaktuj się z opiekunem klienta, aby zwiększyć przepustowość.

Autoryzacja

Klucze API są wydawane wyłącznie zweryfikowanym klientom biznesowym. Klucz należy przekazywać w nagłówku Authorization każdego zapytania.

CURL EXAMPLE
curl https://api.cleao.io/v1/models \
  -H "Authorization: Bearer sk-enterprise-klucz" \
  -H "Content-Type: application/json"

Dostępne Modele

Poniżej znajduje się lista modeli dostępnych dla kont Enterprise. Zalecamy migrację ze starych modeli.

Model ID Opis i Zastosowanie Kontekst
cleao-9.6-pro Flagowy model.
Najwyższa zdolność wnioskowania (reasoning), kodowanie w Python/C++, analiza złożonych dokumentów.
128k Tokenów
cleao-9.6-lite Model zoptymalizowany.
Bardzo szybki czas reakcji, niski koszt. Idealny do chatbotów i prostych streszczeń.
32k Tokenów
cleao-8.9 Legacy (Stary model).
Poprzednia generacja. Utrzymywana tylko dla kompatybilności wstecznej. Nie zalecana do nowych wdrożeń.
16k Tokenów

Chat Completions

POST /chat/completions

Główny endpoint do komunikacji z modelem językowym.

Body Parameters

modelstring Wymagane. ID modelu (np. cleao-9.6-pro).
messagesarray Wymagane. Historia rozmowy.
temperaturefloat Opcjonalne (0.0 - 2.0). Kreatywność odpowiedzi.
REQUEST (JSON)
{
  "model": "cleao-9.6-pro",
  "messages": [
    {"role": "system", "content": "Jesteś analitykiem finansowym."},
    {"role": "user", "content": "Przeanalizuj ten bilans..."}
  ]
}
RESPONSE (JSON)
{
  "id": "chat-xyz...",
  "choices": [
    {
      "message": {
        "role": "assistant",
        "content": "Na podstawie danych..."
      }
    }
  ]
}

Embeddings

POST /embeddings

Generowanie wektorów dla systemów wyszukiwania semantycznego.

REQUEST
{
  "model": "text-embed-v2",
  "input": "Enterprise AI integration"
}

Generowanie Obrazów

POST /images/generations
REQUEST
{
  "prompt": "Data center server room, blue neon, 4k",
  "n": 1,
  "size": "1024x1024"
}

Obsługa Błędów

Kody HTTP specyficzne dla dostępu Enterprise.

Kod Znaczenie
403 Forbidden Próba dostępu z klucza nieaktywnego lub niebędącego Enterprise.
429 Too Many Requests Przekroczono limit ustalony w kontrakcie SLA.
500 Server Error Błąd wewnętrzny klastra obliczeniowego.