Cleao Core API ENTERPRISE

Dokumentacja techniczna dla integracji systemowych. API Cleao pozwala na bezpośrednie połączenie infrastruktury klienta z naszymi klastrami obliczeniowymi H100. Obsługujemy wnioskowanie, analizę obrazu, syntezę mowy oraz wektoryzację danych.

Ważna informacja Dostęp do API jest funkcją ekskluzywną dla planów Enterprise. Użytkownicy planów darmowych i Pro mogą korzystać wyłącznie z interfejsu webowego (Chat).

Base URL https://api.cleao.io/v1

Dostęp i Limity

Poniższa tabela przedstawia uprawnienia dostępu do endpointów API w zależności od posiadanej subskrypcji. Rate limity mierzone są na poziomie okna minutowego.

Plan Subskrypcji	Dostęp do API	Rate Limit (RPM)
Cleao Lite (Free)	✕ Brak Dostępu	-
Cleao Pro	✕ Brak Dostępu	-
Cleao Enterprise	✓ Pełny Dostęp	Nielimitowane / Custom

Jeśli posiadasz plan Enterprise, Twoje limity (Tokeny na Minutę TPM / Żądania na Minutę RPM) są ustalane indywidualnie w kontrakcie SLA. Skontaktuj się z opiekunem klienta, aby zwiększyć przepustowość.

Autoryzacja

Klucze API są wydawane wyłącznie zweryfikowanym klientom biznesowym. Klucz należy przekazywać w nagłówku Authorization jako token typu Bearer w każdym zapytaniu do serwera.

CURL EXAMPLE

                curl https://api.cleao.io/v1/models \

                  -H "Authorization: Bearer sk-enterprise-twój-klucz" \

                  -H "Content-Type: application/json"

Ostrzeżenie bezpieczeństwa: Nigdy nie udostępniaj swoich kluczy API po stronie klienta (np. w kodzie frontendowym JS). Przechowuj je w bezpiecznych środowiskach backendowych.

Wersjonowanie

Nasze API jest wersjonowane poprzez ścieżkę URL. Obecna stabilna wersja to v1. Wszelkie zmiany niekompatybilne wstecz (breaking changes) będą skutkować wydaniem nowej wersji (np. v2).

Możesz również wymusić określoną wersję interfejsu za pomocą nagłówka Cleao-Version w zapytaniu.

Paginacja

Endpointy zwracające listy obiektów (np. lista przesłanych plików, lista tuningów modeli) wykorzystują paginację opartą na kursorach (cursor-based pagination). W odpowiedzi z takimi danymi otrzymasz parametr has_more oraz last_id.

GET PARAMS

                ?limit=50&after=obj_764352xyz

Dostępne Silniki

Poniżej znajduje się lista modeli dostępnych dla kont Enterprise. Zalecamy migrację ze starych modeli.

Model ID	Opis i Zastosowanie	Kontekst
`cleao-9.6-pro`	Flagowy model. Najwyższa zdolność wnioskowania (reasoning), kodowanie w Python/C++, analiza złożonych dokumentów.	128k Tokenów
`cleao-9.6-lite`	Model zoptymalizowany. Bardzo szybki czas reakcji, niski koszt. Idealny do chatbotów i prostych streszczeń.	32k Tokenów
`cleao-vision-v2`	Analiza Obrazu. Model multimodalny zdolny do opisywania obrazów, czytania danych z tabel i wykresów (OCR+AI).	16k Tokenów
`cleao-8.9`	Legacy (Stary model). Poprzednia generacja. Utrzymywana tylko dla kompatybilności wstecznej. Nie zalecana do nowych wdrożeń.	16k Tokenów

Chat Completions

POST /chat/completions

Główny endpoint do komunikacji z modelem językowym. Używany do generowania tekstu, kodu, podsumowań oraz formatowania ustrukturyzowanych danych (JSON Mode).

Body Parameters

modelstring	Wymagane. ID modelu (np. `cleao-9.6-pro`).
messagesarray	Wymagane. Historia rozmowy (role: system, user, assistant).
temperaturefloat	Opcjonalne (0.0 - 2.0). Kreatywność odpowiedzi. Domyślnie 1.0.
streamboolean	Opcjonalne. Zwraca częściowe odpowiedzi za pomocą Server-Sent Events (SSE).

REQUEST (JSON)

                {

                  "model": "cleao-9.6-pro",

                  "messages": [

                    {"role": "system", "content": "Jesteś analitykiem finansowym."},

                    {"role": "user", "content": "Przeanalizuj ten bilans..."}

                  ]

                }

RESPONSE (JSON)

                {

                  "id": "chat-xyz...",

                  "choices": [

                    {

                      "message": {

                        "role": "assistant",

                        "content": "Na podstawie danych..."

                      },

                      "finish_reason": "stop"

                    }

                  ],

                  "usage": {

                    "prompt_tokens": 56,

                    "completion_tokens": 210,

                    "total_tokens": 266

                  }

                }

Vision API

POST /vision/analyze

Zdolność modelu do 'widzenia'. Przesyłaj obrazy za pomocą URL lub w formacie Base64, a model zidentyfikuje obiekty, zinterpretuje wykresy lub odczyta odręczny tekst.

REQUEST

                {

                  "model": "cleao-vision-v2",

                  "messages": [

                    {

                      "role": "user",

                      "content": [

                        {"type": "text", "text": "Co jest na tym zdjęciu?"},

                        {"type": "image_url", "image_url": {"url": "https://example.com/chart.png"}}

                      ]

                    }

                  ]

                }

Embeddings

POST /embeddings

Generowanie reprezentacji wektorowych ciągów znaków (do 1536 wymiarów). Niezbędne do systemów RAG (Retrieval-Augmented Generation) i semantycznego wyszukiwania w bazach danych Vector DB.

REQUEST

                {

                  "model": "text-embed-v2",

                  "input": "Enterprise AI integration"

                }

Generowanie Obrazów

POST /images/generations

Generuj natywne grafiki bezpośrednio z poleceń tekstowych. Model cleao-art-pro wspiera generację fotorealistyczną, wektorową oraz inpainting.

REQUEST

                {

                  "prompt": "Data center server room, blue neon, 4k",

                  "model": "cleao-art-pro",

                  "n": 1,

                  "size": "1024x1024",

                  "response_format": "url"

                }

Audio & Speech

POST /audio/transcriptions

POST /audio/speech

Zamieniaj tekst na naturalnie brzmiącą mowę (TTS) z wyborem wielu profesjonalnych głosów, lub transkrybuj nagrania audio na tekst za pomocą naszego silnika Whisper-odpowiednika.

Pliki (Files API)

Zarządzaj dokumentami wykorzystywanymi do Fine-tuningu, Batch Processing'u oraz dla systemów RAG.

POST /files

GET /files

DEL /files/{file_id}

Maksymalny rozmiar pliku wynosi 512 MB. Obsługiwane rozszerzenia: .pdf, .csv, .jsonl, .txt.

Webhooks

Zamiast odpytywać API w oczekiwaniu na wynik długotrwałych operacji (np. Fine-tuning modelu, asynchroniczna analiza gigabajtów wideo), zasubskrybuj zdarzenia Webhook, aby otrzymywać powiadomienia POST na swój serwer w czasie rzeczywistym.

Wszystkie żądania webhook posiadają podpis kryptograficzny w nagłówku Cleao-Signature, aby umożliwić weryfikację ich pochodzenia.

Oficjalne SDK

Zalecamy korzystanie z naszych oficjalnych bibliotek do integracji, które automatycznie obsługują ponawianie zapytań (retries), paginację oraz weryfikację certyfikatów SSL.

PYTHON
pip install cleao-sdk

NODE.JS
npm install @cleao/api

Obsługa Błędów

Kody HTTP specyficzne dla dostępu Enterprise. Każdy błąd zwraca obiekt JSON z dokładnym opisem problemu oraz identyfikatorem zapytania request_id ułatwiającym debugging z supportem.

Kod	Znaczenie
`400 Bad Request`	Brakujący parametr, zły format zapytania JSON lub nieprawidłowa zawartość.
`401 Unauthorized`	Brak klucza API, błędny klucz lub brak nagłówka Authorization.
`403 Forbidden`	Klucz aktywny, ale próba dostępu do endpointu niezgodnego z umową Enterprise (brak uprawnień).
`429 Too Many Requests`	Przekroczono limit zapytań (RPM) lub limit tokenów (TPM) ustalony w kontrakcie SLA.
`500 Server Error`	Wewnętrzny błąd klastra obliczeniowego Cleao.
`503 Service Unavailable`	Model jest obecnie przeciążony lub w trakcie restartu (spróbuj ponownie z exponential backoff).

Ulepsz model

Personalizuj Cleao na podstawie historii rozmów beta

Zezwalaj na udostępnianie linków do czatu

Generowanie zawartości NSFW (18+) Wyświetlaj multimedia, które mogą zawierać zawartość NSFW. Musisz mieć ukończone 18lat, aby włączyć to ustawienie.