AI asistent¶
AVAX má vestavěný AI chat napojený na lokální LLM (Large Language Model). Asistent vám pomůže:
- Odpovědět na otázky o AVAX platformě a aplikacích.
- Vysvětlit dokumenty, které mu nahrajete.
- Pomocí specializovaných asistentů řešit doménové úkoly (např. AVAX Legal má svého právního asistenta).
Kde běží LLM
AI běží na lokálním serveru v naší síti (LM Studio na PC v Praze) — ne na cloudu jako OpenAI / Anthropic. Vaše dotazy a dokumenty neopouštějí AVAX infrastrukturu.
Otevření AI¶
Sidebar → 🎧 Podpora → sekce AI asistent.
Uvidíte:
┌──────────────────────────────────────────────────────┐
│ AI asistent [📚 Historie] [↻ Nová] │
├──────────────────────────────────────────────────────┤
│ Konverzace začne po prvním dotazu. │
│ │
│ │
│ │
├──────────────────────────────────────────────────────┤
│ [vstup pro zprávu] [📎] [Odeslat] │
└──────────────────────────────────────────────────────┘
Položení dotazu¶
Napište do vstupního pole a stiskněte Odeslat (nebo Enter).
Příklady užitečných dotazů:
- „Jak nastavím synchronizaci složky?"
- „Co znamená rozdíl mezi sync, backup_only a readonly režimem?"
- „Vysvětli mi paragraf 23 zákoníku o účetnictví" (v AVAX Legal asistentovi)
AI odpoví v češtině, streaming — text se objevuje token po tokenu. Doba odpovědi: 2–20 s podle délky dotazu.
Stav během psaní¶
V status badge dole vpravo vidíte:
- ⏳ Připravuji… — vytváří se konverzace
- ⏳ Píšu… — LLM generuje odpověď
- ✓ 8 t. / 1.3s — hotovo, počet tokenů + latence
- ⚠ Chyba — něco selhalo (LM Studio offline, timeout, …)
Připojení dokumentů (📎)¶
Klik na 📎 vedle Odeslat → file picker → vyberte soubor:
| Formát | Co AI uvidí |
|---|---|
.txt, .md, .csv |
Plný text inline |
.pdf (textové) |
Extrahovaný text (pypdf) |
.docx |
Plný text + tabulky (python-docx) |
.pdf (scan-only) |
Jen reference („AI nečte") |
.doc (legacy) |
Jen reference |
Pill nad input ukáže status:
📄 file.pdf · 245 KB · AI čte (12,345 znaků)— text extracted, AI ho vidí📎 file.pdf · 1.2 MB · AI nečte (formát V2 RAG)— jen reference, AI ho uvidí přes RAG indexaci
RAG indexace¶
Po nahrání dokumentu (/ai/documents/finalize) backend automaticky:
- Status:
uploaded→processing - Extrahuje text, rozdělí na chunky (1000 znaků)
- Vypočte embeddings (bge-m3 model, 1024 dimenzí)
- Uloží do vector databáze (pgvector v PostgreSQL)
- Status:
indexed
Po indexaci AI vyhledává nejrelevantnější chunky z vašich dokumentů při každém dotazu — i když dokument nepřiložíte k aktuální zprávě.
Citation¶
V dolním rohu odpovědi AI uvidíte tlačítko 🔗 N zdrojů (pokud odpověď použila kontext z vašich dokumentů). Klik = pop-out s:
Source 1(s relevance score, např. 0.84)- doc id + chunk #
- Preview úryvku
Tím vidíte z čeho AI čerpala odpověď.
Historie konverzací (📚)¶
Klik na 📚 Historie vpravo nahoře → modal s:
- Filtr dropdown: Vše / Pouze platforma / Per-app (app-legal, …)
- List konverzací sort by latest update DESC:
- Title (auto-generovaný z první zprávy, prefix 60 znaků)
- Meta: 📦 model · 🌐 platforma · 🕐 čas
- Klik na řádek → načte konverzaci do aktivního panelu, můžete pokračovat.
- ✕ smaže konverzaci (CASCADE — i s zprávami).
Asistenti¶
AVAX má víc asistentů — každý se specializací:
| Asistent | Slug | Pro co |
|---|---|---|
| AVAX asistent | platform-helper |
Obecné dotazy o platformě (default) |
| Právní asistent | legal-asistent |
České právo, paragrafy, výklady (volá se z AVAX Legal app) |
Výběr asistenta při tvorbě konverzace dnes není v UI explicitní — používá se default. V budoucnu (V1.5+) dropdown.
Modely¶
Asistent má za sebou konkrétní LLM model (např. qwen3.6-27b od Alibaba — 27 miliard parametrů, česky velmi dobrý).
Admin (super_admin) může změnit model v AVAX Admin → 🤖 AI → Asistenti.
Privátnost¶
- Dotazy a odpovědi se ukládají do PostgreSQL na AVAX server. Vidí je jen vy a Avaxis admin pro debugging.
- Tokeny in / out se logují (pro budoucí kvotování).
- Plný obsah (text dotazu / odpovědi) se neobjeví v logu — jen metadata (počet tokenů, latence).
- LLM NEZNÁ vaše konverzace s jinými uživateli ani vaše dokumenty — vy ho explicitně přiložíte.
Limity¶
- Max kontext asistenta: 8192 tokenů (model
qwen3.6-27b). Velmi dlouhé konverzace ztrácí kontextu začátek. - Max attached dokument přes inline: 20 000 znaků. Přes RAG: prakticky bez limitu (chunkuje se).
- Max upload velikost: 100 MB.
Co AI NEumí¶
- Pamatovat si konverzace mimo aktivní conversation_id (každá konverzace má vlastní paměť).
- Volat externí API (Google search, web browse, …).
- Mít aktuální data po datu trénovaní modelu (model má cutoff date).