Jak efektivně pracovat s modely GPT-4o a GPT-4o-mini
Jan Drda 17. 4. 2025
Při práci s jazykovými modely, jako jsou GPT-4o a GPT-4o-mini, je důležité znát jejich specifika, silné stránky a vhodné způsoby zadávání dotazů. Níže shrnujeme klíčová doporučení, která vám pomohou dosáhnout co nejlepších výsledků při nasazení těchto modelů v praxi.
Jaký jazyk pro dotazy zvolit?
Čeština vs. angličtina
- Angličtina je efektivnější: Většina modelů rozumí angličtině lépe než jiným jazykům, včetně češtiny. To platí zejména u technických nebo specifických dotazů.
- Příklad:
- ❌ „Najdi přeškrtnutý text.“
- ✅ „Find strikethrough text.“
- Příklad:
- Nižší náklady: Dotazy a odpovědi v angličtině využívají méně tokenů, což přináší úspory při práci s modelem.
Jak psát efektivní dotazy?
Struktura dotazu rozhoduje
- Styl psaní má význam – Modely citlivě reagují na formátování. Nejlepších výsledků často dosáhnete pomocí strukturovaného formátu, například v Markdownu.
- Přehledné členění dotazu pomáhá modelu lépe pochopit i jednoduché logické vztahy.
- ❌ „Udělej A, který je možná někde nahoře a potom udělej B“
- ✅ „Udělej A. Udělej B.“
- Zvýraznění klíčových instrukcí zvyšuje přesnost odpovědi.
- ❌ „Úkol zpracuj pro každý odstavec“
- ✅ „**Úkol zpracuj pro každý odstavec**“
- Přehledné členění dotazu pomáhá modelu lépe pochopit i jednoduché logické vztahy.
Držte se jednoduchosti
- Používejte jednoduché a srozumitelné věty.
- Každá věta by měla představovat jednu instrukci.
- ❌ „Vypiš celkové částky jako list hodnot ve formátu s oddělenými tisíci mezerou. Pokud částku nenajdeš, napiš 'NULL'.“
- ✅ „List celková částka. Formát 1 000. Pokud není, napiš 'NULL'.“
Kaskádové instrukce
- Pro komplexnější úkoly používejte vícestupňové zadání:
„
1. Zapiš `f1`: „A“
1. Pokud je `f1` „A“, zapiš `g1`: 1
2. Pokud není `f1` „A“, zapiš `g1`: 2
2. Zapiš `f2`: „B“
3. Spoj atributy `f1` a `f2`a zapiš je do `f1_f2`. Oddělovač: mezera.
„
- Výstup ve formátu JSON:
{
"f1": "A",
"g1": 1,
"f2": "B",
"f1_f2": "A B"
}
Zkratky a JSON výstup
- Použitím zkratek pro atributy lze snížit počet tokenů ve výstupu.
- Strukturovaný JSON výstup má řadu výhod:
- Zrychlení odpovědí.
- Nižší náklady na zpracování.
- Větší konzistence při dalším automatickém zpracování dat.
Jaký model kdy použít?
- GPT-4o
- Vhodný pro složitější úkoly, dlouhé nebo kaskádové dotazy.
- Výhodou je vysoká přesnost a lepší pochopení kontextu.
- Nevýhodou mohou být vyšší náklady.
- GPT-4o-mini
- Lehký a rychlý model s nižší cenou.
- Ideální pro jednodušší nebo krátké dotazy.
- U složitějších úloh (zejména logického charakteru) může dosahovat horších výsledků.
Testování a ladění promptů
- Iterativní přístup je klíčový – málokdy se podaří napsat perfektní prompt napoprvé. Nebojte se testovat různé formulace, přehazovat pořadí instrukcí nebo si vyzkoušet prompt nejprve na menším vzorku dat.
- Verzování promptů: Pokud používáte LLM ve firmě nebo v aplikacích, doporučujeme zavést verzování promptů. Pomáhá to při ladění a zpětném sledování, proč se výstupy změnily.
Hodnocení výstupů
- Automatizované testy: Pro opakované úkoly je výhodné vytvořit si sadu vstupů + očekávaných výstupů a průběžně srovnávat výsledky modelu (např. přes string porovnání nebo fuzzy matching).
- Ruční validace: U kreativních úkolů nebo komplexních transformací se bez lidského dohledu zatím neobejdeme – důležité je hodnotit s ohledem na kontext.
Náklady a optimalizace
- Batching: Pokud zpracováváte víc dotazů najednou, u některých API lze ušetřit pomocí dávkového zpracování (např. víc promptů v jednom požadavku).
- Zkracování kontextu: Čím kratší vstup (i výstup), tím nižší náklady. Nechte model „dýchat“, ale vyhýbejte se zbytečnému balastu.
- Tokeny ≠ znaky: Token není totéž co znak nebo slovo. Např. čísla, mezery nebo emoji se počítají jinak. Znalost práce s tokenizací vám může ušetřit náklady.
Integrace do aplikací
- Pokud plánujete nasadit modely do firemních procesů nebo systémů, dejte pozor na:
- latenci odpovědí – některé modely mohou být pomalejší.
- stabilitu API – open-source modely nebo cloudové služby se můžou měnit bez varování.
- bezpečnost a auditovatelnost – výstup modelu může být nepředvídatelný, což je třeba ošetřit hlavně v citlivých doménách.
- Omezení tokenů – na vstupu i výstupu. Pokud očekáváte odpověď (například JSON) kde je struktura jasně daná .
Ochrana před halucinacemi
- Model dokáže „halucinovat“ – tedy tvrdit s jistotou věci, které nejsou pravdivé.
- Pomáhá:
- Omezení kreativních instrukcí.
- Validace výstupu pomocí dalších pravidel nebo následného dotazu (např. „Pokud hodnotu nemůže najít, napiš 'NULL'.“).
- RAG: kombinace modelu s vlastní znalostní bází, kde si model „vytahuje“ ověřené informace.
Shrnutí
Klíčové zásady pro práci s LLM:
- Pište anglicky – modely angličtině rozumí lépe a ekonomičtěji.
- Buďte struční a jednoznační – každá instrukce by měla být jasná a samostatná.
- Struktura je klíčová – používejte odrážky, Markdown nebo JSON, model se v tom lépe orientuje.
Volba modelu:
GPT-4o-mini je rychlý a levný, ideální pro jednodušší nebo objemové úkoly. Pokud ale potřebujete přesné pochopení, práci s podmínkami nebo složitější logiku, vyplatí se použít GPT-4o – je robustnější a lépe chápe kaskádové instrukce i kontext.
Jan Drda 17. 4. 2025