Datera Blog – Jak efektivně pracovat s modely GPT-4o a GPT-4o-mini

Při práci s jazykovými modely, jako jsou GPT-4o a GPT-4o-mini, je důležité znát jejich specifika, silné stránky a vhodné způsoby zadávání dotazů. Níže shrnujeme klíčová doporučení, která vám pomohou dosáhnout co nejlepších výsledků při nasazení těchto modelů v praxi.

Jaký jazyk pro dotazy zvolit?

Čeština vs. angličtina

Angličtina je efektivnější: Většina modelů rozumí angličtině lépe než jiným jazykům, včetně češtiny. To platí zejména u technických nebo specifických dotazů.
- Příklad:
  - ❌ „Najdi přeškrtnutý text.“
  - ✅ „Find strikethrough text.“
Nižší náklady: Dotazy a odpovědi v angličtině využívají méně tokenů, což přináší úspory při práci s modelem.

Jak psát efektivní dotazy?

Struktura dotazu rozhoduje

Styl psaní má význam – Modely citlivě reagují na formátování. Nejlepších výsledků často dosáhnete pomocí strukturovaného formátu, například v Markdownu.
- Přehledné členění dotazu pomáhá modelu lépe pochopit i jednoduché logické vztahy.
  - ❌ „Udělej A, který je možná někde nahoře a potom udělej B“
  - ✅ „Udělej A. Udělej B.“
- Zvýraznění klíčových instrukcí zvyšuje přesnost odpovědi.
  - ❌ „Úkol zpracuj pro každý odstavec“
  - ✅ „**Úkol zpracuj pro každý odstavec**“

Držte se jednoduchosti

Používejte jednoduché a srozumitelné věty.
Každá věta by měla představovat jednu instrukci.
- ❌ „Vypiš celkové částky jako list hodnot ve formátu s oddělenými tisíci mezerou. Pokud částku nenajdeš, napiš 'NULL'.“
- ✅ „List celková částka. Formát 1 000. Pokud není, napiš 'NULL'.“

Kaskádové instrukce

Pro komplexnější úkoly používejte vícestupňové zadání:

„

1. Zapiš `f1`: „A“

1. Pokud je `f1` „A“, zapiš `g1`: 1

2. Pokud není `f1` „A“, zapiš `g1`: 2

2. Zapiš `f2`: „B“

3. Spoj atributy `f1` a `f2`a zapiš je do `f1_f2`. Oddělovač: mezera.

„

Výstup ve formátu JSON:

{

"f1": "A",

"g1": 1,

"f2": "B",

"f1_f2": "A B"

}

Zkratky a JSON výstup

Použitím zkratek pro atributy lze snížit počet tokenů ve výstupu.
Strukturovaný JSON výstup má řadu výhod:
- Zrychlení odpovědí.
- Nižší náklady na zpracování.
- Větší konzistence při dalším automatickém zpracování dat.

Jaký model kdy použít?

GPT-4o
- Vhodný pro složitější úkoly, dlouhé nebo kaskádové dotazy.
- Výhodou je vysoká přesnost a lepší pochopení kontextu.
- Nevýhodou mohou být vyšší náklady.
GPT-4o-mini
- Lehký a rychlý model s nižší cenou.
- Ideální pro jednodušší nebo krátké dotazy.
- U složitějších úloh (zejména logického charakteru) může dosahovat horších výsledků.

Testování a ladění promptů

Iterativní přístup je klíčový – málokdy se podaří napsat perfektní prompt napoprvé. Nebojte se testovat různé formulace, přehazovat pořadí instrukcí nebo si vyzkoušet prompt nejprve na menším vzorku dat.
Verzování promptů: Pokud používáte LLM ve firmě nebo v aplikacích, doporučujeme zavést verzování promptů. Pomáhá to při ladění a zpětném sledování, proč se výstupy změnily.

Hodnocení výstupů

Automatizované testy: Pro opakované úkoly je výhodné vytvořit si sadu vstupů + očekávaných výstupů a průběžně srovnávat výsledky modelu (např. přes string porovnání nebo fuzzy matching).
Ruční validace: U kreativních úkolů nebo komplexních transformací se bez lidského dohledu zatím neobejdeme – důležité je hodnotit s ohledem na kontext.

Náklady a optimalizace

Batching: Pokud zpracováváte víc dotazů najednou, u některých API lze ušetřit pomocí dávkového zpracování (např. víc promptů v jednom požadavku).
Zkracování kontextu: Čím kratší vstup (i výstup), tím nižší náklady. Nechte model „dýchat“, ale vyhýbejte se zbytečnému balastu.
Tokeny ≠ znaky: Token není totéž co znak nebo slovo. Např. čísla, mezery nebo emoji se počítají jinak. Znalost práce s tokenizací vám může ušetřit náklady.

Integrace do aplikací

Pokud plánujete nasadit modely do firemních procesů nebo systémů, dejte pozor na:
- latenci odpovědí – některé modely mohou být pomalejší.
- stabilitu API – open-source modely nebo cloudové služby se můžou měnit bez varování.
- bezpečnost a auditovatelnost – výstup modelu může být nepředvídatelný, což je třeba ošetřit hlavně v citlivých doménách.
- Omezení tokenů – na vstupu i výstupu. Pokud očekáváte odpověď (například JSON) kde je struktura jasně daná .

Ochrana před halucinacemi

Model dokáže „halucinovat“ – tedy tvrdit s jistotou věci, které nejsou pravdivé.
Pomáhá:
- Omezení kreativních instrukcí.
- Validace výstupu pomocí dalších pravidel nebo následného dotazu (např. „Pokud hodnotu nemůže najít, napiš 'NULL'.“).
- RAG: kombinace modelu s vlastní znalostní bází, kde si model „vytahuje“ ověřené informace.

Shrnutí

Klíčové zásady pro práci s LLM:

Pište anglicky – modely angličtině rozumí lépe a ekonomičtěji.
Buďte struční a jednoznační – každá instrukce by měla být jasná a samostatná.
Struktura je klíčová – používejte odrážky, Markdown nebo JSON, model se v tom lépe orientuje.

Volba modelu:

GPT-4o-mini je rychlý a levný, ideální pro jednodušší nebo objemové úkoly. Pokud ale potřebujete přesné pochopení, práci s podmínkami nebo složitější logiku, vyplatí se použít GPT-4o – je robustnější a lépe chápe kaskádové instrukce i kontext.

Jak efektivně pracovat s modely GPT-4o a GPT-4o-mini