Tmavé pozadí

Jak efektivně pracovat s modely GPT-4o a GPT-4o-mini

Jan Drda
Jan Drda 17. 4. 2025
Jak efektivně pracovat s modely GPT-4o a GPT-4o-mini

Při práci s jazykovými modely, jako jsou GPT-4o a GPT-4o-mini, je důležité znát jejich specifika, silné stránky a vhodné způsoby zadávání dotazů. Níže shrnujeme klíčová doporučení, která vám pomohou dosáhnout co nejlepších výsledků při nasazení těchto modelů v praxi.

Jaký jazyk pro dotazy zvolit?

Čeština vs. angličtina

  • Angličtina je efektivnější: Většina modelů rozumí angličtině lépe než jiným jazykům, včetně češtiny. To platí zejména u technických nebo specifických dotazů.
    • Příklad:
      • ❌ „Najdi přeškrtnutý text.“
      • ✅ „Find strikethrough text.“
  • Nižší náklady: Dotazy a odpovědi v angličtině využívají méně tokenů, což přináší úspory při práci s modelem.

Jak psát efektivní dotazy?

Struktura dotazu rozhoduje

  • Styl psaní má význam – Modely citlivě reagují na formátování. Nejlepších výsledků často dosáhnete pomocí strukturovaného formátu, například v Markdownu.
    • Přehledné členění dotazu pomáhá modelu lépe pochopit i jednoduché logické vztahy.
      • ❌ „Udělej A, který je možná někde nahoře a potom udělej B“
      • ✅ „Udělej A. Udělej B.“
    • Zvýraznění klíčových instrukcí zvyšuje přesnost odpovědi.
      • ❌ „Úkol zpracuj pro každý odstavec“
      • ✅ „**Úkol zpracuj pro každý odstavec**

Držte se jednoduchosti

  • Používejte jednoduché a srozumitelné věty.
  • Každá věta by měla představovat jednu instrukci.
    • ❌ „Vypiš celkové částky jako list hodnot ve formátu s oddělenými tisíci mezerou. Pokud částku nenajdeš, napiš 'NULL'.“
    • ✅ „List celková částka. Formát 1 000. Pokud není, napiš 'NULL'.“

Kaskádové instrukce

  • Pro komplexnější úkoly používejte vícestupňové zadání:

1. Zapiš `f1`: „A“

   1. Pokud je `f1` „A“, zapiš `g1`: 1

   2. Pokud není `f1` „A“, zapiš `g1`: 2

2. Zapiš `f2`: „B“

3. Spoj atributy `f1` a `f2`a zapiš je do `f1_f2`. Oddělovač: mezera.

  • Výstup ve formátu JSON:

{

  "f1": "A",

  "g1": 1,

  "f2": "B",

  "f1_f2": "A B"

}

Zkratky a JSON výstup

  • Použitím zkratek pro atributy lze snížit počet tokenů ve výstupu.
  • Strukturovaný JSON výstup má řadu výhod:
    • Zrychlení odpovědí.
    • Nižší náklady na zpracování.
    • Větší konzistence při dalším automatickém zpracování dat.

Jaký model kdy použít?

  • GPT-4o
    • Vhodný pro složitější úkoly, dlouhé nebo kaskádové dotazy.
    • Výhodou je vysoká přesnost a lepší pochopení kontextu.
    • Nevýhodou mohou být vyšší náklady.
  • GPT-4o-mini
    • Lehký a rychlý model s nižší cenou.
    • Ideální pro jednodušší nebo krátké dotazy.
    • U složitějších úloh (zejména logického charakteru) může dosahovat horších výsledků.

Testování a ladění promptů

  • Iterativní přístup je klíčový – málokdy se podaří napsat perfektní prompt napoprvé. Nebojte se testovat různé formulace, přehazovat pořadí instrukcí nebo si vyzkoušet prompt nejprve na menším vzorku dat.
  • Verzování promptů: Pokud používáte LLM ve firmě nebo v aplikacích, doporučujeme zavést verzování promptů. Pomáhá to při ladění a zpětném sledování, proč se výstupy změnily.

Hodnocení výstupů

  • Automatizované testy: Pro opakované úkoly je výhodné vytvořit si sadu vstupů + očekávaných výstupů a průběžně srovnávat výsledky modelu (např. přes string porovnání nebo fuzzy matching).
  • Ruční validace: U kreativních úkolů nebo komplexních transformací se bez lidského dohledu zatím neobejdeme – důležité je hodnotit s ohledem na kontext.

Náklady a optimalizace

  • Batching:  Pokud zpracováváte víc dotazů najednou, u některých API lze ušetřit pomocí dávkového zpracování (např. víc promptů v jednom požadavku).
  • Zkracování kontextu: Čím kratší vstup (i výstup), tím nižší náklady. Nechte model „dýchat“, ale vyhýbejte se zbytečnému balastu.
  • Tokeny ≠ znaky: Token není totéž co znak nebo slovo. Např. čísla, mezery nebo emoji se počítají jinak. Znalost práce s tokenizací vám může ušetřit náklady.

Integrace do aplikací

  • Pokud plánujete nasadit modely do firemních procesů nebo systémů, dejte pozor na:
    • latenci odpovědí – některé modely mohou být pomalejší.
    • stabilitu API – open-source modely nebo cloudové služby se můžou měnit bez varování.
    • bezpečnost a auditovatelnost – výstup modelu může být nepředvídatelný, což je třeba ošetřit hlavně v citlivých doménách.
    • Omezení tokenů – na vstupu i výstupu. Pokud očekáváte odpověď (například JSON) kde je struktura jasně daná .

Ochrana před halucinacemi

  • Model dokáže „halucinovat“ – tedy tvrdit s jistotou věci, které nejsou pravdivé.
  • Pomáhá:
    • Omezení kreativních instrukcí.
    • Validace výstupu pomocí dalších pravidel nebo následného dotazu (např. „Pokud hodnotu nemůže najít, napiš 'NULL'.“).
    • RAG: kombinace modelu s vlastní znalostní bází, kde si model „vytahuje“ ověřené informace.

Shrnutí

Klíčové zásady pro práci s LLM:

  1. Pište anglicky – modely angličtině rozumí lépe a ekonomičtěji.
  2. Buďte struční a jednoznační – každá instrukce by měla být jasná a samostatná.
  3. Struktura je klíčová – používejte odrážky, Markdown nebo JSON, model se v tom lépe orientuje.

Volba modelu: 

GPT-4o-mini je rychlý a levný, ideální pro jednodušší nebo objemové úkoly. Pokud ale potřebujete přesné pochopení, práci s podmínkami nebo složitější logiku, vyplatí se použít GPT-4o – je robustnější a lépe chápe kaskádové instrukce i kontext.

Jan Drda
Jan Drda 17. 4. 2025