Přehled a srovnání tagsetů

Korpusy na Vokabuláři webovém používají dva ekvivalentní způsoby značkování: poziční tagset (jako korpusy SYN v ČNK) a atributivní tagset (jako české korpusy ve Sketch Engine). Tabulky níže poskytují zároveň jejich přehled a srovnání.

Úvod

Přehled morfologických značek je rozdělen do tabulek podle slovního druhu. V každé tabulce je pro ilustraci poslední sloupec s příkladem (úplné) poziční značky, (úplné) atributivní značky a tokenu (někdy nazývaného „pozice“), který jim odpovídá.

Pod záhlavími poziční značka a atributivní značka jsou uvedeny regulární výrazy, které umožňují vyhledat tokeny např. podle pádu a dalších jednotlivých (morfologických i jiných lingvistických) kategorií. V hranatých závorkách (např. v regulárním výrazu N.[MFN].* 🔗) jsou obsaženy vždy všechny možné hodnoty daného atributu (v tomto případě jmenného rodu). Chcete-li hledat podstatná jména ženského rodu, uvádějte jedinou možnost už bez hranatých závorek, tedy N.F.* 🔗.

K hledání podle pozičních značek zvolte typ dotazu CQL a buď nastavte výchozí atribut tag a regulární výraz zadejte do uvozovek (např. "N.*" 🔗 vyhledá jednotlivá podstatná jména; uvozovky jsou prostředkem jazyka CQL), anebo zadejte atribut tag explicitně např. tímto výrazem: [tag="N.*"] 🔗 (vnější hranaté závorky ohraničují v jazyce CQL podmínky na jeden token). Při hledání podle atributivních značek buď volte výchozí atribut atag, anebo použijte výraz ve tvaru [atag="k1.*"] 🔗.

Podstatná jména

Kategorie Poziční značka Atributivní značka Příklad
Slovní druh N.* 🔗 k1.* 🔗
  • N-MS1------------ 🔗
  • k1gMnSc1 🔗
  • král
Rod N.[MFN].* 🔗 k1g[MFN].* 🔗
  • N-FS6------------ 🔗
  • k1gFnSc6 🔗
  • zemi
Číslo N..[SDP].* 🔗 k1.*n[SDP].* 🔗
  • N-FD4------------ 🔗
  • k1gFnDc4 🔗
  • oči
Pád N...[1-7].* 🔗 k1.*c[1-7].* 🔗
  • N-NS2------------ 🔗
  • k1gNnSc2 🔗
  • města

V současné době jsou lemmatizována a morfologicky značkována pouze podstatná jména obecná (apelativa), nikoli vlastní (propria).

Při hledání podle kombinace kategorií uvádějte atributy v pořadí podle tabulky, resp. příkladů. U pozičních značek umisťujte konkrétní hodnoty kategorií do odpovídajících pozic (první je slovní druh, třetí jmenný rod atd.), a zbývající pozice pokryjte výrazem .* 🔗, tedy např. N.F.* 🔗. U atributivních značek stejný výraz (.* 🔗) používejte navíc v případě, kdy vynecháváte jednu nebo více pozic – např. při hledání podstatných jmen v genitivu k1.*c2.* 🔗 se pomocí .* 🔗 přeskakují případné atributy pro jmenný rod a číslo.

Rod každého tvaru je prozatím dán rodem jeho zakončení, nikoli rodem jeho (hyper)lemmatu. Např. v akuzativu duálu substantiva oko je tvar očě středního rodu, zatímco tvar oči ženského rodu.

Nerozlišuje se životnost u mužského rodu.

Přídavná jména

Kategorie Poziční značka Atributivní značka
Slovní druh A.* 🔗 k2.* 🔗

Přídavná jména v tuto chvíli nejsou lemmatizována ani morfologicky značkována.

Zájmena

Kategorie Poziční značka Atributivní značka
Slovní druh P.* 🔗 k3.* 🔗

Zájmena v tuto chvíli nejsou lemmatizována ani morfologicky značkována.

Číslovky

Kategorie Poziční značka Atributivní značka
Slovní druh C.* 🔗 k4.* 🔗

Číslovky v tuto chvíli nejsou lemmatizovány ani morfologicky značkovány.

Slovesa

Kategorie Poziční značka Atributivní značka Příklad
Slovní druh V.* 🔗 k5.* 🔗
  • VpMS----R-.A---I- 🔗
  • k5.*gMnSaImA 🔗
  • kraloval
Negace V.........[AN].* 🔗 k5e[AN].* 🔗 (afirmace ani negace prozatím není značena)
Jmenný rod participia V.[MFN].* 🔗 k5.*g[MFN].* 🔗
  • VpFS----R-.A---I- 🔗
  • k5.*gFnSaImA 🔗
  • milovala
Číslo V..[SDP].* 🔗 k5.*n[SDP].* 🔗
  • VmMD------.----P- 🔗
  • k5.*gMnDaPmD 🔗
  • poděkovavše
Pád participia V...[1-4].* 🔗 k5.*c[1-4].* 🔗
  • VeMP1-----.----I- 🔗
  • k5.*gMnPc1aImS 🔗
  • pamatujíc
Osoba V......[1-3].* 🔗 k5.*p[1-3].* 🔗
  • Vi-S---2--.----P- 🔗
  • k5.*nSp2aPmR 🔗
  • smiluj
Vid V...............[IP].* 🔗 k5.*a[IP].* 🔗
  • V--P---3I-.A---I- 🔗
  • k5.*nPp3aImM 🔗
  • rozsuzováchu
Způsob / čas / forma V[B-]......[P].* 🔗 k5.*m[IOMBRFUSDAN].* 🔗
  • V--P---3A-.A---P- 🔗
  • k5.*nPp3aPmO 🔗
  • vzradovachu
Vedlejší kategorie Poziční značka Atributivní značka Příklad
Činný slovesný rod (oznamovací způsob a l-ové příčestí) V..........A.* 🔗 k5.*m[IOMBA].* 🔗
  • V--S---3I-[-A]A---I- 🔗
  • k5.*nSp3aImM 🔗
  • uslyšěváše
Trpný slovesný rod Vs.........P.* 🔗 k5.*mN.* 🔗
  • VsNS1-----[-A]P---P- 🔗
  • k5.*gNnSc1aPmN 🔗
  • přěbojováno

Do slovesného „způsobu“ se v atributivním tagsetu řadí i čas

a forma slovesa

Způsob / čas / forma Poziční značka Atributivní značka Příklad
Indikativ prézentu VB......P..A.* 🔗 k5.*mI.* 🔗
  • VB-P---1P-.A---I- 🔗
  • k5.*nPp1aImI 🔗
  • zjěvujem
Indikativ aoristu V.......A..A.* 🔗 k5.*mO.* 🔗
  • V--D---3A-.A---I- 🔗
  • k5.*nDp3aImO 🔗
  • následovasta
Indikativ imperfekta V.......I..A.* 🔗 k5.*mM.* 🔗
  • V--P---3I-.A---I- 🔗
  • k5.*nPp3aImM 🔗
  • panováchu
Indikativ futura VB......F..A.* 🔗 k5.*mB.* 🔗 tvary futura prozatím nejsou značkovány
Imperativ Vi.* 🔗 k5.*mR.* 🔗
  • Vi-P---1--.----I- 🔗
  • k5.*nPp1aImR 🔗
  • radujmy
Infinitiv Vf.* 🔗 k5.*mF.* 🔗
  • Vf--------.----I- 🔗
  • k5.*aImF 🔗
  • tancěvati
Supinum V\$.* 🔗 k5.*mU.* 🔗
  • V\$--------.----I- 🔗
  • k5.*aImU 🔗
  • připravovat
Příčestí nt-ové Ve.* 🔗 k5.*mS.* 🔗
  • VeMP1-----.----I- 🔗
  • k5.*gMnPc1aImS 🔗
  • pamatujíc
Příčestí s-ové Vm.* 🔗 k5.*mD.* 🔗
  • VmFS------.----P- 🔗
  • k5.*gFnSaPmD 🔗
  • poděkovavši
Příčestí l-ové Vp......R..A.* 🔗 k5.*mA.* 🔗
  • VpMS----R-.A---I- 🔗
  • k5.*gMnSaImA 🔗
  • usdravoval
Příčestí n/t-ové Vs.........P.* 🔗 k5.*mN.* 🔗
  • VsMP1-----.P---I- 🔗
  • k5.*gMnPc1aImN 🔗
  • pasováni

Příslovce

Kategorie Poziční značka Atributivní značka Příklad
Slovní druh D.* 🔗 k6.* 🔗
  • D--------1------- 🔗
  • k6d1 🔗
  • mnoho
Stupeň D........[1-3].* 🔗 k6d[1-3] 🔗
  • D--------2------- 🔗
  • k6d2 🔗
  • viece
Nestupňovatelné D........-.* 🔗 k6 🔗
  • D---------------- 🔗
  • k6 🔗
  • potom

Předložky

Kategorie Poziční značka Atributivní značka Příklad
Slovní druh R.* 🔗 k7.* 🔗
  • R---4------------ 🔗
  • k7c4 🔗
  • pro
Pád R---[1-7]------------ 🔗 k7c[1-7] 🔗
  • R---3------------ 🔗
  • k7c3 🔗
  • proti

Spojky

Kategorie Poziční značka Atributivní značka Příklad
Slovní druh J---------------- 🔗 k8 🔗
  • J---------------- 🔗
  • k8 🔗
  • nebo

U spojek se nerozlišuje, zda jsou souřadicí nebo podřadicí.

Částice

Kategorie Poziční značka Atributivní značka Příklad
Slovní druh T---------------- 🔗 k9 🔗
  • T---------------- 🔗
  • k9 🔗
  • li

Citoslovce

Kategorie Poziční značka Atributivní značka Příklad
Slovní druh I---------------- 🔗 k0 🔗
  • I---------------- 🔗
  • k0 🔗
  • nuže

Interpunkce

Kategorie Poziční značka Atributivní značka Příklad
Slovní druh Z.* 🔗 kI.* 🔗
  • Z:--------------- 🔗
  • kIxX 🔗
  • -
vnitřní kIxC 🔗
koncová kIxS 🔗
uvozovky kIxQ 🔗
levé závorky kIxL 🔗
pravé závorky kIxR 🔗
ostatní kIxX 🔗

Poziční tagset druhy interpunkce nerozlišuje.