Korpusy na Vokabuláři webovém používají dva ekvivalentní způsoby značkování: poziční tagset (jako korpusy SYN v ČNK) a atributivní tagset (jako české korpusy ve Sketch Engine). Tabulky níže poskytují zároveň jejich přehled a srovnání.
Přehled morfologických značek je rozdělen do tabulek podle slovního druhu. V každé tabulce je pro ilustraci poslední sloupec s příkladem (úplné) poziční značky, (úplné) atributivní značky a tokenu (někdy nazývaného „pozice“), který jim odpovídá.
Pod záhlavími poziční značka a atributivní značka jsou uvedeny
regulární výrazy,
které umožňují vyhledat tokeny např. podle
pádu a dalších jednotlivých (morfologických i jiných lingvistických) kategorií.
V hranatých závorkách (např. v regulárním výrazu N.[MFN].*
🔗) jsou obsaženy
vždy všechny možné hodnoty daného atributu (v tomto případě jmenného rodu).
Chcete-li hledat podstatná jména ženského rodu, uvádějte jedinou možnost
už bez hranatých závorek, tedy N.F.*
🔗.
K hledání podle pozičních značek zvolte typ dotazu CQL a buď nastavte
výchozí atribut tag a regulární výraz zadejte do uvozovek
(např. "N.*"
🔗 vyhledá jednotlivá podstatná jména; uvozovky jsou
prostředkem jazyka CQL),
anebo zadejte atribut tag explicitně např. tímto výrazem: [tag="N.*"]
🔗
(vnější hranaté závorky ohraničují v jazyce CQL podmínky na jeden token).
Při hledání podle atributivních značek buď volte výchozí atribut atag,
anebo použijte výraz ve tvaru [atag="k1.*"]
🔗.
Kategorie | Poziční značka | Atributivní značka | Příklad |
---|---|---|---|
Slovní druh | N.* 🔗 |
k1.* 🔗 |
|
Rod | N.[MFN].* 🔗 |
k1g[MFN].* 🔗 |
|
Číslo | N..[SDP].* 🔗 |
k1.*n[SDP].* 🔗 |
|
Pád | N...[1-7].* 🔗 |
k1.*c[1-7].* 🔗 |
V současné době jsou lemmatizována a morfologicky značkována pouze podstatná jména obecná (apelativa), nikoli vlastní (propria).
Při hledání podle kombinace kategorií uvádějte atributy v pořadí podle
tabulky, resp. příkladů. U pozičních značek umisťujte konkrétní hodnoty
kategorií do odpovídajících pozic (první je slovní druh, třetí jmenný rod atd.),
a zbývající pozice pokryjte výrazem .*
🔗, tedy např. N.F.*
🔗.
U atributivních značek stejný výraz (.*
🔗) používejte navíc v případě,
kdy vynecháváte jednu nebo více pozic – např. při hledání podstatných
jmen v genitivu k1.*c2.*
🔗 se pomocí .*
🔗 přeskakují případné atributy pro
jmenný rod a číslo.
Rod každého tvaru je prozatím dán rodem jeho zakončení, nikoli rodem jeho (hyper)lemmatu. Např. v akuzativu duálu substantiva oko je tvar očě středního rodu, zatímco tvar oči ženského rodu.
Nerozlišuje se životnost u mužského rodu.
Kategorie | Poziční značka | Atributivní značka |
---|---|---|
Slovní druh | A.* 🔗 |
k2.* 🔗 |
Přídavná jména v tuto chvíli nejsou lemmatizována ani morfologicky značkována.
Kategorie | Poziční značka | Atributivní značka |
---|---|---|
Slovní druh | P.* 🔗 |
k3.* 🔗 |
Zájmena v tuto chvíli nejsou lemmatizována ani morfologicky značkována.
Kategorie | Poziční značka | Atributivní značka |
---|---|---|
Slovní druh | C.* 🔗 |
k4.* 🔗 |
Číslovky v tuto chvíli nejsou lemmatizovány ani morfologicky značkovány.
Kategorie | Poziční značka | Atributivní značka | Příklad |
---|---|---|---|
Slovní druh | V.* 🔗 |
k5.* 🔗 |
|
Negace | V.........[AN].* 🔗 |
k5e[AN].* 🔗 |
(afirmace ani negace prozatím není značena) |
Jmenný rod participia | V.[MFN].* 🔗 |
k5.*g[MFN].* 🔗 |
|
Číslo | V..[SDP].* 🔗 |
k5.*n[SDP].* 🔗 |
|
Pád participia | V...[1-4].* 🔗 |
k5.*c[1-4].* 🔗 |
|
Osoba | V......[1-3].* 🔗 |
k5.*p[1-3].* 🔗 |
|
Vid | V...............[IP].* 🔗 |
k5.*a[IP].* 🔗 |
|
Způsob / čas / forma | V[B-]......[P].* 🔗 |
k5.*m[IOMBRFUSDAN].* 🔗 |
Vedlejší kategorie | Poziční značka | Atributivní značka | Příklad |
---|---|---|---|
Činný slovesný rod (oznamovací způsob a l-ové příčestí) | V..........A.* 🔗 |
k5.*m[IOMBA].* 🔗 |
|
Trpný slovesný rod | Vs.........P.* 🔗 |
k5.*mN.* 🔗 |
Do slovesného „způsobu“ se v atributivním tagsetu řadí i čas
I
,O
,M
,B
,R
a forma slovesa
F
,U
,S
,D
,A
,N
.Způsob / čas / forma | Poziční značka | Atributivní značka | Příklad |
---|---|---|---|
Indikativ prézentu | VB......P..A.* 🔗 |
k5.*mI.* 🔗 |
|
Indikativ aoristu | V.......A..A.* 🔗 |
k5.*mO.* 🔗 |
|
Indikativ imperfekta | V.......I..A.* 🔗 |
k5.*mM.* 🔗 |
|
Indikativ futura | VB......F..A.* 🔗 |
k5.*mB.* 🔗 |
tvary futura prozatím nejsou značkovány |
Imperativ | Vi.* 🔗 |
k5.*mR.* 🔗 |
|
Infinitiv | Vf.* 🔗 |
k5.*mF.* 🔗 |
|
Supinum | V\$.* 🔗 |
k5.*mU.* 🔗 |
|
Příčestí nt-ové | Ve.* 🔗 |
k5.*mS.* 🔗 |
|
Příčestí s-ové | Vm.* 🔗 |
k5.*mD.* 🔗 |
|
Příčestí l-ové | Vp......R..A.* 🔗 |
k5.*mA.* 🔗 |
|
Příčestí n/t-ové | Vs.........P.* 🔗 |
k5.*mN.* 🔗 |
Kategorie | Poziční značka | Atributivní značka | Příklad |
---|---|---|---|
Slovní druh | D.* 🔗 |
k6.* 🔗 |
|
Stupeň | D........[1-3].* 🔗 |
k6d[1-3] 🔗 |
|
Nestupňovatelné | D........-.* 🔗 |
k6 🔗 |
Kategorie | Poziční značka | Atributivní značka | Příklad |
---|---|---|---|
Slovní druh | R.* 🔗 |
k7.* 🔗 |
|
Pád | R---[1-7]------------ 🔗 |
k7c[1-7] 🔗 |
Kategorie | Poziční značka | Atributivní značka | Příklad |
---|---|---|---|
Slovní druh | J---------------- 🔗 |
k8 🔗 |
U spojek se nerozlišuje, zda jsou souřadicí nebo podřadicí.
Kategorie | Poziční značka | Atributivní značka | Příklad |
---|---|---|---|
Slovní druh | T---------------- 🔗 |
k9 🔗 |
Kategorie | Poziční značka | Atributivní značka | Příklad |
---|---|---|---|
Slovní druh | I---------------- 🔗 |
k0 🔗 |
Kategorie | Poziční značka | Atributivní značka | Příklad |
---|---|---|---|
Slovní druh | Z.* 🔗 |
kI.* 🔗 |
|
vnitřní | kIxC 🔗 |
|
|
koncová | kIxS 🔗 |
|
|
uvozovky | kIxQ 🔗 |
|
|
levé závorky | kIxL 🔗 |
|
|
pravé závorky | kIxR 🔗 |
|
|
ostatní | kIxX 🔗 |
|
Poziční tagset druhy interpunkce nerozlišuje.