Rechercher une page de manuel
hunspell
Langue: hu
Version: 2008. ĂĄprilis 11. (fedora - 06/07/09)
Section: 4 (Pilotes et protocoles réseau)
Sommaire
NĂV
hunspell - a Hunspell ĂĄllomĂĄnyainak formĂĄtumaLEĂRĂS
A Hunspell(1) kĂŠt ĂĄllomĂĄnyt igĂŠnyel egy adott nyelven tĂśrtĂŠnĹ helyesĂrĂĄs-ellenĹrzĂŠshez. Az elsĹ ĂĄllomĂĄny egy szĂłtĂĄrĂĄllomĂĄny, ami az adott nyelv szavait, ĂŠs ezek kapcsolĂłit (attribĂştumait) tartalmazza. A mĂĄsodik ĂĄllomĂĄny egy ragozĂĄsi (affixum) ĂĄllomĂĄny, ami meghatĂĄrozza az emlĂtett kapcsolĂłk jelentĂŠsĂŠt.SZĂTĂRĂLLOMĂNY
Egy hunspell szĂłtĂĄrĂĄllomĂĄny (*.dic) elsĹ sora a szĂłtĂĄrĂĄllomĂĄnyban lĂŠvĹ szavak kĂśzelĂtĹ szĂĄmĂĄt tartalmazza (az optimĂĄlis mĂŠretĹą memĂłriaterĂźlet lefoglalĂĄsĂĄhoz). A tĂśbbi sor soronkĂŠnt egy szĂłt tartalmaz. Minden szĂł utĂĄn nem kĂśtelezĹen egy perjel, ĂŠs egy, vagy tĂśbb kapcsolĂł kĂśvetkezhet. A kapcsolĂłk egybetĹąsek, ĂŠs meghatĂĄrozzĂĄk, hogy milyen toldalĂŠkokat kaphat a tĹszĂł, illetve milyen egyĂŠb speciĂĄlis tulajdonsĂĄgokkal rendelkezik. PĂŠldĂĄul a-
1 hunspellezik/EeX
szĂłtĂĄr egy szĂłt tartalmaz (hunspell), ami a magyar ragozĂĄsi ĂĄllomĂĄny alapjĂĄn alanyi ĂŠs tĂĄrgyas igeragozĂĄst is vonz (E ĂŠs e kapcsolĂłk), valamint igekĂśtĹ prefixumokat is kaphat. A pĂŠlda szĂłtĂĄrĂĄllomĂĄny ĂŠs a magyar ragozĂĄsi ĂĄllomĂĄny alapjĂĄn a meghunspelleztĂŠtek helyes szĂłkĂŠnt kerĂźlne felismerĂŠsre.
A szĂłtĂĄri szavak perjelet is tartalmazhatnak, ha az fordĂtott perjellel van bevezetve: "/". A kapcsolĂłk alapĂŠrtelmezĂŠskĂŠnt egy karakteresek, de ha tĂśbb ragozĂĄsi osztĂĄlyt szeretnĂŠnk hasznĂĄlni, ez tĂśbb karakteresre vagy szĂĄmra is mĂłdosĂthatĂł.
A Hunspell szĂłtĂĄrĂĄllomĂĄnyok sorai kiegĂŠszĂtĹ adatmezĹket is tartalmazhatnak, amelyek szĂłkĂśzĂśkkel vagy tabulĂĄtorokkal vannak elvĂĄlasztva (l. kiegĂŠszĂtĹ adatmezĹk).
A szemĂŠlyes szĂłtĂĄrak egyszerĹą szĂłlistĂĄk. Megadhatunk perjellel elvĂĄlasztott pĂŠldaszavakat is a toldalĂŠkolĂĄs engedĂŠlyezĂŠsĂŠre:
-
Obama/Tamara
A pĂŠldĂĄban a Tamara szĂł toldalĂŠkolĂĄsĂĄt a szemĂŠlyes szĂłtĂĄr Obama szavĂĄra is alkalmazza az ellenĹrzĹ, elfogadva az ObamĂĄrĂłl, ObamĂĄĂŠkat stb. alakokat is.
RAGOZĂSI ĂLLOMĂNY
A ragozĂĄsi ĂĄllomĂĄny rendszerint kisebb mĂŠretĹą. KĂźlĂśnfĂŠle definĂciĂłkat ĂŠs ragozĂĄsi szabĂĄlyokat ad meg meghatĂĄrozott kulcsszĂłival. PĂŠldĂĄul a SET a karakterkĂłdolĂĄs, a TRY javaslattevĂŠsnĂŠl mĂłdosĂtot betĹąk, a REP a javaslattevĂŠsnĂŠl mĂłdosĂtott szĂłrĂŠszletek, a PFX ĂŠs az SFX pedig a szĂł elejĂŠre ĂŠs vĂŠgĂŠre illesztendĹ toldalĂŠkok megadĂĄsĂĄra szolgĂĄl.A kĂśvetkezĹ pĂŠlda egy UTF-8-as kĂłdolĂĄsĂş szĂłtĂĄr affixumĂĄllomĂĄnyĂĄnak definĂciĂłja. A TRY felsorolja a magyar betĹąket gyakorisĂĄgi sorrendjĂźkben, a LANG beĂĄllĂtja a magyar nyelvet, a WORDCHARS megadja azokat a karaktereket, amelyeket a parancssori Hunspell a szavak rĂŠszekĂŠnt fog kezelni.
-
SET UTF-8 TRY ĂóúĂĂĂtaeslzĂĄnorhgkiĂŠdmyĹpvĂśbucfjߏxwqTAESLZĂNORHGKIĂDMYĹPVĂBUCFJĂĹ°XWQ-. LANG hu_HU WORDCHARS -.§%â°Â°0123456789 REP 2 REP j ly REP ly j PFX X Y 3 PFX X 0 meg . PFX X 0 rĂĄ . PFX X 0 Ăśssze . SFX e Y 6 SFX e ik tĂźk e[dz]ik SFX e ik tĂŠtek e[dz]ik SFX e ik tĂŠk e[dz]ik SFX e 0 tĂźk e[dzt] SFX e 0 tĂŠtek e[dzt] SFX e 0 tĂŠk e[dzt] SFX f Y 2 SFX f ik het/e e[dz]ik SFX f ik tet/e e[dz]ik
A REP a j ĂŠs ly felcserĂŠlĂŠse esetĂŠn ad jĂł ĂŠs elĂśl rangsorolt javaslatokat. A PFX-ek pĂĄr igekĂśtĹt definiĂĄlnak, az SFX-ek pedig pĂĄr igeragot. Ezek nagyobb rĂŠszĂŠnĂŠl a szĂł vĂŠgi ik is levĂĄgĂĄsra kerĂźl a toldalĂŠk illesztĂŠse elĹtt. Itt az illesztĂŠs feltĂŠtele, hogy az igĂŠk -edik vagy -ezik karaktersorozatra vĂŠgzĹdjenek, kĂźlĂśnben pedig az -ed, -ez vagy -et betĹąkre. Az f jelĹą toldalĂŠkolĂĄsi osztĂĄly ĂŠrdekessĂŠge, hogy a -het ĂŠs -tet illesztĂŠse utĂĄn mĂŠg folytatĂłdhat a toldalĂŠkolĂĄs az e jelĹą toldalĂŠkolĂĄsi osztĂĄllyal (ezt a het/e ls tet/e hatĂĄrozza meg), Ăgy kaphat -hettĂźk, -hettĂŠtek, -hettĂŠk, -tettĂźk, -tettĂŠtek, -tettĂŠk toldalĂŠkokat a szĂłtĂĄrban szereplĹ levelezik szĂł:
-
1 levelezik/e
ĂLTALĂNOS PARAMĂTEREK
A Hunspell forrĂĄs tĂśbb mint 80 pĂŠldĂĄt tartalmaz a paramĂŠterek hasznĂĄlatĂĄra vonatkozĂłan. A kĂśvetkezĹ leĂrĂĄs nem teljes, l. mĂŠg az angol kĂŠzikĂśnyvoldalt is.- SET karakterkĂłd
- A szĂłtĂĄr ĂŠs affixumĂĄllomĂĄny karakterkĂłdolĂĄsĂĄnak beĂĄllĂtĂĄsa. A lehetsĂŠges ĂŠrtĂŠkek: UTF-8, ISO8859-1-tĹl ISO8859-10-ig, ISO8859-13-ISO8859-15, KOI8-R, KOI8-U, microsoft-cp1251, ISCII-DEVANAGARI.
- FLAG ĂŠrtĂŠk
- A kapcsolĂłk 1 karakteres alapbeĂĄllĂtĂĄsĂĄnak mĂłdosĂtĂĄsa. (A ragozĂĄsi osztĂĄlyokat ĂŠs egyĂŠb tulajdonsĂĄgokat jelĂślik a kapcsolĂłk, amelyek alapĂŠrtelmezĂŠs szerint 1 karakteresek, a pĂŠkdĂĄkban legtĂśbbszĂśr nagybetĹąvel szerepelnek). Az `UTF-8' ĂŠrtĂŠkkel Unicode karaktereket hasznĂĄlhatunk kapcsolĂłkĂŠnt (UTF-8 kĂłdolĂĄssal ĂŠs maximum 65 ezres karakterkĂłdig), a `long' ĂŠrtĂŠkkel kĂŠt karakteres kapcsolĂłkat (tĂśbb kapcsolĂł esetĂŠn sincs elvĂĄlasztĂłjel, a `num' ĂŠrtĂŠkkel vesszĹvel elvĂĄlasztott decimĂĄlis szĂĄmokat 1-tĹl 65 ezerig.
- COMPLEXPREFIXES
- KĂŠtszeres prefixumillesztĂŠst ĂĄllĂt be (de csak egyszeres szuffixumokat az alapĂŠrtelmezett kettĹ helyett.) JobbrĂłl balra ĂrĂł ragasztĂł nyelveknĂŠl hasznos.
- LANG nyelvkĂłd
- Nyelv megadĂĄsa (nyelvfĂźggĹ programrĂŠszek bekapcsolĂĄsĂĄhoz) az ISO nyelv- ĂŠs rĂŠgiĂłkĂłddal (pl. hu_HU).
- IGNORE karakterek
- A felsorolt karaktereket tĂśrli a szĂłtĂĄri szavakbĂłl ĂŠs toldalĂŠkokbĂłl, valamint a bemeneti szavakbĂłl. Hasznos az opcionĂĄlis ĂrĂĄsjelek, mint az arab vagy a hĂŠber mellĂŠkjelek kezelĂŠsĂŠre.
- AF a_kĂśvetkezĹ_AF_sorok_szĂĄma
- AF kapcsolĂłk
- A Hunspell program kĂŠpes a kapcsolĂłhalmazokat egy termĂŠszetes szĂĄmmal helyettesĂteni a szĂłtĂĄrĂĄllomĂĄnyban ĂŠs a tĂśbbszĂśrĂśs toldalĂŠkĂĄsnĂĄl az affixumĂĄllomĂĄnyban (alias tĂśmĂśrĂtĂŠs), felgyorsĂtva ezzel a szĂłtĂĄr betĂśltĹdĂŠsĂŠt ĂŠs csĂśkkentve a program memĂłriaigĂŠnyĂŠt. Egy rĂśvid pĂŠlda:
-
3 hello try/1 work/2
Ăs a kapcsolĂłdĂł AF definĂciĂłk az affixumĂĄllomĂĄnyban:
-
SET UTF-8 TRY esianrtolcdugmphbyfvkwzESIANRTOLCDUGMPHBYFVKWZ' AF 2 AF A AF AB
Ami megfelel a kĂśvetkezĹ szĂłtĂĄrĂĄllomĂĄnynak:
-
3 hello try/A work/AB
LĂĄsd mĂŠg a tests/alias* pĂŠldĂĄt a forrĂĄsban.
MegjegyzĂŠs: az AF sorok nem elĹzhetik meg a FLAG paramĂŠtert. Alias tĂśmĂśrĂtĂŠsre szolgĂĄl a Hunspell makealias segĂŠdprogramja.
- AM a_kĂśvetkezĹ_AM_sorok_szĂĄma
- AM morfolĂłgiai_ĂŠs_egyĂŠb_adatmezĹk
- A Hunspell program kĂŠpes a kiegĂŠszĂtĹ adatmezĹket egy termĂŠszetes szĂĄmmal helyettesĂteni, az AF paramĂŠterhez hasonlĂłan. LĂĄsd mĂŠg a tests/alias* pĂŠldĂĄt a forrĂĄsban.
JAVĂTĂSI PARAMĂTEREK
Az alapĂŠrtelmezett n-gram, illetve betĹącserĂŠn ĂŠs -tĂśrlĂŠsen alapulĂł javaslatokat kiegĂŠszĂthetjĂźk a javĂtĂĄsi paramĂŠterekkel. A REP segĂt a tipikus hibĂĄk ĂŠs javĂtĂĄsuk megadĂĄsĂĄban. A PHONE a kiejtĂŠst kevĂŠsbĂŠ kĂśvetĹ ĂrĂĄsrendszereknĂŠl nyĂşjt segĂtsĂŠget.- KEY szomszĂŠdos_karakterek_opcionĂĄlisan_fĂźggĹleges_vonallal_elvĂĄlasztva
- A nyelv alapĂŠrtelmezett billentyĹązetkiosztĂĄsĂĄt adhatjuk meg a KEY paramĂŠterrel, hogy a javaslatoknĂĄl a szomszĂŠdos betĹąk elĂźtĂŠsĂŠt felismerje a program. A nem szomszĂŠdos betĹąket fĂźggĹleges vonallal vĂĄlaszthatjuk el:
-
KEY Üßó|qwertzuiopĹĂş|asdfghjklĂŠĂĄĹą|Ăyxcvbnm
- TRY karakterek
- A javaslattevĂŠsnĂŠl az 1 karakteres prĂłbĂĄlkozĂĄsoknĂĄl az itt felsorolt karakterekre cserĂŠl, illetve bĹvĂt. A paramĂŠternĂŠl a kis- ĂŠs nagybetĹąket kĂźlĂśn kell megadni.
- NOSUGGEST kapcsolĂł
- Az itt definiĂĄlt kapcsolĂłval jelĂślt szavakat a program nem javasolja a hibajavĂtĂĄsnĂĄl. VulgĂĄris ĂŠs obszcĂŠn szavak esetĂŠben hasznos.
- MAXNGRAMSUGS
- Az n-gram (n hosszĂş szĂłrĂŠszletek megegyezĹsĂŠge alapjĂĄn sĂşlyozott) javaslatok maximĂĄlis szĂĄmĂĄnak beĂĄllĂtĂĄsa. AlapĂŠrtelmezetten 5. A 0 ĂŠrtĂŠk kikapcsolja az n-gram javaslatokat.
- NOSPLITSUGS
- Nem javasol szĂłfelbontĂĄst a Hunspell ezzel a beĂĄllĂtĂĄssal. HiĂĄnyzĂł ĂśsszetettszĂł-kezelĂŠs esetĂŠn hasznos a hibĂĄs kĂźlĂśnĂrĂĄsi javaslatok tiltĂĄsĂĄra.
- SUGSWITHDOTS
- Ha a hibĂĄs szĂł pont(ok)ra vĂŠgzĹdik, ezeket a javaslatok esetĂŠben is feltĂźnteti. Az OpenOffice.org szĂłtĂĄrak szĂĄmĂĄra nem szĂźksĂŠges ez a beĂĄllĂtĂĄs.
- REP szĂĄm
- REP mit mire
- A javĂtĂĄsi cseretĂĄblĂĄzat megadĂĄsĂĄra szolgĂĄlĂł definĂciĂłk. Az elsĹ REP utĂĄn adjuk meg a tĂśbbi REP sor szĂĄmĂĄt. Ezek a sorok mĂĄr kĂŠt paramĂŠtert vĂĄrnak: elĹszĂśr megadjuk a felismerendĹ mintĂĄt (hibĂĄs szĂłrĂŠszletet), utĂĄna pedig azt a karaktersorozatot, amire a felismert mintĂĄt javĂtani szeretnĂŠnk. A helyesĂrĂĄs-ellenĹrzĹ a cseretĂĄblĂĄzat rĂŠvĂŠn tud helyes javaslatot tenni tĂśbbkarakteres eltĂŠrĂŠs (pl. j-ly) esetĂŠn.
A szĂłkĂśz alĂĄhĂşzĂĄsjellel helyettesĂtendĹ a javaslatokban:
-
REP 1 REP vĂŠgĂźlis vĂŠgĂźl_is
A szervĂz, szintĹą ĂŠs a hasonlĂł hibĂĄs Ăśsszetett szavak letiltĂĄsĂĄban szintĂŠn a REP tĂĄblĂĄzat segĂt a CHECKCOMPOUNDREP megadĂĄsĂĄval (l. ott).
- MAP a_MAP_definĂciĂłk_szĂĄma
- MAP karakterek
- Rokon karaktereket adhatunk meg tĂśbb sorban. A javaslattevĂŠsnĂŠl tĂśbb rokon karakter cserĂŠje is lehetsĂŠges, Ăgy pĂŠldĂĄul ĂŠkezet nĂŠlkĂźli szavakat is kĂŠpes ĂŠkezetesĂteni a Hunspell a kĂśvetkezĹ definĂciĂł mellett:
-
MAP 5 MAP aå MAP eÊ MAP ià MAP oóÜŠMAP uúߏ
- PHONE a_PHONE_definĂciĂłk_szĂĄma
- PHONE karakterek
- A PHONE egy tĂĄblĂĄzattal megadhatĂł fonetikus ĂĄtĂrĂĄsi algoritmust hasznĂĄl a kiejtĂŠsi hasonlĂłsĂĄg kiszĂĄmĂtĂĄsĂĄra. KĂźlĂśnĂśsen hasznos azoknĂĄl a nyelveknĂŠl, ahol az ĂrĂĄs nem tĂźkrĂśzi a kiejtĂŠst. A rĂŠszletes dokumentĂĄciĂł az Aspell helyesĂrĂĄs-ellenĹrzĹ oldalĂĄn ĂŠrhetĹ el angol nyelven: http://aspell.net/man-html/Phonetic-Code.html.
MegjegyzĂŠs: a szabĂĄlyokban szereplĹ kapcsos zĂĄrĂłjelek nem tartalmazhatnak mĂŠg tĂśbb byte-os UTF-8 karaktereket, ahogy a kĂśtĹjeles kifejezĂŠsek is byte-ot jelĂślnek, nem karaktert Unicode szĂłtĂĄr esetĂŠn is.
SZĂ-ĂSSZETĂTELEZĂSI PARAMĂTEREK
- BREAK a_BREAK_definĂciĂłk_szĂĄma
- BREAK karakter_vagy_karaktersorozat
- Ha a keresett szĂł nincs a szĂłtĂĄrban, a felsorolt karaktereknĂŠl vagy karaktersorozatoknĂĄl felbontja ĂŠs rĂŠszenkĂŠnt ellenĹrzi. Hasznos pĂŠldĂĄul a kis- ĂŠs nagykĂśtĹjeles szavaknĂĄl a magyarban.
- COMPOUNDRULE
- RegulĂĄris kifejezĂŠsekhez hasonlĂł ĂśsszetĂŠteli szabĂĄlyok megadĂĄsa.
- COMPOUNDMIN szĂĄm
- A legkisebb szĂłhossz, ami mĂŠg Ăśsszetett szĂłban szerepelhet. AlapĂŠrtelmezĂŠs szerint 3 karakter.
- COMPOUNDFLAG kapcsolĂł
- Itt adható meg a szóÜsszetÊtelben való szereplÊst engedÊlyezŠkapcsoló.
- COMPOUNDBEGIN kapcsolĂł
- A kapcsolĂł az Ăśsszetett szavak elsĹ tagjakĂŠnt engedĂŠlyezi a megjelĂślt szavakat.
- COMPOUNDLAST kapcsolĂł
- A kapcsolĂł az Ăśsszetett szavak utolsĂł tagjakĂŠnt engedĂŠlyezi a megjelĂślt szavakat. KombinĂĄlhatĂł az elĹzĹ kapcsolĂłval.
- COMPOUNDMIDDLE kapcsolĂł
- A kapcsolĂł az Ăśsszetett szavak kĂśzbensĹ tagjakĂŠnt engedĂŠlyezi a megjelĂślt szavakat. KombinĂĄlhatĂł a kĂŠt elĹzĹ kapcsolĂłval.
- ONLYINCOMPOUND kapcsolĂł
- Csak az Ăśsszetett szavakban megjelenĹ ragozĂĄs jelĂślĂŠsĂŠre szolgĂĄlĂł kapcsolĂł (germĂĄn nyelvek esetĂŠben tipikus).
- CIRCUMFIX kapcsolĂł
- Ezzel a kapcsolĂłval jelĂślt szuffixum csak ugyanilyen kapcsolĂłval jelĂślt prefixummal jelenhet meg egy tĂśvĂśn. (Pl. leg-ĂŠdes-ebb).
- COMPOUNDPERMITFLAG kapcsolĂł
- AlapĂŠrtelmezĂŠs szerint a prefixumok ĂŠs szuffixumok nem fordulhatnak elĹ az Ăśsszetett szavak belsejĂŠben. A COMPOUNDPERMITFLAG kapcsolĂłval rendelkezĹ affixumok viszont itt is megjelenhetnek.
- COMPOUNDFORBIDFLAG kapcsolĂł
- ToldalĂŠkolt szavak szóÜsszetĂŠtelben valĂł szereplĂŠsĂŠt tiltĂł kapcsolĂł. A tiltĂĄshoz az adott SFX szabĂĄly folytatĂĄsi osztĂĄlyakĂŠnt (l. kĂŠsĹbb) adjuk meg ezt a kapcsolĂłt.
- COMPOUNDROOT kapcsolĂł
- A szĂłtĂĄrba kĂśzvetlenĂźl felvett Ăśsszetett szavakat jelĂślĹ kapcsolĂł. A COMPOUNDWORDMAX, ĂŠs Ăgy a magyar esetĂŠben a 6â3-as szabĂĄly mĹąkĂśdĂŠsĂŠt befolyĂĄsolja azzal, hogy a COMPOUNDROOT kapcsolĂłval Ăśsszetettnek jelĂślt szavak kĂŠt szĂłnak szĂĄmĂtanak.
- COMPOUNDWORDMAX szĂĄm
- A szóÜsszetĂŠtelekben szereplĹ egyszerĹą tĂśvek maximĂĄlis szĂĄma. A magyar esetĂŠben 2 az ĂŠrtĂŠk, e fĂślĂśtti szĂłszĂĄmnĂĄl mĂĄr ĂŠletbe lĂŠp a 6â3-as szabĂĄly.
- COMPOUNDSYLLABLE szĂĄm karakterek
- KĂŠt paramĂŠtert vĂĄr. Az elsĹ megadja az Ăśsszetett szavak tĂśvĂŠnek maximĂĄlis szĂłtagszĂĄmĂĄt, ami a magyar helyesĂrĂĄs 6â3-as szabĂĄlya szerint 6. A mĂĄsodik mezĹ felsorolja a magĂĄnhangzĂłkat, ami a szĂłtagszĂĄm megĂĄllapĂtĂĄsĂĄhoz szĂźksĂŠges. Ha hiĂĄnyzik ez a definĂciĂł, akkor nincsen korlĂĄtozĂĄs az Ăśsszetett szavak tĂśvĂŠnek szĂłtagszĂĄmĂĄra vonatkozĂłan.
- SYLLABLENUM kapcsolĂłk
- Egy paramĂŠtert vĂĄr. A paramĂŠterben megadhatĂłak azok a ragozĂĄsi osztĂĄlyok, amelyek ragozĂĄs esetĂŠn eggyel nĂśvelik az Ăśsszetett szavak tĂśvĂŠnĂŠl kiszĂĄmĂtott szĂłtagszĂĄmot. A magyarban ezek a mellĂŠknĂŠvkĂŠpzĹk: kerĂŠkpĂĄrjavĂtĂĄsainkrĂłl, de kerĂŠkpĂĄr-javĂtĂĄsi. A
- FORBIDDENWORD kapcsolĂł
- A tiltott szavakat jelÜlŠkapcsoló. A tiltott szótÜvek toldalÊkolt alakjai is letiltåsra kerßlnek. A tiltott szavak akår toldalÊkolåsi, vagy szóÜsszetÊteli szinonimakÊnt sem kerßlnek elfogadåsra.
- PSEUDOROOT kapcsolĂł
- A kapcsolĂłval jelĂślt szavak toldalĂŠkolt alakjai kerĂźlnek csak elfogadĂĄsra. FiktĂv tĂśvek megadĂĄsĂĄra szolgĂĄlĂł kapcsolĂł. A tĹ lehet mĂŠg helyes szĂł, ha ĂŠrvĂŠnyes szinonimakĂŠnt elĹĂĄll vagy szerepel a szĂłtĂĄrban.
- WORDCHARS karakterek
- ParamĂŠtere azok a karakterek, amelyek a beĂĄllĂtott kĂłdolĂĄs (pl. a magyar esetĂŠben az ISO-8859-2) betĹąi mellett mĂŠg az adott nyelv szavaiban elĹfordulhatnak. Ilyen pĂŠldĂĄul a magyarban a kĂśtĹjel, pont, szĂĄzalĂŠkjel, fokjel, paragrafusjel ĂŠs a nagykĂśtĹjel. Az utĂłbbi csak UTF-8, vagy microsoft-cp1250 karakterkĂŠszlet mellett lesz hasznĂĄlhatĂł a magyar szĂłtĂĄrban.
- PFX kapcsolĂł keresztkombinĂĄlĂłdĂĄs szĂĄm
- PFX kapcsolĂł levĂĄgĂĄs prefixum feltĂŠtel morfolĂłgia
- Prefixum megadĂĄsĂĄra szolgĂĄlĂł definĂciĂłk. A prefixumok egykarakteres nĂŠvvel jelĂślt osztĂĄlyokba vannak sorolva. A pĂŠldĂĄban az X osztĂĄly definĂciĂłja lĂĄthatĂł. Az egyes osztĂĄlyokra vonatkozĂł PFX fejlĂŠc tartalmazza a kĂśvetkezĹket:
(1) az osztĂĄly betĹąjelĂŠt (a pĂŠldĂĄban X)
(2) a keresztbe valĂł kombinĂĄlĂĄs engedĂŠlyezĂŠse, illetve tiltĂĄsa (Y/N). EngedĂŠlyezĂŠs esetĂŠn az adott prefixum akkor is alkalmazhatĂł, ha a tĹszĂł toldalĂŠkolt alakban fordul elĹ. Ehhez az is szĂźksĂŠges, hogy a toldalĂŠk (affixum) ragozĂĄsi osztĂĄlyĂĄban is legyen engedĂŠlyezve a kombinĂĄlĂĄs.
(3) az osztĂĄlyba tartozĂł bejegyzĂŠsek szĂĄmĂĄt
A PFX fejlĂŠcet kĂśvetĹ sorokban a PFX paramĂŠterek jelentĂŠse a kĂśvetkezĹ:
(1) az osztĂĄly betĹąjele
(2) a ragozĂĄsnĂĄl a szĂł elejĂŠrĹl levĂĄlasztandĂł karaktersorozat. Ha nem kell levĂĄlasztani, akkor 0.
(3) a prefixum (pĂŠldĂĄul igekĂśtĹ, vagy a leg-, legesleg- a mellĂŠkneveknĂŠl). Perjellel elvĂĄlasztva kapcsolĂłkat is megadhatunk (l. tĂśbbszĂśrĂśs toldalĂŠkolĂĄs).
(4) a minta, ami ha illeszkedik, alkalmazhatĂł a szabĂĄly. PĂŠldĂĄul ha itt kutya szerepelne, akkor csak a kutya kezdetĹą szavak elĂŠ lehetne tenni az ebben a sorban megadott prefixumot. A minta megadĂĄsĂĄnĂĄl a pont (.) speciĂĄlis jelentĂŠssel bĂr: minden karakterre illeszkedik. Megadhatunk csak bizonyos karakterekre illeszkedĹ mintĂĄt is szĂśgletes zĂĄrĂłjelek segĂtsĂŠgĂŠvel. PĂŠldĂĄul az [abcd] illeszkedik az a, b, c, illetve d karakterekre is. EllentĂŠtben az Ispell-lel, a kĂśtĹjel szerepe a szĂśgletes zĂĄrĂłjelek kĂśzĂśtt nem speciĂĄlis, vagyis kĂśtĹjelet jelent, ĂŠs nem karaktertartomĂĄnyt. Ha a nyitĂł szĂśgletes zĂĄrĂłjel utĂĄn kalap (^) karakter talĂĄlhatĂł, a karaktertartomĂĄny komplementerĂŠre illeszkedik a minta, hasonlĂłan a regulĂĄris kifejezĂŠsekhez (l. regex(7)).
(5) MorfolĂłgiai leĂrĂĄs. SzĂłkĂśzzel vagy tabulĂĄtorral elvĂĄlasztott mezĹk. A mezĹnevek ĂŠs hasznĂĄlatuk az angol kĂŠzikĂśnyvoldalon talĂĄlhatĂł.
- SFX kapcsolĂł keresztkombinĂĄlĂłdĂĄs szĂĄm
- SFX kapcsolĂł szuffixum feltĂŠtel mofolĂłgiai_leĂrĂĄs
- A PFX-szel megegyezĹ paramĂŠtereket kap, csak nem a szĂł eleji, hanem a szĂł vĂŠgi toldalĂŠkok leĂrĂĄsĂĄra szolgĂĄl. A pĂŠldĂĄban szereplĹ definĂciĂłk jelentĂŠse: az -edik, vagy -ezik vĂŠgĹą szavakra alkalmazhatĂł a hĂĄrom szabĂĄly. A rag illesztĂŠsĂŠnĂŠl levesszĂźk a szĂł vĂŠgi -ik karaktersorozatot, ĂŠs szabĂĄlytĂłl fĂźggĹen illesztjĂźk a -tĂźk, -tĂŠtek, -tĂŠk toldalĂŠkokat, vĂŠgeredmĂŠnyben -edtĂźk, -edtĂŠtek, -edtĂŠk, illetve -eztĂźk, -eztĂŠtek, -eztĂŠk vĂŠgĹą szavakat kapva.
- TĂśbbszĂśrĂśs toldalĂŠkolĂĄs
- A PFX ĂŠs az SFX szabĂĄlyokban a toldalĂŠk perjellel elvĂĄlasztva kapcsolĂłkat is kaphat, hasonlĂłan a szĂłtĂĄrĂĄllomĂĄny tĂśveihez. A kapcsolĂłk a kĂśvetkezĹek lehetnek:
(1) SFX szabĂĄlyban az SFX folytatĂĄs jelentĂŠse, hogy a toldalĂŠk mĂŠg tovĂĄbb ragozĂłdhat a megadott kapcsolĂłkkal (tĂśbbszĂśrĂśs affixumlevĂĄlasztĂĄs). A Hunspell esetĂŠben csak a kĂŠtszeres affixumlevĂĄlasztĂĄs lett megvalĂłsĂtva, tehĂĄt a folytatĂĄsi osztĂĄly folytatĂĄsĂĄt mĂĄr nem veszi figyelembe a program.
(2) SFX szabĂĄlyban a PFX folytatĂĄs jelentĂŠse, hogy az adott prefixum is hozzĂĄjĂĄrulhat a tĹhĂśz, feltĂŠve, ha az SFX szabĂĄly is ĂŠl.
(3) PFX szabĂĄlyban az SFX szabĂĄly jelentĂŠse, hogy a megjelĂślt SFX szabĂĄly a tĹhĂśz jĂĄrulhat, ha a PFX szabĂĄly is ĂŠl.
(4) ONLYINCOMPOUND kapcsoló megadåsåval az adott PFX vagy SFX toldalÊk csak szóÜsszetÊtelben jelentkezhet.
(5) CIRCUMFIX kapcsolĂł megadĂĄsĂĄval az adott SFX csak az ugyanilyen toldalĂŠkot kapĂł PFX-szel egyĂźtt fordulhat csak elĹ.
(6) Az ĂśsszetĂŠteli kapcsolĂłk megadĂĄsĂĄval engedĂŠlyezhetjĂźk vagy letilthatjuk (COMPOUNDFORBIDFLAG) az ĂśsszetĂŠtelben valĂł szereplĂŠst. A Ăśsszetett szavak utolsĂł tagja alapĂŠrtelmezĂŠs szerint minden affixumot felvehet. A kĂśzbensĹ szavaknĂĄl viszont explixit mĂłdon engedĂŠlyezni kell ezt.
A ragozĂĄsi ĂĄllomĂĄny ezeken kĂvĂźl mĂŠg megjegyzĂŠseket is tartalmazhat, ezĂŠrt az adott szĂłtĂĄr vĂĄltozatĂĄt, szerzĹjĂŠt, felhasznĂĄlĂĄsi engedĂŠlyeit itt keressĂźk.
SAJĂT SZĂTĂR
A sajĂĄt szĂłtĂĄr formĂĄtuma kĂśzel megegyezik a szĂłtĂĄrĂĄllomĂĄny formĂĄtumĂĄval. A kĂźlĂśnbsĂŠgek a kĂśvetkezĹek:(1) Nem kell megadni az elsĹ sorban az ĂĄllomĂĄnyban lĂŠvĹ szavak mĂŠretĂŠt.
(2) A szĂłhoz nem kapcsolĂłkat, hanem egy mintaszĂłt adhatunk meg, ami alapjĂĄn az ellenĹrzĹ a szĂł toldalĂŠkolt alakjait is felismeri. PĂŠldĂĄul a Patyomkin/ĂdĂĄm azt jelenti, hogy a Patyomkin szĂłt az ĂdĂĄmĂŠval megegyezĹ ragozĂĄssal is el kell fogadni.
(3) A csillag tiltĂĄst jelent: a csillaggal jelĂślt szavakat az ellenĹrzĹ akkor sem ismeri fel, ha az alapszĂłtĂĄrban szerepelnek, pl. *kĂłricĂĄl.
(4) Az ĂĄllomĂĄny kĂŠzzel mĂłdosĂthatĂł, ĂŠs ezt idĹnkĂŠnt javasolt is megtenni, ha esetleg hibĂĄsan vettĂźnk fel szavakat.
LĂSD MĂG
angol nyelvĹą hunspell (4), hunspell (1), ispell (1), ispell (4), Magyar Ispell dokumentĂĄciĂł.TĂRTĂNET
A MySpell szĂłtĂĄr-, illetve ragozĂĄsi ĂĄllomĂĄnyĂĄnak formĂĄtumĂĄt Kevin Hendricks kĂŠszĂtette olyan cĂŠllal, hogy lehetĹvĂŠ tegye ezen ĂĄllomĂĄnyok gyors, futĂĄs idejĹą feldolgozĂĄsĂĄt.A COMPOUNDFLAG ĂŠs a Hunspell formĂĄtumbĹvĂtĂŠst, valamint a REP tĂśbbkarakteres cseretĂĄblĂĄzatot NĂŠmeth LĂĄszlĂł kĂŠszĂtette elsĹsorban a jobb magyar nyelvĹą helyesĂrĂĄs-ellenĹrzĂŠs cĂŠljĂĄbĂłl. A minimĂĄlis ĂśsszetettszĂł-kezelĂŠst lehetĹvĂŠ tevĹ COMPOUNDMIN, COMPOUNDFLAG, ĂŠs a REP tĂśbbkarakteres cseretĂĄblĂĄzat rĂŠsze a hivatalos MySpell fĂźggvĂŠnykĂśnyvtĂĄrnak is.
A Hunspell szĂłtĂĄrĂĄllomĂĄnyĂĄnak formĂĄtuma megegyezik a MySpell fĂźggvĂŠnykĂśnyvtĂĄrĂŠval, a ragozĂĄsi tĂĄblĂĄzat pedig a fentiekben felsorolt bĹvĂtĂŠseket tartalmazza. A bĹvĂtett formĂĄtumĂş affixum ĂĄllomĂĄny gond nĂŠlkĂźl egyĂźttmĹąkĂśdik az eredeti MySpell fĂźggvĂŠnykĂśnyvtĂĄrral is, de a bĹvĂtĂŠsek nem fognak mĹąkĂśdni. SĹt, mivel a hivatalos MySpell egy megengedĹbb ĂśsszetettszĂł-kezelĂŠst valĂłsĂt meg, mint a magyar vĂĄltozat, az Ăśsszetett szavakon belĂźli toldalĂŠkolt alakok is elfogadĂĄsra kerĂźlnek (ez kĂźlĂśnĂśsen sok hibĂĄs ĂśsszetĂŠtel elfogadĂĄsĂĄt eredmĂŠnyezi a magyar nyelv esetĂŠben).
EbbĹl fakad, hogy a hivatalos Magyar OpenOffice.org (http://office.fsf.hu) - mivel a Magyar MySpell fĂźggvĂŠnykĂśnyvtĂĄrat tartalmazza - jobban tĂĄmogatja a magyar nyelvet, mint mĂĄs vĂĄltozatok. EgyszerĹąen meggyĹzĹdhetĂźnk arrĂłl, hogy melyik vĂĄltozattal van dolgunk: Ărjuk be, hogy helyesĂrĂĄsellenĹrzĹ az OOo szĂśvegszerkesztĹjĂŠbe. Ha hibĂĄsnak jelzi, ĂŠs helyesĂrĂĄs-ellenĹrzĹt javasol helyette, a Hunspell-lel van dolgunk. Ha helyesnek fogadja el, akkor pedig az eredeti MySpell-lel.
Contenus ©2006-2024 Benjamin Poulain
Design ©2006-2024 Maxime Vantorre