Blogak.com

Sortu blog berria   Sar zaitez blogera

2007/01/27 21:50:29.469 GMT+1

Euskara eta linguistika konputazionala

Sarritan atzera begiratzea ere komenigarria izaten delako, oso interesgarria iruditu zait 1992. urtean geure irakasle den Joseba Abaituak idatzitako artikulu bat. Honela zioen:

Ez nuke linguistika konputazionala (LK) terminoa egokia den ala ez eztabaidatu nahi (Ingenieritza Linguistikoa, eta Lengoaia Naturalaren Prozesamendua sinonimotzat erabiltzen dira maiz). Egokia ala ez, oso erabilia da, eta gaur iharduera handiak daude bere inguruan munduan zehar. Zaila izango da denak zerrendatzea baina aipatuko ditut nabarienak:

  • Milaka lagun biltzen dira LKrekin zerikusi zuzena duten biltzarretan (inportanteenak bakarrik aipatuko ditut):
    • Urteroko bilera ACL (1961etik hona)
    • Urteroko bilera SEPLN (Espainian, 1984tik hona)
    • Bi urtean behin COLING (1967tik hona)
    • Bi urtean behin ANPL (1983tik hona)
  • EB, Japon eta Europako Unibertsitate eta enpresetan oso iharduera biziak daude. LK-ak hartu duen presentzia erakusteko Alemanian hainbat Unibertsitatetan lizentziatura bezala irakasten dela aipa dezakegu. Orohar, munduan zehar alor honetan nolako ihardukia dagoen jakiteko goian aipatu biltzarretako aktak begiratzea nahikoa da (adibidez, aurtengo COLING biltzarrean 120 komunikazio orokor, 90 proiekturen berri eta 60 <<demo>> aurkeztuko da).
  • Gobernuek bultzatuta: Europan ESPRIT, IMPACT, LRE proiektuak, DARPA EBen eta 5. eta 6. belaunaldiko konputagailuak Japonen. Proiektu hauetan diru andana banatzen ari da (adibide bat emateko, oso txikia den LRE programak -bakarrik 20 bat proiektu- 2.600 milloi pzta ditu).
  • Azkenik, antolatu berri diren elkarte batzuk, Text Endcoding Initiative (TEI), Data Collection Initiative (DCI) eta Consortium for Lexical Research (CLR) aipatu behar dira.
Errepasu azkar honekin azpimarratu nahi nuen munduan LK eremuan dagoen iharduera maila, (gaztelaniaz <<actividad febril>> dagoela esango nuke). Orain erantzun behar dugun galdera da zergaitik dagoen halako iharduera. Erantzuna nahiko begibistakoa da. Gure gizarte hau informatua da eta are gehiago gizartea informaturik egotera behartua bilakatzen ari da. Gaur egun, minutu bakar batean sortzen den informazio kopurua, (eskuz, prentsaz, edo elektronikoki sortua) giza zibilizazio osoan XX. mendera arte produzitu zena baino handiagoa da. Informazioa asimilatzeko bide inportante bat (baina ez bakarra) giza lengoaia da eta informazio kopurua tratatzeko medio elektronikoa beharrezkoa denez, biak elkartu beharko dira. Nik esango nuke, oinarrian dagoen arrazoi inportanteena, informazio kopuruaren eta informazio honen komunikatu beharra direla. Badaude beste arrazoi asko (sekundarioak edo marjinalagoak). Esate baterako, Informatika Industriak behar ditu programa errazagoak, jende gehiagok makinak eros ditzan. LK zertan datzan esateko, esango genuke linguistika integrala dela baina aplikazio konkretu batekin: konputagailua tarte, giza lengoaia erabili. Linguistika integrala esaten dut, zergaitik? Lengoaiak dituen alde guztiak jorratu behar bait dira: fonetika-fonologia, morfologia, sintaxia, semantika, pragmatika. Baita, hizkuntzaren komunikazio moldeak, ahotsaren egitadak (speech acts), hizkuntzaren ikasketa prozesua (ume batek hitz egiten nola ikasten duen), jakinduria enziklopedikoa nola errepresentatu, inferentziak nola egin, elkarrizketak nolakoak diren, hizkuntzen tipologiak, ikasketa kontrastiboak, testu motak, erretorika, idazteko teknikak, diskurtso teoriak, eta abar eta bar. Hau dena, eta zuek pentsa ditzakezuenak ere interesatzen zaizkio LK-ari. Bide batez, arlo honetan, oso <<feedback>> konstruktiboa sortu da, zeren eta LK-k bere aldetik ere hizkuntzalaritzaren eremu osoak bultzatu bait ditu, agian ez da erraza noraino bultzatu dituen imajinatzea. Linguistika teoria mailan, bultzada hau EB eta Europan batez ere gertatu da, Linguistika sortzaile (LS) deritzan korrontearen iharduera gaindituz. LK eta LS ez dira etsaiak, LS LK-an barruan koka genezake neurri handi batean. LK-ak asko zor dio LS-ari, baina Estrukturalismoari eta Funtzionalismoari (Pragako eskolari, esaterako) ere bai. LK definitzeko, arlo interdisziplinarioa dela esan behar genuke: Linguistika (Filologi ikasketak ere barne), Psikologia, Filosofia, Soziologia, Informatika, Biologia, Fisika eta abarrekiko portzioak behar bait ditu. Baina ez naiz honetan sartuko. Zaila da LK-an lanegingo duen profesional bat definitzen. Normalena arlo diferenteetako jendea biltzea da. Horregatik, agian LK izateko izateko lehenago linguista on bat izan behar da. Gaur egun Espainiako lizentziaturekin zaila dena lortzen: sintaxia gutxi ikasten bait da, semantika gutxiago, eta are gutxiago pragmatika, goian aipatu beste kontu asko alboan utziz. Ea onartu berria den Linguistika lizentziaturak egoera larri hau konpontzen duen. (Esan beharra dago Espainian, beste Europako estatuekin konparatuta, oso atzeratuak gabiltzala, normala den bezala, baina kontu honetan are gehiago, Portugal adibidez gu baino hobeto dabil -nazioarteko biltzarretan aurkezten diren komunikazioen arabera-. Ekialdeko estatuak ere, Hungria, Errusia, Txekoslobakia eta Polonia, gu baino askozaz hobeto). Zer egiten den Euskadin:
  • XUXEN (idazkeraren zuzentzailea, ortografia, morfologia, sintaxia): EHU Donostiako Informatika Fakultatea, UZEI.
  • HAIN (Hizkuntza Aplikazioetarako Ingurugunea): EHU Donostiako Informatika Fakultatea, Gasteizko Euskal Filologia, Deustuko Unibertsitatea eta UZEI.
  • GFU-LAB (unifikazio gramatikak probatzeko programa): Universitat Jaume I eta Deustuko Unibertsitatea.
  • EEBS (egungo euskararen bilketa-lan sistematikoa): UZEI.
  • EUSKALTERM (hiztegi terminologikoa): UZEI.
  • IKAS-TXIP (ordenadore bidez hizkuntzak ikasteko programa): DIDAKTIKER.

Iturria: ABAITUA, J.: "Euskara eta linguistika konputazionala", Enseiukarrean, Deustuko Unibertsitatea, Bilbo, 1992.

Nork: b23tik.2007/01/27 21:50:29.469 GMT+1
Etiketak: hizkuntza_baliabideak | Permalink | Erantzunak (0) | Errenferentziak: (0)

Idatzi artikulu bat





Erantzun galdera honi erantzuna gehitu ahal izateko.
Idatzi azpian zenbakiz emaitza: hamar gehi hiru ken hiru