Sarritan atzera begiratzea ere komenigarria izaten delako, oso interesgarria iruditu zait 1992. urtean geure irakasle den Joseba Abaituak idatzitako artikulu bat. Honela zioen:
Ez nuke linguistika konputazionala (LK) terminoa egokia den ala ez eztabaidatu nahi (Ingenieritza Linguistikoa, eta Lengoaia Naturalaren Prozesamendua sinonimotzat erabiltzen dira maiz).
Egokia ala ez, oso erabilia da, eta gaur iharduera handiak daude bere
inguruan munduan zehar. Zaila izango da denak zerrendatzea baina
aipatuko ditut nabarienak:
- Milaka lagun biltzen dira LKrekin zerikusi zuzena duten biltzarretan (inportanteenak bakarrik aipatuko ditut):
- Urteroko bilera ACL (1961etik hona)
- Urteroko bilera SEPLN (Espainian, 1984tik hona)
- Bi urtean behin COLING (1967tik hona)
- Bi urtean behin ANPL (1983tik hona)
- EB, Japon eta Europako Unibertsitate eta enpresetan oso
iharduera biziak daude. LK-ak hartu duen presentzia erakusteko
Alemanian hainbat Unibertsitatetan lizentziatura bezala irakasten dela
aipa dezakegu. Orohar, munduan zehar alor honetan nolako ihardukia
dagoen jakiteko goian aipatu biltzarretako aktak begiratzea nahikoa da
(adibidez, aurtengo COLING biltzarrean 120 komunikazio orokor, 90
proiekturen berri eta 60 <<demo>> aurkeztuko da).
- Gobernuek bultzatuta: Europan ESPRIT, IMPACT, LRE
proiektuak, DARPA EBen eta 5. eta 6. belaunaldiko konputagailuak
Japonen. Proiektu hauetan diru andana banatzen ari da (adibide bat
emateko, oso txikia den LRE programak -bakarrik 20 bat proiektu- 2.600
milloi pzta ditu).
- Azkenik, antolatu berri diren elkarte batzuk, Text Endcoding Initiative (TEI), Data Collection Initiative (DCI) eta Consortium for Lexical Research (CLR) aipatu behar dira.
Errepasu azkar honekin azpimarratu nahi nuen munduan LK eremuan dagoen
iharduera maila, (gaztelaniaz <<actividad febril>> dagoela
esango nuke). Orain erantzun behar dugun galdera da zergaitik dagoen
halako iharduera. Erantzuna nahiko begibistakoa da. Gure gizarte hau
informatua da eta are gehiago gizartea informaturik egotera behartua
bilakatzen ari da. Gaur egun, minutu bakar batean sortzen den
informazio kopurua, (eskuz, prentsaz, edo elektronikoki sortua) giza
zibilizazio osoan XX. mendera arte produzitu zena baino handiagoa da.
Informazioa asimilatzeko bide inportante bat (baina ez bakarra) giza
lengoaia da eta informazio kopurua tratatzeko medio elektronikoa
beharrezkoa denez, biak elkartu beharko dira. Nik esango nuke,
oinarrian dagoen arrazoi inportanteena, informazio kopuruaren eta
informazio honen komunikatu beharra direla. Badaude beste arrazoi asko
(sekundarioak edo marjinalagoak). Esate baterako, Informatika
Industriak behar ditu programa errazagoak, jende gehiagok makinak eros
ditzan.
LK zertan datzan esateko, esango genuke linguistika integrala dela
baina aplikazio konkretu batekin: konputagailua tarte, giza lengoaia
erabili. Linguistika integrala esaten dut, zergaitik? Lengoaiak dituen
alde guztiak jorratu behar bait dira: fonetika-fonologia, morfologia,
sintaxia, semantika, pragmatika. Baita, hizkuntzaren komunikazio
moldeak, ahotsaren egitadak (speech acts), hizkuntzaren ikasketa
prozesua (ume batek hitz egiten nola ikasten duen), jakinduria
enziklopedikoa nola errepresentatu, inferentziak nola egin,
elkarrizketak nolakoak diren, hizkuntzen tipologiak, ikasketa
kontrastiboak, testu motak, erretorika, idazteko teknikak, diskurtso
teoriak, eta abar eta bar. Hau dena, eta zuek pentsa ditzakezuenak ere
interesatzen zaizkio LK-ari. Bide batez, arlo honetan, oso
<<feedback>> konstruktiboa sortu da, zeren eta LK-k bere
aldetik ere hizkuntzalaritzaren eremu osoak bultzatu bait ditu, agian
ez da erraza noraino bultzatu dituen imajinatzea. Linguistika teoria
mailan, bultzada hau EB eta Europan batez ere gertatu da, Linguistika
sortzaile (LS) deritzan korrontearen iharduera gaindituz. LK eta LS ez
dira etsaiak, LS LK-an barruan koka genezake neurri handi batean. LK-ak
asko zor dio LS-ari, baina Estrukturalismoari eta Funtzionalismoari
(Pragako eskolari, esaterako) ere bai.
LK definitzeko, arlo interdisziplinarioa dela esan behar genuke:
Linguistika (Filologi ikasketak ere barne), Psikologia, Filosofia,
Soziologia, Informatika, Biologia, Fisika eta abarrekiko portzioak
behar bait ditu. Baina ez naiz honetan sartuko. Zaila da LK-an
lanegingo duen profesional bat definitzen. Normalena arlo
diferenteetako jendea biltzea da. Horregatik, agian LK izateko izateko
lehenago linguista on bat izan behar da. Gaur egun Espainiako
lizentziaturekin zaila dena lortzen: sintaxia gutxi ikasten bait da,
semantika gutxiago, eta are gutxiago pragmatika, goian aipatu beste
kontu asko alboan utziz. Ea onartu berria den Linguistika
lizentziaturak egoera larri hau konpontzen duen. (Esan beharra dago
Espainian, beste Europako estatuekin konparatuta, oso atzeratuak
gabiltzala, normala den bezala, baina kontu honetan are gehiago,
Portugal adibidez gu baino hobeto dabil -nazioarteko biltzarretan
aurkezten diren komunikazioen arabera-. Ekialdeko estatuak ere,
Hungria, Errusia, Txekoslobakia eta Polonia, gu baino askozaz hobeto).
Zer egiten den Euskadin:
- XUXEN (idazkeraren zuzentzailea, ortografia, morfologia, sintaxia): EHU Donostiako Informatika Fakultatea, UZEI.
- HAIN
(Hizkuntza Aplikazioetarako Ingurugunea): EHU Donostiako Informatika
Fakultatea, Gasteizko Euskal Filologia, Deustuko Unibertsitatea eta
UZEI.
- GFU-LAB (unifikazio gramatikak probatzeko programa): Universitat Jaume I eta Deustuko Unibertsitatea.
- EEBS (egungo euskararen bilketa-lan sistematikoa): UZEI.
- EUSKALTERM (hiztegi terminologikoa): UZEI.
- IKAS-TXIP (ordenadore bidez hizkuntzak ikasteko programa): DIDAKTIKER.
Iturria: ABAITUA, J.: "Euskara eta linguistika konputazionala", Enseiukarrean, Deustuko Unibertsitatea, Bilbo, 1992.
Idatzi artikulu bat