Feeds:
Entradas
Comentarios

Archive for the ‘HLT’ Category

Hizketa ezagutza

Hizketa Ezagutza (Hizketa Ezagutza Automatikoa edo Konputadore Hizketa Ezagutza bezala ezagutzen dena ere bai) ahozkatutako hitzak makinak irakurtzeko gai diren sarreretan bihurtzen dituzte. “Ahots Ezagutza” terminoa askotan txarto erabiltzen da Hizketa Ezagutzari erreferentzia egiteko. Hiztunaren ezagutzari buruz deritzogunean hitz egiten ari den pertsonaren ezagutzaz ari gara, esaten ari denarekin alderatuz. Halaber, Hizketa Ezagutza sistemak erabiltzen duten kazetari eta aparatu sortzaileek askotan Ahots Ezagutza terminoa erabiltzen dute Hizketa Ezagutza esan nahi dutenean.

Hizkuntza ezagutza aplikazioak ahotz markaketarako (ad., “Deitu Etxera”), deien igorpenarako (ad. “Taldeko dei bat egin nahiko nuke”), aplikazio domotikoen kontrola eta audioan oinarritutako edukien bilaketa egiteko (ad., hitz jakin batzuk ahozkatuak izan diren podkast bat bilatu), informazio bakunaren sarreretarako (ad. Kreditu txartel baten erabilera), estrukturatutako dokumentuen prestakuntzarako (ad., irizpen erradiologiakoak), ahozkeratik testurako prozesaketarako (ad., hitz prozesagailua edo e-mailak) , eta hegazkinen garlingetan ( normalean Ahots Sarrera Zuzena bezala ezagututa) erabiltzen da.

Arlo askotan erabiltzen da, adibidez: osasunaren arretan, gerrarako hegazkinetan, helikopteroetan, trafiko aereoan, etab.

Iturriak:

Anuncios

Read Full Post »

Lengoaia Naturalarekin lotzen de konplexutasuna handiagotu egiten da informazio testuala berreskuratu nahi dugunean. Horregatik asko erabiltzen dira LNP teknikak Informazio Testualaren Berreskurapenaren arloan. Alde batetik dokumentuen edukiaren deskripzioa errazteko, eta beste aldetik, erabiltzailearen kontsultaren errepresentazioa egiteko. Modu honetan bi deskripzioak konparatu egiten dira eta erabiltzaileari gehien komeni zaiona aurkezten zaio.

Informazio Berreskurapen sistema batek honako lana betetzen du erabiltzailearen kontsultari erantzuteko:

  1. Dokumentuen bildumen inguruko aurkibideak egitea.
  2. Erabiltzaile batek kontsulta bat egiten duenean sistemak horrek aztertu egiten du hori, eta baita eraldatu ere beharrezkoa bada.
  3. Sistema horrek dokumentuaren deskribapena konparatu egiten du kontsultaren deskribapenarekin, eta erabiltzaileari kontsultaren deskripziora gehien atxikitzen den dokumentuen deskripzioa aurkezten dio. 
  4. Emaitzak daukaten garrantziaren arabera agertzen dira.

 

Iturriak:

Read Full Post »

Itzulpengintza automatikoa, gazteleraz TM eta ingelesez MT izendatuak baita ere, software-aren erabilera aztertzen duen linguistika computazionalaren alor bat da non helburua testuak lengoaia natural batetik beste batera itzultzea den. Oinarrizko maila batean itzulpen automatikoak bi lengoaia naturalen arteko hitz atomikoan ordezkapena egiten; baina Corpus linguistiko baten bitartez itzulpen konplexuagoen saiakera egin daiteke.

Itzulpengintza automatikoan itzulpenak egiteko modu ezberdinak daude:

  1. Arauetan oinarritutako itzulpen automatikoa: Honetan jatorrizkoan oinarrituriko transformazioak egitean datza, hitzak ordezkatuz hauen baliokide egokienengatik.
  2. Corpus-ean oinarrituriko itzulpen automatikoa: Eredu errealen analisian datza beren itzulpen propioekin. Hauen artean metodo estadistikoak eta adibidetan oinarriturikoak daude.
  3. Kontestuan oinarritutako itzulpengintza automatikoa: Honek kontestuan oinarritzen da itzulpena egiteko. Hau da, hitz baten baliokide egokiena aurkitzeko kontestuan oinarritzen da.

 Baina itzulpengintza automatikoaren helburua ez da testu baten itzulpen perfektua ematea. Honen bitartez egiten den itzulpena eraldatu behar da eta bakoitzaren gustura eta nahietra egokitu.

Iturriak:

 

http://www.foreignword.com/es/technology/art/Abaitua/default.htm

Read Full Post »

Gaien zerrenda (Q.2)

Hauek dira aukeratu ditudan ikerketa gaiak:

  1. Itzulpengintza Automatikoa. 
  2. Web Semantikoa.
  3. Analisi sintaktiko eta morfologikorako gramatika eta formalismoak. 
  4. LNP-aren aplikazio industrialak. 
  5.  Hizketaren ezagutza eta sintesia.
  6. Informazio berreskurapena.
  7. Lengoaien identifikazio automatikoa.
  8. Informazio lorpena.
  9. Lengoaia Naturalaren belaunaldia.
  10. Lexikografia eta terminologia konputazionala. 

 

 

Iturriak:

Read Full Post »

Hauek dira Giza Lengoaiaren Teknologiaren inguruan ikerketak egin dituzten zentroetako batzuk. Mundu mailan zentro asko dauden arren oraingoan bakarrik Europan aurkitu ditzakegun zentroak aztertuko ditugu. Zentro horiek non dauden eta zehazki zer ikertu duten ikusiko dugu.

Alemanian DFKI Language Technology Lab zentroa aurki dezakegu. Hauek  haien helburua lengoaiaren teknologia garatzea eta hobetzea dela diote. Modu honetan testuak, mintzairak eta jakituria tekniko konputazional berriak prozesa ditzakete. Batez ere hiru alor hauek garatzen dituzte: Informazioaren eta Jakituriaren Administrazioa, Dokumentuen Ekoizpena eta Komunikazio Naturala.

Irlandan National Centre for Language Technology dago. Zentro honek ikerketak burutzen ditu Makinen Bitarteko Itzulpenaren alorrean, Lengoaia Naturalaren Analisi Sintaktikoaren alorrean, Mintzaira Sintesiaren alorrean, Galderen Erantzungintzan etab.-etan.  

Euskadin IXA taldea aurki dezakegu. Talde hau 31 informatikok eta 14 hizkuntzalarik osatzen dute. Haien helburu nagusia Lengoaia Naturalaren inguruan ikerketak egitea da. Bestalde sistema erdi-automatikoak egiten dituzte edo horien ekoizpenean laguntzen dute.

Eskozian, Language Technology Group aurki dezakegu. Talde honek Lengoaia Naturalaren prozesamenduaren inguruan ikertu du 1990. urtetik. Edinburgoko Unibertsitatearen Institute for Communicating and Collaborative systems of the Division of Informatics -en oinarriturik dago. Testuen prosezamenduari loturiko arazoak konpontzen saiatzen dira. 

Iturriak:

Read Full Post »

Giza Lengoaiaren Teknologiei buruz aditu askok hitz egin dute, horien artean Hans Uszkoreit, Yorick Wilks, Silviu Cucerzan etab. eta bakoitzak bere ikerketak landu ditu gai honen inguruan, hauek dira eman diren definizio eta azalpenetako batzuk:

Hans Uszkoreit-ek adibidez, Giza Lengoaiaren Teknologiak testuak eta mintzairak aztertzeko, ekoizteko eta aldatzeko espezializaturik dauden kalkulatzeko metodoak, ordenagailu programak, tresna elektronikoak hartzen dituela bere baitan.

Finladiako Language Technology Documentation Centre – ak honako hau dio HLT ri buruz: arlo multidisziplinarioa dela, esanahi eta metodo teknikoak aztertzen dituena eta giza lengoaia ordenagailuekin lantzeko balio duena.

Joaquim Llisterri-k Giza Lengoaiaren Teknologiak aplikazio informatikoetan baterabilduta aurkitzen diren aplikazio guztiak dira. Hauek guztiak zilegi egiten dute testu idatzien tratamendua (adibidez itzulpengintza automatikoa eta zuzenketa ortografikoa) eta hizketaren prozesamendua.

Iturriak:

Read Full Post »

Martin Kay (Q.1)

Martin Kay es un científico conocido especialmente por su trabajo en Lingüística Computacional. Nacio en Gran Bretaña y en 1958 empezó a trabajar en  Cambridge Language Research Unit, uno de los primeros centros en investigar alrededor de la Lingüística Computacional. En 1961 se translado a California donde investigó acerca de la lingüística y de TA (Traducción Automática). Estas son algunas de sus afirmaciones:

“El ordenador es un instrumento que puede servir para magnificar la productividad humana. Usado adecuadamente, no tiene por qué deshumanizar, con la impronta de su sello orwelliano, los productos de la creatividad y del trabajo del hombre sino que, apropiándose de lo que es mecánico y rutinario, puede liberarle para que se dedique íntegramente a las labores que son esencialmente humanas. La traducción, aun siendo un arte delicada y precisa, conlleva muchas tareas que son mecánicas y rutinarias. Si estas tareas fueran encomendadas a una máquina, la productividad del traductor no sólo se vería magnificada, sino que su trabajo se haría más gratificante, más apasionante, más humano.”

“No es adecuado encomendar al ordenador que mecanice lo que no es mecánico, o algo cuya subestructura mecánica no ha sido revelada para la ciencia. En otras palabras, el ordenador se usa inadecuadamente cuando intentamos que haga algo que nosotros mismos no comprendemos. La historia no puede ofrecer un ejemplo mejor de uso inapropiado del ordenador que la traducción automática.”

Referencias:

Read Full Post »

Older Posts »