A lingua galega dispón de novos recursos tecnolóxicos de especial interese para o seu avance no ámbito da investigación

Política Lingüística presentou hoxe a versión actualizada do Corpus Actual da Lingua Galega (CORGA), que proporciona ferramentas de análise do idioma máis sofisticadas

Mar, 02/11/2010 - 16:42
presentou hoxe a versión actualizada do Corpus Actual da Lingua Galega (CORGA),
Anxo Lorenzo na presentación da versión actualizada do Corpus Actual da Lingua Galega (CORGA),

O galego conta con novos recursos tecnolóxicos de especial interese para os investigadores do idioma. Trátase da versión actualizada do Corpus Actual da Lingua Galega (CORGA), do Centro Ramón Piñeiro para a Investigación en Humanidades, que foi presentada esta mañá na Facultade de Filoloxía da Universidade de Santiago de Compostela.  

Segundo salientou o secretario xeral de Política Lingüística, Anxo Lorenzo, durante o acto, “os sistemas e recursos relacionados con este proxecto do Centro Ramón Piñeiro para a Investigación en Humanidades poñen á disposición da comunidade científica un recurso accesible a través de Internet que posibilita a obtención de datos para o estudo de aspectos morfolóxicos, sintácticos e léxicos”.

Aposta polas tecnoloxías da información e da comunicación

Este traballo que vén desenvolvendo o Centro Ramón Piñeiro enmárcase, segundo salientou Anxo Lorenzo, “nunha das liñas de actuación prioritarias da Secretaría Xeral de Política Lingüística, que aposta polas tecnoloxías da información e da comunicación para fornecer produtos e servizos electrónicos que permitan avanzar na investigación sobre a lingua galega e tamén na vida diaria dos falantes”.

O responsable de Política Lingüística fixo fincapé en que “os avances tecnolóxicos constitúen unha premisa indispensable para superar os grandes retos arredor dos que se artella a sociedade da información e do coñecemento. Por iso, desde a Secretaría Xeral de Política Lingüística estamos completamente decididos a potenciar a presenza do galego nos diferentes recursos tecnolóxicos”.

Outras accións encamiñadas a incrementar a presenza do galego nas TIC

“Nesta dirección –precisou Anxo Lorenzo– enmárcanse actuacións xa coñecidas, como o novo acordo de colaboración entre a Xunta de Galicia e mais a Asociación PuntoGal para conseguir a construción dun espazo específico en Internet para a lingua e a cultura galegas”. O secretario xeral tamén destacou o proxecto Abalar da Consellería de Educación e Ordenación Universitaria, “no cal a lingua galega está incluída en todos os equipos informáticos tanto no sistema operativo como nos programas, de maneira que se consegue incrementar dunha maneira considerable a súa presenza no ámbito das aplicacións informáticas”.

O responsable de Política Lingüística tamén recordou que o seu departamento está a traballar na renovación do compromiso co galego das operadoras de telecomunicación e as principais empresas de telefonía móbil, e que continúan os contactos co coa empresa Google para proceder a localizar en lingua galega os programas e servizos máis empregados.

Windows 7, Windows Live e Office 2010 en galego

Finalmente, aproveitou a ocasión para anunciar a próxima presentación das actualizacións en galego dos produtos da empresa Microsoft: o sistema operativo Windows 7, o paquete ofimático Office 2010 e a plataforma Live.

Todo isto vén demostrar, unha vez máis, que a tecnoloxía, as ciencias e calquera outro ámbito do saber e do coñecemento se pode (e de feito) se está a construír en lingua galega, concluíu Anxo Lorenzo.

No acto de presentación tamén participaron o decano da facultade, Ernesto González Seoane; o director do GORGA Guillermo Rojo e os responsables da parte lingüística e da parte informática do proxecto, Eva Domínguez e Mario Barcala, respectivamente, que explicaron con detalle as posibilidades dos novos recursos computacionais.

Ferramentas de análise do galego máis sofisticadas

O CORGA é un corpus documental integrado por distintos tipos de textos –xornais, semanarios, revistas, ensaios e textos de ficción– desde 1975 ata a actualidade. Nesta nova versión, o CORGA pasa a contar con preto de 26 millóns de formas ortográficas, un millón máis que hai un ano. Así mesmo, amplíanse as posibilidades de busca que se ofrecían ata o momento (por palabras ou expresións en xeral, tipos de texto, épocas, áreas temáticas etc.). A versión actualizada está dispoñible na rede no enderezo http://corpus.cirp.es/corga e o rexistro no sistema é gratuíto.

Ademais das consultas por formas ortográficas que posibilita o CORGA, o Centro Ramón Piñeiro está a traballar en novas formas de consulta máis avanzadas que propician un salto cualitativo na materia. Trátase do Etiquetador/Lematizador do Galego Actual (XIADA), que vén de ampliar o seu corpus de adestramento ata as 150.000 formas gráficas e que está dispoñible na versión 2.4 do Corpus de Referencia do Galego Actual etiquetado (CORGAetq). Así mesmo, desenvolveuse un novo sistema de consulta dirixido aos usuarios non familiarizados co etiquetario do proxecto, dispoñible no enderezo http://corpus.cirp.es/corgaetq.

Menús News node R