Skip to main content
Shaping Europe’s digital future
News article | Pubblikazzjoni

Aċċess Pubbliku għad-Data tal-Lingwa Ewropea

Lista ta’ sorsi potenzjali ta’ data tal-lingwa interna u esterna.

©tippapat

L-Unjoni Ewropea tirrikonoxxi l-valur tad-data u ilha tappoġġa għadd ta’ inizjattivi ddedikati għall-ġbir u l-kondiviżjoni tad-data. L-aktar wieħed reċenti minn dawn il-proġetti huwa l- “Ispazju Komuni Ewropew tad-Data dwar il-Lingwi” (LDS), imniedi f’Jannar 2023. 

Spazju Komuni Ewropew tad-Data dwar il-Lingwi (LDS)

Allinjat mal-Istrateġija Ewropea għad-Data u l-kunċett tal-Ispazji tad-Data, l-objettiv tal-LDS huwa li jkun pjattaforma funzjonali u suq għall-kondiviżjoni ta’ data u mudelli lingwistiċi madwar l-Unjoni Ewropea. L-ewwel skambji ta’ data huma ppjanati għall-M24, jiġifieri Diċembru 2024/January 2025. Il-pjattaforma tal-LDS se tappoġġa dawn l-iskambji, iżda mhux se tospita d-data hija stess. 

Aktar informazzjoni fl-Ispazju tad-Data Lingwistika.

Din li ġejja hija lista ta’ inizjattivi rilevanti oħra fl-ebda ordni partikolari: 

Memorja tat-Traduzzjoni tad-DĠT

Id-DGT-TM huwa memorja tat-traduzzjoni u fih segmenti tal-Acquis Communautaire, il-korp tal-leġiżlazzjoni Ewropea, li jinkludi t-trattati, ir-regolamenti u d-direttivi kollha adottati mill-Unjoni Ewropea (UE). Dan is-sett ta’ data jiffoka fuq testi paralleli fl-24 lingwa uffiċjali tal-UE.
Fil-format TMX, dan jinkludi madwar 2.6 Bio kelma u jiżdied b’ 200 miljun kelma fis-sena.

Aktar informazzjoni, kundizzjonijiet għall-użu u tniżżil huma disponibbli fiċ-Ċentru Konġunt tar-Riċerka.

ELRC-SHARE

Dan ir-repożitorju huwa ġabra ta’ riżorsi lingwistiċi li rriżultaw mill-kooperazzjoni bejn l-amministrazzjonijiet tal-Istati Membri u diversi proġetti tal-UE mill-2015 sal-2022. L-enfasi ewlenija kienet fuq il-ġbir ta’ korpora (traduzzjoni) parallela. B’mod ġenerali, ELRC-SHARE fih madwar 6 000 sett ta’ data ta’ daqsijiet differenti u b’politiki ta’ aċċess differenti.

Ir-repożitorju huwa disponibbli fir-Repożitorju ELRC-SHARE.

 

Teknoloġiji Lingwistiċi ta’ Prestazzjoni Għolja (HPLT)

Dan il-proġett, iffinanzjat taħt il-programm ta’ riċerka ORIZZONT, għandu l-għan, fost l-oħrajn, li jiġbor ammonti kbar ta’ riżorsi lingwistiċi f’aktar minn 100 lingwa differenti, u huwa s-suċċessur ta’ Paracrawl, li ffoka fuq il-ġbir ta’ data parallela għal skopijiet ta’ traduzzjoni. 

Aktar informazzjoni hija disponibbli permezz tas-sit web tal-proġettfit-TeknoloġijiLingwistiċi ta’ Prestazzjoni Għolja u fil-Paracrawl.

OpenWebSearch.EU

L-objettiv ewlieni ta’ dan il-proġett ta’ riċerka huwa li tinħoloq bażi tad-data aċċessibbli għall-pubbliku li tindika siti web minn madwar id-dinja kollha. Biex jinkiseb dan, il-proġett se jiġbor u janalizza l-kontenut tas-siti web eżistenti. Dan l-isforz ta’ ġbir ta’ data jista’ jkun utli għall-ġbir ta’ informazzjoni relatata mal-lingwa.

Aktar informazzjoni hija disponibbli permezz tas-sit web tal-proġett f’ OpenWebSearch.EU.

data.europa.eu

Il-portal huwa punt ċentrali ta’ aċċess għad-data miftuħa Ewropea minn portali internazzjonali, tal-Unjoni Ewropea, nazzjonali, reġjonali, lokali u ġeodata. Dan jikkonsolida dak li qabel kien il-Portal tad-Data Miftuħa tal-UE u l-Portal Ewropew tad-Data. Bħalissa fih aktar minn 1.5 miljun sett ta’ data tas-settur pubbliku Ewropew miġbura minn 179 katalgu u li jappartjenu għal kategoriji topiċi differenti. 

Aktar informazzjoni u aċċess għas-settijiet tad-data f’ data.europa.eu. 

L-Uffiċċju tal-Pubblikazzjonijiet tal-Unjoni Ewropea

L-Uffiċċju tal-Pubblikazzjonijiet tal-Unjoni Ewropea huwa l-fornitur uffiċjali tas-servizzi ta’ pubblikazzjoni għall-istituzzjonijiet, il-korpi u l-aġenziji kollha tal-UE.
Iċ-Cellar huwa r-repożitorju tad-data komuni tiegħu u jaħżen pubblikazzjonijiet u metadata multilingwi. Huwa miftuħ għaċ-ċittadini kollha tal-UE u jipprovdi data li tinqara minn magna.
L-arkivju tal-Web tal-UE ilu mill-2013 jippreserva l-kontenut u d-disinn tas-siti web tal-istituzzjonijiet, l-aġenziji u l-korpi tal-UE (l-istituzzjonijiet tal-UE).

Aktar informazzjoni fl-Uffiċċju tal-Pubblikazzjonijiet tal-Unjoni Ewropea inklużl-arkivju tal-web.

InfrastrutturaKomuni ta’ Riżorsi u Teknoloġiċi Lingwistiċi (CLARIN)

CLARIN ERIC (Konsorzju għal Infrastruttura Ewropea ta’ Riċerka) hija inizjattiva pan-Ewropea li tippermetti r-riċerka fix-xjenzi soċjali u l-istudji umanistiċi dwar ir-riżorsi lingwistiċi (LR).

Aktar informazzjoni fil-CLARIN. Tista’ wkoll taċċessar-riżorsi u s-servizzi lingwistiċi.

Netwerk Ewropew għal-Lingwi (ELG)

Il-proġett ELG stabbilixxa pjattaforma unika u skalabbli tal-cloud bħala punt uniku ta’ servizz għall-industrija Ewropea tat-Teknoloġija Lingwistika u l-komunità tar-riċerka. Il-katalgu tal-ELG jipprovdi aċċess għal għadd ta’ għodod u servizzi operattivi kummerċjali u mhux kummerċjali, mudelli, lexica, terminoloġiji jew grammars iżda jinkludi wkoll 8000 korpora, b’xi sovrapożizzjoni mal-inizjattivi preċedenti.

Aktar informazzjoni fl-ELG u fil-Katalogu tal-ELG.

Tgħallem aktar dwar it-Teknoloġiji Lingwistiċi.