L-Unjoni Ewropea tirrikonoxxi l-valur tad-data u ilha tappoġġa għadd ta’ inizjattivi ddedikati għall-ġbir u l-kondiviżjoni tad-data. L-aktar wieħed reċenti minn dawn il-proġetti huwa l- “Ispazju Komuni Ewropew tad-Data dwar il-Lingwi” (LDS), imniedi f’Jannar 2023.
Spazju Komuni Ewropew tad-Data dwar il-Lingwi (LDS)
Allinjat mal-Istrateġija Ewropea għad-Data u l-kunċett tal-Ispazji tad-Data, l-objettiv tal-LDS huwa li jkun pjattaforma funzjonali u suq għall-kondiviżjoni ta’ data u mudelli lingwistiċi madwar l-Unjoni Ewropea. L-ewwel skambji ta’ data huma ppjanati għall-M24, jiġifieri Diċembru 2024/January 2025. Il-pjattaforma tal-LDS se tappoġġa dawn l-iskambji, iżda mhux se tospita d-data hija stess.
Aktar informazzjoni fl-Ispazju tad-Data Lingwistika.
Din li ġejja hija lista ta’ inizjattivi rilevanti oħra fl-ebda ordni partikolari:
Memorja tat-Traduzzjoni tad-DĠT
Id-DGT-TM huwa memorja tat-traduzzjoni u fih segmenti tal-Acquis Communautaire, il-korp tal-leġiżlazzjoni Ewropea, li jinkludi t-trattati, ir-regolamenti u d-direttivi kollha adottati mill-Unjoni Ewropea (UE). Dan is-sett ta’ data jiffoka fuq testi paralleli fl-24 lingwa uffiċjali tal-UE.
Fil-format TMX, dan jinkludi madwar 2.6 Bio kelma u jiżdied b’ 200 miljun kelma fis-sena.
Aktar informazzjoni, kundizzjonijiet għall-użu u tniżżil huma disponibbli fiċ-Ċentru Konġunt tar-Riċerka.
ELRC-SHARE
Dan ir-repożitorju huwa ġabra ta’ riżorsi lingwistiċi li rriżultaw mill-kooperazzjoni bejn l-amministrazzjonijiet tal-Istati Membri u diversi proġetti tal-UE mill-2015 sal-2022. L-enfasi ewlenija kienet fuq il-ġbir ta’ korpora (traduzzjoni) parallela. B’mod ġenerali, ELRC-SHARE fih madwar 6 000 sett ta’ data ta’ daqsijiet differenti u b’politiki ta’ aċċess differenti.
Ir-repożitorju huwa disponibbli fir-Repożitorju ELRC-SHARE.
Teknoloġiji Lingwistiċi ta’ Prestazzjoni Għolja (HPLT)
Dan il-proġett, iffinanzjat taħt il-programm ta’ riċerka ORIZZONT, għandu l-għan, fost l-oħrajn, li jiġbor ammonti kbar ta’ riżorsi lingwistiċi f’aktar minn 100 lingwa differenti, u huwa s-suċċessur ta’ Paracrawl, li ffoka fuq il-ġbir ta’ data parallela għal skopijiet ta’ traduzzjoni.
Aktar informazzjoni hija disponibbli permezz tas-sit web tal-proġettfit-TeknoloġijiLingwistiċi ta’ Prestazzjoni Għolja u fil-Paracrawl.
OpenWebSearch.EU
L-objettiv ewlieni ta’ dan il-proġett ta’ riċerka huwa li tinħoloq bażi tad-data aċċessibbli għall-pubbliku li tindika siti web minn madwar id-dinja kollha. Biex jinkiseb dan, il-proġett se jiġbor u janalizza l-kontenut tas-siti web eżistenti. Dan l-isforz ta’ ġbir ta’ data jista’ jkun utli għall-ġbir ta’ informazzjoni relatata mal-lingwa.
Aktar informazzjoni hija disponibbli permezz tas-sit web tal-proġett f’ OpenWebSearch.EU.
data.europa.eu
Il-portal huwa punt ċentrali ta’ aċċess għad-data miftuħa Ewropea minn portali internazzjonali, tal-Unjoni Ewropea, nazzjonali, reġjonali, lokali u ġeodata. Dan jikkonsolida dak li qabel kien il-Portal tad-Data Miftuħa tal-UE u l-Portal Ewropew tad-Data. Bħalissa fih aktar minn 1.5 miljun sett ta’ data tas-settur pubbliku Ewropew miġbura minn 179 katalgu u li jappartjenu għal kategoriji topiċi differenti.
Aktar informazzjoni u aċċess għas-settijiet tad-data f’ data.europa.eu.
L-Uffiċċju tal-Pubblikazzjonijiet tal-Unjoni Ewropea
L-Uffiċċju tal-Pubblikazzjonijiet tal-Unjoni Ewropea huwa l-fornitur uffiċjali tas-servizzi ta’ pubblikazzjoni għall-istituzzjonijiet, il-korpi u l-aġenziji kollha tal-UE.
Iċ-Cellar huwa r-repożitorju tad-data komuni tiegħu u jaħżen pubblikazzjonijiet u metadata multilingwi. Huwa miftuħ għaċ-ċittadini kollha tal-UE u jipprovdi data li tinqara minn magna.
L-arkivju tal-Web tal-UE ilu mill-2013 jippreserva l-kontenut u d-disinn tas-siti web tal-istituzzjonijiet, l-aġenziji u l-korpi tal-UE (l-istituzzjonijiet tal-UE).
Aktar informazzjoni fl-Uffiċċju tal-Pubblikazzjonijiet tal-Unjoni Ewropea inklużl-arkivju tal-web.
InfrastrutturaKomuni ta’ Riżorsi u Teknoloġiċi Lingwistiċi (CLARIN)
CLARIN ERIC (Konsorzju għal Infrastruttura Ewropea ta’ Riċerka) hija inizjattiva pan-Ewropea li tippermetti r-riċerka fix-xjenzi soċjali u l-istudji umanistiċi dwar ir-riżorsi lingwistiċi (LR).
Aktar informazzjoni fil-CLARIN. Tista’ wkoll taċċessar-riżorsi u s-servizzi lingwistiċi.
Netwerk Ewropew għal-Lingwi (ELG)
Il-proġett ELG stabbilixxa pjattaforma unika u skalabbli tal-cloud bħala punt uniku ta’ servizz għall-industrija Ewropea tat-Teknoloġija Lingwistika u l-komunità tar-riċerka. Il-katalgu tal-ELG jipprovdi aċċess għal għadd ta’ għodod u servizzi operattivi kummerċjali u mhux kummerċjali, mudelli, lexica, terminoloġiji jew grammars iżda jinkludi wkoll 8000 korpora, b’xi sovrapożizzjoni mal-inizjattivi preċedenti.
Aktar informazzjoni fl-ELG u fil-Katalogu tal-ELG.
Tgħallem aktar dwar it-Teknoloġiji Lingwistiċi.