Corpas na Gaeilge Labhartha
Taighdeoirí: Elaine Uí Dhonnchadha, Alessio Frenda.
le Brian Vaughan (Taifeadadh), Daniel Jettka (XSLT)
Maoiniú: Foras na Gaeilge (GaLa 2011), (Comhrá 2012)
Cúlra
Is é an aidhm atá ag an tionscadal seo ná corpas cuimsitheach de theanga labhartha na Gaeilge a chruthú. Beidh an corpas seo luachmhar ó thaobh taighde teangeolaíochta, múinteoireacht na Gaeilge agus teicneolaíocht teanga ar nós uathaithint cainte de.
Is corpas diacronach* atá i gceist toisc go bhfuilimid ag bailiú an t-ábhar fuaime is luaithe atá ar fáil dúinn (ag dul siar seachtó bliain nó mar sin), chomh maith le hábhar nua comhaimseartha a thaifead ins An tSaotharlann Cumarsáid Urlabhartha agus sna Gaeltachtaí timpeall na tíre. Déanaimid gach iarracht an corpas a bheith cothrom ó thaobh canúint, gnéas agus aois na cainteoirí de.
Chun corpas labhartha a chruthú is gá tras-scríobh a dhéanamh ar abhar fuaime nó físe (comhráití, agallaimh, oráidí &rl). Bainimid úsáid as bogearraí speisialta chun tras-scríobh a fhormáidiú in XML agus é a ailíniú leis an gcomhad fuaime/físe.
Treoirlínte Tras-scríobh na Gaeilge
Tá na treoracha seo curtha le cheile ag Alessio Frenda, Elaine Ui Dhonnchadha and Pauline Welby (CNRS, France). Má tá ceist nó moladh agat dúinn maidir le na treoirlíntí, cuir r-phost chugainn ag uidhonne@tcd.ie, le do thoil.
Tá roinnt nithe nach gá a léiriú sa tras-scríobh mar gur féidir linn iad a dhéanamh go huathoibríoch níos déanaí, msh. ní gá fad na stadanna (pauses) a thomhais. Ní chuirimid foghraíocht canúnach in iúl sa tras-scríobh ortagrafíochta toisc gur féidir léiriú níos cruinne a chur in iúl i tras-scríobh breise foghraíochta (seachas liosta d'eisceachtaí coitianta, thíos). Is féidir céadadán ard de fhoghraíocht canúnach a ghineadh ón litriú caighdeánach, trí riailacha litir-go-fuaim don chanúint sin a chur i bhfeidhm.
Tá breis eolais sna líostaí seo a leanas maidir le litriú caighdeánach do gnéithe éagsúla san ábhar comhrá:
- Focail Ghiorraithe
- Nathanna Cumarsáide
- Sos Líonta
- Focail Canúnach
- Foirmeacha Táite sa Teanga Labhartha
- An Fhoirm Choibhneasta
- Malairt Focail i bhFoclóir Gaeilge-Béarla (Ó Dónaill, 1977)
Bogearraí Tras-scríofa
Chun bogearra Transcriber a íoslodail, téigh go dtí an leathanach seo agus suiteáil ar do ríomhaire é.
http://sourceforge.net/projects/trans/files/transcriber/1.5.1/ [Ná bain úsáid as TranscriberAG].
*chun féachaint conas mar a athraíonn teanga thar ama