Data: 9.9% o areithiau yn y Cynulliad yn Gymraeg

Mae Kevin Donnelly wedi dadansoddi’r Cofnod er mwyn cyfrif pa ganran o sylwadau ac areithiau a anerchwyd yn Gymraeg. Y ganran yn y trydydd Cynulliad? Dim ond 9.9%. Mae rhagor o wybodaeth yn ei gofnod blog yn ogystal â’i gorpws a pheriant chwilio o’r enw Kynulliad3. Pam mae’r ganran mor isel? Oes gwleidydd Cymraeg o gwmpas sydd yn… Parhau i ddarllen Data: 9.9% o areithiau yn y Cynulliad yn Gymraeg

DATA: corpws/rhestr fawr o eiriau Cymraeg (1,600,000 gair)

1,600,000 “gair” Cymraeg http://borel.slu.edu/obair/cy-freq.zip 6.9MB ffeil zip (23 MB dad-zip) Diolch i Kevin Scannell o Indigenous Tweets am y data. Mae’r data yn eitha brwnt, lot o swn. Mae’n dod o gropian gwefannau Cymraeg fel rhan o broject gyda Geiriadur Prifysgol Cymru. Efallai byddi di eisiau glanhau am rhai o ddefnyddiau. Ti’n gallu gwneud beth… Parhau i ddarllen DATA: corpws/rhestr fawr o eiriau Cymraeg (1,600,000 gair)