Common Voice – technoleg llais Cymraeg

Mae rhaglen Common Voice, Mozilla, yn anelu i gynyddu’r data ar gyfer technoleg llais mewn ieithoedd gwahanol ac ar drwyddedau rhydd. Hyd yma mae technolegau llais wedi bod ar gael drwy Alexa, Cortana, Siri ac ati, ond mae cyfyngiadau ar hawlfraint a’r niferoedd yr ieithoedd i’r modelau hyn.

Er bod y rhaglen wedi cychwyn gyda’r Saesneg, erbyn hyn mae’r rhaglen yn cynnwys dros 45 o ieithoedd o Fengaleg i Wsbeceg, gan gynnwys y Gymraeg, Cernyweg a’r Wyddeleg.

Drwy arddel trwydded agored a defnyddio dull torfoli mae Mozilla’n gobeithio ehangu’r nifer o ieithoedd a’r setiau data llais sydd ar gael. Y bwriad yw cael swmp sylweddol o ddata drwy wahodd unigolion i recordio eu lleisiau yn darllen brawddegau penodol yn eu hiaith. Mae hefyd galw ar i bobl wirio lleisiau pobl eraill er mwyn sicrhau fod ansawdd y ffeiliau sain yn addas. Bydd Mozilla’n darparu’r setiau data ar gael yn rhad a rhydd fel bod modd datblygu technoleg llais yn eang.

Os ydych yn gweld cymhariaeth gyda Phaldaruo, gwaith yr Uned Technolegau Iaith, Canolfan Bedwyr mae’n wir dweud fod yr Uned wedi cydweithio’n agos gyda Mozilla i ddatblygu Common Voice. Mae hwn yn gyfle i ehangu ar waith yr uned ac i bobl gyfrannu rhagor o frawddegau llais tuag at yr amcan o gael technoleg llais yn Gymraeg.