Поддержать нас
Беларусы на войне
  1. Для населения хотят ввести новые штрафы
  2. В СК придумали новые подходы для преследования инакомыслящих беларусов — акцент делается на двух соцсетях
  3. Для водителей анонсировали новшество и пригрозили им «административкой»
  4. Вводят пенсионные новшества
  5. «Лукашенко хочет стать Токаевым». Что будет с остановившимися переговорами Лукашенко и США по поводу политзаключенных? Мнение
  6. «Спасибо за помощь ВСУ». Украинцы массово шутят над Максом Коржом в соцсетях
  7. В Полоцке проверили рассказ матери об избиении сына на тренировке по дзюдо. Каковы результаты
  8. Родители спросили у Минобразования, зачем детям летом полоть сорняки и подметать в колхозе. В ведомстве ответили
  9. «Пашешь, пашешь, и все мало и мало». Беларусы, работающие врачами в Польше и Нидерландах, рассказали, как трудятся и сколько получают
  10. Долгожитель среди классиков, одной фразой описал менталитет беларусов, не принимал советскую систему. Чем крут Янка Брыль — пять пунктов
  11. Пенсионеры и инвалиды могут покупать продукты со скидкой в 10% — МАРТ и торговые сети продлили соглашение
  12. Лукашенко сменил одного министра, директоров заводов и главу крупнейшего госмедиахолдинга
Чытаць па-беларуску


/

Беларусы запускаюць праект Sonora — гэта ініцыятыва па стварэнні якаснага аўдыядатасэта для беларускай мовы, які стане асновай для развіцця тэхналогій сінтэзу маўлення. Гэта дапаможа ствараць аўдыякнігі, рабіць агучку для дадаткаў і не толькі. Расказваем.

Выява носіць ілюстрацыйны характар. Ілюстрацыя: Sonora 
Выява носіць ілюстрацыйны характар. Ілюстрацыя: Sonora 

Падтрымаць праект можна па спасылцы.

Сёння беларуская мова амаль не прадстаўлена ў свеце галасавых і AI-тэхналогій, адзначаюць стваральнікі праекта. А без якасных дадзеных яе развіццё ў гэтым кірунку застаецца абмежаваным.

Вырашыць гэтую праблему і збіраецца Sonora — ініцыятыва па стварэнні якаснага аўдыядатасэта для беларускай мовы. Датасэт — гэта набор студыйных аўдыязапісаў, на якіх будуць навучацца мадэлі сінтэзу маўлення. Менавіта ён вызначае, як будзе гучаць мова: ці будзе яна натуральнай і жывой, або механічнай і «робатнай».

Плануецца, што такая база стане асновай для развіцця тэхналогій сінтэзу маўлення. Гэта дазволіць з’явіцца натуральнаму гучанню беларускай мовы ў сучасных тэхналогіях: дадатках, аўдыякнігах, адукацыі і AI-прадуктах.

Каманда плануе падрыхтаваць тэксты разам з лінгвістамі, якія потым агучаць прафесійныя дыктары. Потым дадзеныя апрацуюць і падрыхтуюць для далейшага выкарыстання.

На такі праект трэба 13 тысяч еўра, разлічваюць у камандзе. Каб сабраць гэтую суму, яны адкрылі збор — падтрымаць яго можна па спасылцы.