Чеська система автоматичного перекладу перекладає одночасно між 43 мовами. Українською тим часом не дуже
Промовець, п’ять синхронних перекладачів і автоматичний переклад більш ніж чотирма десятками мов — фахівці з машинного перекладу з празького Карлового університету розробили нову систему, яка може перекладати усну мову одночасно поміж 43 мовами в реальному часі. Систему ELITR — Eupopean LIve TRanslator («Європейський перекладач наживо») — розробляли для міжнародних конференцій, і кожне слово промовця з’являється на екрані в писаному перекладі вже за кілька мілісекунд, пробігши за цей час майже всією Європою. Розробники мають намір «учити» свою систему далі, щоб поліпшити якість її перекладу.
Ондржей Бояр із Інституту формальної і прикладної лінгвістики математично-фізичного факультету Карлового університету показує кореспондентці Чеського радіо роботу системи: «Як тільки я скажу слово, воно з’явиться написаним у першому стовпчику з чеською мовою, і то дуже швидко. Із чеської воно перекладається англійською. А поруч є табличка, де користувач може вибрати будь-яку іншу з загалом 42 мов, і там почнуть з’являтися переклади різними мовами», — пояснює Бояр.
Клацаючи по квадратиках, можна збільшувати кількість мов, на яких з’являється синхронний переклад — на екрані видно латинку, кирилицю, арабське письмо, іврит чи й вірменські літери. Скільки їх усього?
«Разом із англійською 43. Зараз ми дивимося тільки на шість, і вже бачимо, що гортається надто швидко, бо ці стовпчики надто вузькі — на більше нашого екрану не вистачає. От якби він був завширшки метра півтора, то всі би влізли», — каже Бояр.
«Європейський перекладач наживо» ELITR виник на прохання Верховного контрольного управління Чехії, яке готувало великий міжнародний конгрес.
«Ми склали план, як протягом трирічного проєкту підготувати систему так, щоб вона могла стежити за живим словом головного промовця, а для контролю також п’яти присутніх синхронних перекладачів, і з цих кількох джерел наживо зображати переклад промовленого слова», — розповідає фахівець.
Великий обсяг перекладу одночасно
Тому чеська команда на чолі з Ондржеєм Бояром об’єдналася з закордонними колегами і створила систему, яка з використанням величезного словникового запасу окремих мов для машинного навчання видає десятки перекладів одночасно.
«Ізсередини це працює так, що ми маємо підготовану одну натреновану модель, щоб вона видавала результат усіма мовами одночасно. Ми задаємо їй те саме речення 42 рази і кажемо їй: переклади це англійське речення чеською, азербайджанською, болгарською. Серце системи — графічна карта, яка працює паралельно, тому відповідь усіма мовами надходить одночасно», — пояснює Бояр.
При цьому слово, промовлене в Чехії, протягом кількох мілісекунд пробігає загалом дев’ятьма системами — також у Шотландії, Німеччині й Італії.
«Це все відбувалося в реальному часі, тобто коли одне слово було вимовлене, в ту ж хвилю воно з’являлося на екрані, і при цьому встигало пробігти Європою», — додає Ондржей Бояр.
Система буде вчитися далі
При перекладах виступів на конференціях важливо, щоб онлайн-переклад створювався неперервно по словах, а не по реченнях.
У майбутньому система мала б робити й змістовні записи виступів усіма мовами.
Докторант Домінік Махачек нині працює над поліпшенням результату перекладу — завдяки комбінації слів промовця і живих синхронних перекладачів.
«Наприклад, чеське слово zámek може означати замок — будову і замок — пристрій для замикання, але коли ми до того одночасно отримаємо англійське речення, то вже знаємо, про що йдеться, і можна буде краще перекласти до подальшої мови», — пояснює він.
Через апаратну складність система перекладу ELITR наразі не буде мобільним застосунком.