Зачем языку цифра, или Почему нам понадобились цифровая лингвистика и цифровой перевод
Большинство людей не видит разницы между двумя современными специальностями, которым подвластен мир алгоритмов. Цифровая лингвистика и цифровой перевод находятся на стыке двух вселенных: лингвистической и математической. Многие даже не осознают, чем занимаются представители этих модных направлений. Мы спросили у студенток Вероники Лоскутовой и Ульяны Егоровой, отучившихся почти год, как они понимают свои будущие профессии.
— Вероника, расскажи, что такое цифровой перевод в твоём понимании?
Вероника: Как нам объясняли преподаватели, мы будем работать с программами, которые создадут цифровые лингвисты. В моём же представлении у нас упор идёт именно на язык, то есть работа строится больше с текстами, чем с созданием программ.
— Если работа больше связана с текстами, зачем тогда нужна цифровизация?
Вероника: Думаю, она облегчит задачу переводчику. Возможно, мы будем отвечать за работу в приложениях, где представлен текст на иностранном языке: ты можешь нажать на слово, и автоматически покажется перевод.
— Ульяна, что насчёт тебя? Что такое цифровая лингвистика в твоём понимании?
Ульяна: Я бы сказала, что её можно условно поделить на две большие части. Первая — сугубо лингвистическая, но исследования в ней проводятся с помощью современных методов, компьютерных технологий. А вторая часть связана непосредственно с программированием. И как раз-таки в этих программах нужно обрабатывать человеческий язык. Думаю, с этим связана и возможность голосового помощника воспринимать наши устные запросы.
— Можно ли сказать, что вы изучаете язык через компьютерную составляющую?
Ульяна: Я бы сказала, что цифровые лингвисты могут посмотреть на язык с другой точки зрения. Наша задача — научить компьютерные программы обрабатывать, понимать сложный человеческий язык. Я бы сказала, что цифровая лингвистика — это дочь лингвистики и программирования с математикой. Поэтому нам нужен и базис языка, и умение работать с цифровой составляющей.
— Как вы обе считаете, в чём самое главное отличие цифровой лингвистики от перевода?
Ульяна: Думаю, в цифровом переводе фокус идёт именно на слово «перевод» — это его специализация.
Вероника: Я согласна с Ульяной, цифровые лингвисты создают программы. Цифровые переводчики же непосредственно будут работать с ними. Мы больше занимаемся языком: передача смыслов, тонкостей, эмоциональных окрасок.
Ульяна: В случае цифровой лингвистики на практике это больше программирование, как я поняла. А лингвистика необходима, чтобы сформировать представление о системе языка. Это знание мы потом используем в рабочих задачах.
— Что за рабочая задача? Это как-то связано с компьютерной лингвистикой?
Ульяна: На самом деле, это очень широкий вопрос. Проще показать на примере. Есть сайт «Национальный корпус русского языка». На нём собрано и проанализировано компьютером огромное количество текстов. Можно посмотреть, сколько там существительных, прилагательных, какие-то стилистические окраски. Задача компьютерной лингвистики —обрабатывать большое количество текстов.
— Вероника, как ты считаешь, зачем нужно такое направление, как цифровой перевод?
Вероника: Как по мне, сейчас очень развивается цифровая сфера жизни, новые технологии. Это не могло не повлиять на перевод, в том числе. Несмотря на разговоры о том, что нейросеть заменит человека, думаю, переводчиков это коснётся меньше. Люди способны выявлять тонкие нотки эмоций, интонаций, и уже от этого многое зависит.

— Я читала, что именно человек выступает дирижёром в работе с нейросетями. Скажи, как ты думаешь, почему ИИ нельзя доверить переводить тексты без контроля?
Вероника: Мы, конечно, можем стремиться к подобному совершенству, но у меня ощущение, что никогда не достигнем, потому что живую речь не заменит ни один робот. Думаю, человеку всегда приятнее разговаривать именно с человеком. Сам перевод будет выглядеть живее, душевнее. Робот воспринимается как что-то холодное, отстранённое. Возможно, играет роль человеческий фактор.— Ульяна, ты говорила, что голосовые инстанции могут воспринимать нашу речь благодаря программам цифровых лингвистов. Можешь предположить, как именно?
Ульяна: Как я понимаю, программа должна преобразовать голос в текст. Возможно, есть отдельные задачи: распознать звук, дать ему эквивалент в виде буквы, потом понять, как это отразится на письме, как отделить слова. Самое базовое, думаю, — распознать набор звуков.
— Какие языки вы изучаете?
Ульяна: Основной — английский. Со второго курса по желанию можно будет изучать немецкий.
Вероника: У нас первым идёт немецкий язык, а вторым уже английский.
Ульяна: Как объясняли руководители, они выбрали немецкий, поскольку именно на этом языке, после английского, пишется больше всего научных статей по нашей специальности.
— Как вы считаете, цифровая лингвистика и цифровой перевод зависят друг от друга?
Вероника: Мне кажется, в какой-то степени да. Мы не справимся без цифровых лингвистов, только если полностью исключить программы.
Ульяна: Мне кажется, цифровой перевод зависит от цифровой лингвистики, но не наоборот. Хотя одно из направлений ЦЛ - разработка программ для перевода, у неё есть и множество других задач, не связанных с этим.

— А почему тогда цифровая лингвистика не может включать в себя ещё и цифровой перевод?
Ульяна: У ЦЛ и так есть множество задач. Всё же перевод — отдельное фундаментальное направление в лингвистике. Программы оставляете нам, а переводчикам – всё, что связано с речью и текстами.
Вероника: Я думаю, что при ином раскладе на цифровых лингвистов легло бы слишком много обязанностей. Сложно управлять и программами, и переводом, и при этом владеть несколькими языками.
Ульяна: Я бы хотела добавить, что перевод — это такое тонкое искусство, которому необходимо уделять много часов своей жизни. Здесь столько нюансов!
Вероника: Да, нам с первых дней говорят, что мы, грубо говоря, соавторы. Нужно переводить приближённо к тексту, осознавать задумку автора, видеть ту творческую жилку, которую он закладывает в слово, предложение, абзац.
Елизавета ЧУРИКОВА
Фото freepik, из личного архива героев и сгенерированы нейросетью
