Среда, 23 Ноябрь 2016 11:27

Конференция LT Accelerate 2016

Конференция, посвященная развитию технологий в сфере лингвистики- LT Accelerate, прошла 21-22 ноября этого года в столице Бельгии- Брюсселе.

На конференцию прибыли специалисты по разработке программного обеспечения и приложений, эксперты в сфере обработки больших массивов данных и искусственного интеллекта (ИИ).

Системы распознавания и обработки естественного языка (NLP-Natural Learning Processing) находились в центре внимания на протяжении 2 дней конференции.  Ряд известных экспертов и исследователей посвятили свои презентации этой актуальной теме. Также постоянно звучали комментарии о том, что главное - это machine learning, то есть накопление знаний, выявление паттернов, создание рамок и скриптов, которые будут служить «рельсами» для прорыва в этой сфере.

Читать далее >>>

 

  

Фото: Майк Хайд

LT-Accelerate 2016

Конференция, посвященная развитию технологий в сфере лингвистики- LT Accelerate, прошла 21-22 ноября этого года в столице Бельгии- Брюсселе.

На конференцию прибыли специалисты по разработке программного обеспечения и приложений, эксперты в сфере обработки больших массивов данных и искусственного интеллекта (ИИ).

Организатором выступила американская компания Alta Plana во главе с президентом Seth Grimes, а само мероприятие прошло в Trade Union House, при спонсорской поддержке Socialgist, Discovertext и известной всем переводчикам компании SDL.

По мере стремительного увеличения объема данных во всем мире благодаря традиционным источникам- телевидению, газетам, а также сравнительно новым- соцсетям, форумам и чатам, в мире имеются терабайты информации, которые нуждаются в систематизации и анализе.

Поскольку массивы данных, контент, производится на разных языках (например, пример Baidu в Китае), то естественно, что крупных производителям и бизнесу необходимо держать руку на пульсе общественного мнения, тенденций, моды, cool-hunting’а и всего, что волнует человечество.

Первый день конференции открыл Seth Grimes (Alta Plana), сделав обзор технологий, которые особо интересуют его компанию: big data, machine learning, natural language processing (NLP), sentiment analysis technologies и их практическое применение.  

Mike Hyde (Skype) в своей презентации рассказал о том, как создавался сервис Skype по переводу на разные языки мира в режиме реального времени. Сервис заменяет устного переводчика и позволяет общаться без языковых барьеров. Mike нам напомнил о недалеком прошлом, когда Skype был первым сервисом для бесплатных коммуникаций. Сейчас же каждый день появляются десятки бесплатных сервисов, которые предоставляют аналогичные услуги. Обведя конференц-зал рукой, Mike сказал: «Вы видите эти кабины переводчиков- теперь они не нужны!».

Системы распознавания и обработки естественного языка (NLP-Natural Learning Processing) находились в центре внимания на протяжении 2 дней конференции.  Ряд известных экспертов и исследователей посвятили свои презентации этой актуальной теме. Также постоянно звучали комментарии о том, что главное - это machine learning, то есть накопление знаний, выявление паттернов, создание рамок и скриптов, которые будут служить «рельсами» для прорыва в этой сфере.

Одним из вопросов, которые больше всего волновали переводчиков, которые посетили данное мероприятие, это роль переводчика в IT-технологиях, которые научились обрабатывать, сегментировать, анализировать, переводить и сортировать большие массивы данных за короткое время. Что же ожидает устных и письменных переводчиков в ближайшие годы?

На этот вопрос ответ дали сразу несколько экспертов. Например, Alexandra Birch (University of Edinbourgh) во время панельной дискуссии с участием сотрудников BBC, Deutsche Welle и Ericsson, отметила, что переводчики все еще будут востребованы для того, чтобы контролировать качество текста. Однако роль переводчика все больше и больше будет сводиться к тому, чтобы редактировать и поддерживать качество машинного перевода. Matt Simpson добавил, что такие жанры, как комедия, невозможно обеспечить лишь машинным переводом. В целом, эксперты отметили, что при машинном переводе теряется около 10 % эмоциональной составляющей текста.

Интересной была презентация от практика с большим стажем- Dirk Hueske-Kraus (Philips Healthcare) рассказал аудитории о том, как можно генерировать контент на разных языках, с учетом культуры, происхождения, уровня грамотности и анамнеза пациентов, структурировать информацию и передавать ее в читабельном и корректном виде. Естественно, это значительно облегчает работу медперсонала и улучшает качество медицинских услуг.

Кроме соцсетей, форумов и прочих текстовых ресурсов большой интерес специалистов вызывают видео- и аудиоконтент. Это могут быть телевизионные и радиопередачи, записи разговоров колл-центра, интервью и т.д. Ряд презентаций были посвящены тому, как справиться с задачей по отекстовки речи и приведению ее в читабельный формат.

Новой сферой стало и возможность считывать эмоции- как с семантики текста, так и по выражению лица, языка тела на фотографиях (например, из Instagram). Одним из успешных стартаперов в сфере sentiment analysis technologies является Лана Новикова, уроженка г.Бишкек, которая ныне проживает в Канаде. Она основала компанию Heartbeat, которая занимается изучением эмоций - например, какой эмоциональный посыл несут посты в Twitter.  

При этом эксперты отметили, что важно интерпретировать не только что люди пишут или говорят, но и как они это делают (считывание эмоций с лица или жестов), но и где они это делают (геолокализация). Все эти данные поступают для обработки искусственным интеллектом, который учится на этих примерах и ему задаются параметры для взаимодействия. Так что скоро наступит время, когда бот сможет понимать ваши эмоции!

Заключительную речь произнес серийный предприниматель в сфере IT и лингвистики Jochen Hummel (ESTeam AB), который стал основателем компании Trados. Он подчеркнул, что технологии развиваются стремительными  темпами и что все участники привнесли что-то полезное и заслуживающее внимание в обсуждения.

Выводы:

-Машинный перевод в некоторых языковых парах зачастую достигает качества человеческого перевода;

-Перевод больших массивов данных уже невозможно/слишком затратно переводить силами человека- на помощь приходят ПО, способные быстро и с небольшим процентом погрешности обработать данные и выдать их в нужном формате;

-Все большую роль играет английский язык, ставший поистине мировым языком: это влияет на остальные языки мира, упрощая и обедняя их;

-Сложно предсказать, когда именно МТ (Machine Translation) заменит живых переводчиков- через 6 месяцев или лет, однако учитывая темпы развития технологий, это событие не за горами;

-Специализированные тематики по-прежнему будут нуждаться в человеческом переводе (литература, юмористические произведения, тексты, связанные с эмоциями, рекламные тексты);

-Перевод стал лишь частью мира информации и информационных технологий, а IT-предприниматели прикладывают все усилия, чтобы разрушить языковые барьеры и пока у них все складывается просто замечательно.

- Индира Серикбай

 

Фото: Майк Хайд