
Разработчик NLP / NLU - Python, Томск.
▷ Работодатель: Частное учреждение по...
(профиль,отзывы)
💰 From 0 RUR. | Режим: office |
10
* This listing is inactive or archived *
Цифрум - дочерняя компания ГК Росатом, являющаяся отраслевым центром компетенций по искусственному интеллекту. В наши задачи входит анализ активов данных на предприятиях отрасли, проверка гипотез на этих данных, создание решений и продуктов на их основе.
Ищем в команду опытного разработчика на Python, способного решать сложные задачи в области анализа естественного языка. Ожидаем, что кандидат умеет преобразовать pdf в текстовый формат, понимает как отделить рисунки от текстов и поискать в текстах именованные сущности.
Задачи:
- Преобразование документов (pdf, word) в структурированные объекты (парсинг): классические алгоритмы, используя технологии синтаксического анализа.
- Применение методов машинного обучения в задачах классификации документов и фрагментов текста, сегментации и сопоставления документов, поиска именованных сущностей в документах.
- Преобразование документов в тестовые форматы (tesseract).
Требования:
- Практические знания лингвистики русского и английского языков
- Опыт решения релевантных задач в области NLP / NLU
- Уверенные знания Python (алгоритмов и структур данных, стандартных библиотек и фреймворков), SQL
- Эрудиция в области информационных технологий
- Высшее техническое образование или его аналог
Преимущества:
Нам доступно в сотни раз большее разнообразие задач по направлению машинного обучения чем, например, в банке или магазине, а решаемые нами проблемы масштабны и социально значимы.
Условия:
Заработная плата 2 раза в месяц и годовая премия, привязанные к системе грейдов. Множество дополнительных активностей (спорт, дети, образование, профессиональное развитие, конференции). ДМС со стоматологией доступно с первого месяца работы.