
Аналитик по работе с текстами, Москва.
▷ Работодатель: Открытые Технологии
(профиль,отзывы)
💰 From 120000 RUR. | Режим: office |
10
* This listing is inactive or archived *
Обязанности:
- Развитие функционала, связанного с анализом текстов, для платформы по анализу больших данных: выделение именованных сущностей, суммаризация текста, поиск плагиата, быстрый поиск по тексту с учетом синонимов;
- Разработка пользовательских приложений, связанных с анализом текстов, на базе платформы (уточнение требований, подготовка датасетов, реализация моделей, визуализация решений);
- Анализ больших объемов данных, оценка качества датасетов, поиск и исправление аномалий;
- Документирование разработанных алгоритмов;
- Презентация разработанных алгоритмов и подходов перед заказчиками.
Требования:
- Знание основных ML-алгоритмов (классификация, регрессия, кластеризация).
- Знание основ лингвистики (или компьютерной лингвистики) и понимание базовых терминов в области морфологии, синтаксиса, морфемики.
- Знание инструментов NLP (морфологические и синтаксические парсеры, эмбеддинги слов, информационный поиск, выделение именованных сущностей, алгоритмы классификации и кластеризации текста, извлечение данных)
- Python (scikit-learn, pandas, numpy, scipy, tensorflow/pytorch/keras).
- Опыт работы с NLP-библиотеками (HuggingFace Transformers, NLTK, Gensim, word2vec, doc2vec, DeepPavlov)
- Опыт работы с Apache Spark (Spark SQL, Spark ML), Linux, Bash, Git.
- Владение техническим английским, умение понимать и адаптировать алгоритмы и модели, описанные в научных статьях.
Будет плюсом: - Scala или Java (для работы с Apache Spark, написание UDF);
- Опыт применения ПО для организации и поддержания DS проекта: Docker, DVC, MlFlow, AirFlow, Cookiecutter/Kedro.
Условия:
- ДМС.
- Корпоративная мобильная связь.
- Офис м.Серпуховская.
- Удалённая работа.
Москва, Стремянный переулок, 26
http://www.ot.ru
LinuxPythonSQLGitNLP