Архитектор по неструктурированным данным, Москва.

▷ Работодатель: Полюс (профиль,отзывы)
💰 From 0 RUR. | Режим: office | 10

* This listing is inactive or archived *

Обязанности:
  • Выполнение работ по развертыванию, сопровождению, расширению/развитию платформы (хранилища) и инфраструктуры в рамках проекта по трансформации производственных процессов.
  • Проектирование архитектуры, выполнение работ по развертыванию и сопровождению платформы для работы с данными (сбор, накопление, предоставление доступа, обработка).
  • Планирование и контроль исполнения задач по проектированию, развертыванию, сопровождению, расширению/развитию платформы (хранилища) и инфраструктуры для работы с большими неструктурированными или слабоструктурированными данными.
  • Внесение предложений по развитию архитектуры и инфраструктуры для работы с большими неструктурированными или слабоструктурированными данными.
  • Подготовка предложений по созданию инфраструктуры для управления корпоративными данными.
  • Загрузка данных из различных источников в хранилище, проектирование и разработка потоков данных (staging) и витрин данных.
  • Создание и управление конвейерами данных (оркестрация потоков).
  • Поддержка Data Scientist’ов и аналитиков данных, выгрузка данных.
  • Разработка ELT/ETL процессов потоковой и пакетной обработки данных.
  • Проверка качества и целостности данных.
  • Автоматизация и поддержка операционных аналитических задач.
  • Определение потребностей бизнеса в анализе больших данных в долгосрочной перспективе для планирования ИТ-мощностей и развития компетенций Компании.
  • Формирование и защита стратегического архитектурного видения, дорожных карт развития и иных концептуальных документов по данному направлению.
  • Планирование потребностей в части лицензий, консалтинга, инфраструктуры для работы с большими неструктурированными или слабоструктурированными данными.
  • Планирование и разработка разделов НМД по анализу процессов и данных в части порядка работы с инструментами сбора, накопления, обработки, предоставления доступа к большим / слабоструктурированным данным.
  • Создание обучающих, справочных материалов по инструментам работы с большими / слабоструктурированными данными.
  • Проверка качества и целостности данных.
  • Автоматизация и поддержка операционных аналитических задач.
Требования:
  • Высшее образование в области информационных технологий, математики и математических методов, физики. Приоритетом являются специальности, связанные с управлением данными, анализом данных.
  • Опыт построения хранилищ больших данных и озер данных.
  • Практики использования MPP хранилищ данных и реализации массивно-параллельной обработки данных.
  • Знание принципов хранения информации в SQL и NoSQL, а также умение работать с реляционными базами данных (GreenPlum /Arenadata DB, PostgreSQL и тп.).
  • Владение инструментами сбора и обработки данных, в том числе ETL (Airflow, NiFi, Kafka и пр.).
  • Владение языками программирования (Python - базовые знания, Java - является преимуществом).
  • Практический опыт разворачивания и администрирования MPP хранилищ .
  • Практический опыт применения ETL инструментов и сбора данных из систем-источников.
  • Знание GreenPlum PSQL.
  • Умение писать и оптимизировать сложные SQL-запросы.
Условия:
  • Обсуждаемый уровень окладной части;
  • Премирование согласно корпоративным политикам;
  • Срочный трудовой договор на время реализации проекта;
  • ДМС, страхование жизни;
  • Социальный пакет, возможности корпоративного обучения.
http://rabota.polyusgold.com
PostgreSQLJavaSQLETLPython

Created: .
Expires after: .
Responses: 10

Откликнуться на вакансию  Работодатель: профиль,отзывы