AI for Business Leaders - Введение
Для кого этот документ? Для всех, у кого есть управленческий опыт и неотвеченные вопросы о “data science” и анализе данных.
Возможные цели читателей:
- Вхождение в data science, как сделать первый проект внутри компании
- Узнать про “чужие грабли”, составить представление о типах проектов и как ими управлять
- Найти подтверждение своим бизнес-наблюдениям, проверить интуицию
Как пользоваться документом:
Какие посмотреть ролики и ссылки - для начала?
Наши три топовые рекомендации.
1. Данные - модели - бизнес-процессы (2019)
Даже если вы прогнозируете что-то со 100% точностью, сам прогноз не зарабатывает никаких денег.
Константин Короткий, сооснователь Data Nerds
https://youtu.be/BujPXw6U84o?t=2819
Очень точно говорит о роли моделей в работе компании: основные проблемы не на
стороне какие модели придумать, а где взять нужные данные и даже если
100% прогноз сделан - что на стороне бизнеса нужно делать дальше, это чаще всего
не ясно. “Великая” и очень правильная идея. Если посмотреть что-то одно из
списка - рекомендую это, это прям короткая и точная реплика.
2. Machine Learning, или Трансформация данных в деньги (2017)
Александр Хайтин, исполнительный директор Yandex Data Factory
https://www.youtube.com/watch?v=7aVZejD9DdU
![](https://user-images.githubusercontent.com/9265326/80586433-a24f1d80-8a1d-11ea-9f49-e108986eff65.png)
Дается обзор работы с данными и получения ценности, с примерами в банках, ритейле, нефтехиме. Мне кажется, самый адекватный и одновременно верхнеуровневый доклад.
Среди тем:
- дефицит естественного, а не искуственного интеллекта
- много ли мы говорим об элеткромотре для лифта (скорее бы тема ИИ наскучила и стала просто инструментом)
- работа с данными - метафора тазика и драги на золоторудном месторождении
3. Как подготовить бизнес для Data Science (2019)
Алексей Чернобровов, консультант по работе с данными
https://www.youtube.com/watch?v=DOAOkldg6SM
![](https://user-images.githubusercontent.com/9265326/80586874-505ac780-8a1e-11ea-9327-599542bdf8d7.png)
Идеи в презентации:
- к качеству работы с данными в компании применить критерии (перечисляются)
- пилотные проекты по работе с данными направлены на обучение внутри организации,
после пилотов становится ясно, что и как дальше внедрять
- надо уметь правильно считать ROE (отдачу от проекта), но не рубить пилоты
- выбор между in-house командой и привлечением консалтинга
Что не сказано:
- часто ROE проектов становится отрицательным, если не менять ничего
на стороне бизнеса, “офлайновых” процессов
Интересные вопросы начинаются здесь
Последний вопрос, про три сферы навыков
- Важно для специалиста по работе с данными: (1) computer science,
(2) математика, (3) понимание бизнеса (доменная область).
- Становится более важным для менеджеров проектов сейчас: (1) культура работы с данными, (2) понимание бизнеса, (3) программирование.
Дополнительные материалы
Темы для занятий - что может быть полезным руководителям?
Содержание работ - 1:
- Можно ли с помощью Data Science модернизировать критические процессы в компании?
- Отличие между аналитическими (advanced analytics) и производственными
(production) моделями. Пример - пересмотр названий профессий в Lyft
- Почему раньше Data Science не было? (build vs buy, созревание открытых библиотек, что-то еще)
- Что в компании происходит с управлением данными, что не подходит для Data Science
Содержание работ - 2:
- История работы с данными / офисной автомтизации (Excel)
- История развития отдельных отраслей машинного и глубинного обучения
(речь, компьютерное зрение)
- Что на самом деле используют на практике (обзор библиотек, хотя бы по группам,
что к чему относится).
Содержание работ - 3:
- стадии проекта, управление отдельным проектом, требования
- чем “тяп-ляп и в production” отличается от хорошего проекта
Управление
- цели проектов работы с данными, измерение отдачи от них, важность пилотных
проектов и обучения внутри организации
- привычка к линейным (waterfall) проектам и ее применимость к работе с данными
- люди, их роли, мотивации
Пример проекта:
- поставим цель, разобъем на задачи
- оценим бюджет и выигрыши
- подгоним под
ROI > 0
- найдем/наймем людей
- проконтролируем выполнение
- по ходу что-то скорректируем
- отчитаемся
- ничего вокруг проекта менять не будем
С чего начать - первый проект в органиазции
- назревший проект, который не решается другими способами (идем от usecase’а)
- управленческая отчетность и отражение понимания бизнеса собственника и руководителя
в цифровых отчетах. Руководитель говорит “я хочу знать то-то”, дальше смотрим как это
обычно делают руками и как долго (идем от BI)
- инициатива людей снизу (которую надо фильтровать)
Принципиальные ограничения
- некоторые процессы в принципе плохо поддаются цифровизации
- как только показатель начинают таргетировать, он перестает быть хорошей метрикой
- в ручных процессах бывает много смысла и логики, неправильный подход может
их нарушить
- вставки “кусочных улучшений” имеют свой предел, после которого надо либо
сильно менять бизнес-процессы, структуру
- хорошо работают простые вещи
Конфликты и мнения в коллективе, динамика организации
- вроде как-то работает, зачем менять
- сейчас поговорим много слов и от нас отстанут
- стойте, вы же хотите меня уволить
- нам невыгодно быть слишком цифровыми в этой идиотской среде
- смотрите ваша шутковина не работает
- это все невыгодно, где ROI? без этого не на шаг!
- у нас и так много ИТ, все работает хорошо, мы тратим на это кучу денег
- 1001 способ просаботировать выполнение цифрового проекта
- 1001 способ симитировать выполнение проекты
- данные мои и никто их не получит
- я все запутаю, только чтобы остаться незаменимым
- это все только увеличвает награзуку на меня, стало больше отчетности
Рынок
- Описание типовых проектов по секторам и испольнителям
- Data Science как зонтичный бренд для разных видов работ
как по содержанию, так и по квалификации
- Хайп, инфляция стоимости разработчиков, половинчатые навыки
- Откуда берутся спецалиалисты по DS, их подготовка, что умеют, что не умеют
- Как может специалист по data-scienсе навредить компании
Ход мысли от стратегии
- В каком мы бизнесе и на чем мы зарабтываем
- Будет ли этот рынок у нас через 5 лет. Кто может предложить продукт или услугу лучше?
- Что мы на самом деле мы продаем, в чем наша услуга, почему ее покупают
- Что нужно, чтобы сделать продукт лучше или дать новый продукт заказчику?
- Какие данные нужны для того, чтобы был новый продукт
Типы бизнеса
- high load / низкочастотные данные
- есть вообще цифровая составляющая в продукте и его обороте?
- build vs buy vs “buy и допилить”
- “вообще-то у нас 1С стоит”, “мы переходим на SAP” И т.д.
- “главное затащить к нам клиента, дальше разберемся”
Техническая культура
- CLI vs GUI культура
- цепочки данных
BI / data service
- от сырых данных до презентации на столе начальника - сколько часов и ручных операций
- как быстро умеем менять отчетность
- что понимают под данными и их представлением (откуда “презенташка” на столе)
- кто пилит отчеты в компании и зачем этот человек нужен
- внутренние сервисы по предоставлению данных - продукты на основе данных
- пример: сколько человек должны знать SQL в органиазции
Общая картина компании
- видим ли клиента, на кого по факту нацелена работа в компании
- как организована подготвка текущей отчетности, что знаем про бизнес “в моменте”
- оценка положения на рынке (только одни мы такие, догонем кого-то, гонятся за нами и т.д.)
Что делать / что не делать
- надо обязательно купить какую-то (дорогую) программулину
- надо скопировать, как у других
- надо позвать консультантов
- надо (…)
Big data
Хорошее:
- состыковать кривые данные из разных источников
- высокочастотные данные (изображения, видео, звук, речь)
- возможность вернутся к вопросу, какие собственные данные есть у нас
Плохое:
n = all
не защищает от плохих моделей
- прикрытие для того, чтобы своровать персональные данные о клиентах
ИИ
- Взгляд 1: внутри спрятан джин и переиграл кого-то в шашки
- Взгляд 2: непонятная модель с миллионом необъясненных коэффициентов
- Взгляд 3: такой же инструмент как Excel или (сложный) калькулятор
Отдельные темы
- Специфический юмор внутри DS (логит-регрессия, grep, csvшки)
- Как загубить data science проект - roads to disaster
- Thought leaders, “евангелисты”, influencers и отчеты Gartner
Программа “AI for Business Leaders” (проект)
Целевая аудитория:
- руководители и ключевые менеджеры среднего бизнеса
- задумываются о том, как могут улучшить работу своего бизнеса,
используя анализ данных, моделирование и автоматизацию
- ощущают переизбыток рекламной информации
Особенности:
- “у нас небольшое предприятие”: не интересны “космические корабли” и как там работает Гуггл
- часто стартовая точка в бизнесе - довольно низкий уровень дата-культуры
- хотим четкий словарь и набор понятий, а не “нейронка там все сделает”
Об этом документе
История вопроса
- Коллеги нас спросили, какие видео посмотреть, чтобы лучше понимать, как бизнес смотрит на data science.
- Мы составили список из трех видео и прокомментировали их. Это первая часть документа.
- Мы составили список вопросов, важных при орагниазации работы с данными и автоматизации. Это вторая часть документа.
Кто авторы
- Евгений Погребняк
- Степан Зимин
Откуда мы сами знаем про data science
- опыт внедрения DS проектов в индустрии
- компетенции в работе с данными, экономическом моделировании, программировании
- open source проекты
- преподавание и участие в подготовке студентов