В. Кускова. Лучшие методы сетевого анализа13 августа 2019

Правильная конструкция исследовательской программы – обязательное условие получения результата, который можно использовать для принятия решения. Правильная аналитика может дать людям, чья работа принимать решение, если не все, то практически все.

«Большие данные изменят мир» – в наше время эта фраза стала расхожей. Вопрос: как изменят? Big data – неотъемлемая часть научного прогресса, но нужны ли нам миллионы единиц информации, чтобы получить конкретные и нужные результаты для их дальнейшего эффективного применения? Нужно искать правильную информацию при помощи правильного анализа.


Валентина КУСКОВА,

заместитель первого проректора НИУ ВШЭ, руководитель Международной лаборатории прикладного сетевого анализа

А что, если бы мы могли точно сказать, как эффективно управлять компанией? Этот вопрос еще в 1951 году был задан Карлсоном. С тех пор оценка эффективности – одна из самых популярных тем в стратегическом менеджменте, а новый всплеск интереса к ней случился в 2000 году, когда сформировалось понятие Big data.

Обрабатывая данные, мы пытаемся установить причинно-следственные связи между действиями руководства и эффективностью компании. Но возникает много проблем, и связи не определяются. Причина, по мнению многих, в недостаточности данных, гетерогенности индустрии, в том, что есть такие уникальные компании, как Аррle, такие уникальные люди, как Стив Джобс или Билл Гейтс… Есть все эти истории, и мы продолжаем в них верить. Но поскольку я руковожу самой лучшей в России магистерской программой «Прикладная статистика с методами сетевого анализа», я знаю, что ответы есть. Продемонстрирую это на нескольких примерах.

Анализ деятельности компаний российского энергетического сектора. Более гомогенной индустрии, чем российская распределительная сетевая компания, найти сложно. Энергия всем нужна, конкуренция на этом рынке почти отсутствует, сам бизнес устойчив к движению рынка, клиенты лояльные и т.д.

Стандартный подход к анализу позволяет предположить: даже при условии гомогенности компании должны чем-то отличаться друг от друга, потому что их финансовая результативность очень разная. Используем стандартный подход, берем стандартные инструменты: финансовые индикаторы, линейную регрессию, производительность труда, юридические показатели и т.д. И стандартно получаем ответ: никаких связей между объективными данными и метриками эффективности компании нет. Мы ищем практики эффективности по показателям эффективности, а найти их не можем.

Но мы аналитики и понимаем, что в данных ничего не бывает стандартным и линейные инструменты не лучший выбор. Следующим этапом исследования был выбор очень эффективного инструмента из операционного менеджмента – непараметрический (оболочечный) метод анализа, на основании которого мы построили модель, объясняющую разницу в эффективности. Но… в список стопроцентно эффективных попали компании, между которыми нет ничего общего. То есть мы определили, что они эффективны, но не ответили на вопрос почему.

Было понятно: есть что-то, что эти компании объединяет, поэтому мы копнули еще на уровень глубже. Анализ эффективности и результаты статистической выгрузки позволяют увидеть, где у компании есть что-то лишнее, а где чего-то недостает. На основании анализа этих данных мы обнаружили, что компании на самом деле неоднородны и делятся на кластеры. В первом кластере компании не имели никаких долгосрочных инвестиций, во втором кластере был низкий уровень EVA (финансовые показатели), в третьем – низкий уровень продуктивности.

Тогда мы использовали дополнительную переменную – инвестиционную привлекательность регионов. Выяснилось, что никакой связи между компаниями и регионами, в которых они работают, нет. Когда же мы наложили тот же самый показатель на кластеры, оказалось, что существует статистически значимая зависимость между инвестиционной привлекательностью региона и эффективностью компании именно в том кластере, где она находится.

Мы действительно можем оценить влияние компании и эффективность менеджмента. Просто наши рекомендации будут очень разными в зависимости от того, в какой кластер эта компания входит, с каким уровнем эффективности и инвестиционной привлекательности. Внутри этих кластеров есть стопроцентно эффективная компания, и мы можем применять рекомендации к этому кластеру. Но рекомендации к одному кластеру не будут работать применительно к другим.

Оценка влияния компании Coca-Cola на социально-экономическое развитие РФ. Для решения этой аналитической и практической задачи были использованы самые разные методы. И результат был достигнут: мы смогли оценить эффективность деятельности компании, выявили проблемные зоны и сделали комплексную оценку вклада, в том числе всех типов эффектов. Когда мы представляли наш проект на Восточном экономическом форуме, генеральный директор фирмы сказал, что такого уровня аналитики он никогда не видел и что наш отчет открыл ему глаза на собственную компанию.

На первом уровне анализа также был использован стандартный поход, который позволил выделить прямые экономические эффекты компании Coca-Cola. За четыре года инвестиции в экономику составили 5,7 млрд долларов, в социальное развитие – почти 2 млрд рублей, общий объем налогов – около 42 млрд рублей.

Но мы опустились еще на уровень глубже, оценили в общей сложности 36 разных индустрий и определили косвенные эффекты, оказывающие влияние на деятельность поставщиков и клиентов компании, и индуцированные эффекты – потребительские расходы частных лиц, чей доход связан с занятостью на предприятиях, обслуживающих компанию. Для подсчета этих эффектов была использована модель межотраслевых балансов А. В. Леонтьева, за которую он получил Нобелевскую премию по экономике.

Так была определена связь прямых и косвенных эффектов. На каждый рубль дохода компании еще 5,7 рубля генерируется в виде добавленной стоимости у поставщиков и клиентов. На каждое рабочее место в Coca-Cola Россия (а в компании почти 10 тыс. сотрудников) создается еще до семи смежных рабочих мест. На каждый рубль, выплаченный Coca-Cola в виде налогов в бюджет России, генерируется еще три рубля в виде дополнительных потоков компаний поставщиков и клиентов.

В российском бизнесе такой уровень анализа используется очень редко. А ведь он предоставляет возможность каждому руководителю оценить эффективность деятельности компании, ее конкретный вклад в развитие отрасли, в общее экономическое развитие страны.

Рейтинги университетов: где искать ответы? Перед Россией стоит глобальная задача: пяти успешным вузам войти в топ-100 мирового рейтинга. Срок реализации амбициозного проекта – 2020 год. Как мы эту задачу решаем? Путем повышения публикационной активности, привлечением иностранных студентов и преподавателей, увеличением количества цитирований, исходящей академической мобильностью. Каким образом наши конкуренты продвигаются в рейтингах? Таким же. Техника повышения позиций одинакова.

Главная отечественная проблема – недостаток средств. Это обстоятельство не позволяет быстро и эффективно достигать прорывных научных результатов во всех областях. Так какой из показателей повышать в первую очередь и в каком объеме?

Первое, что приходит в голову, – оценить показатели лучших вузов, например, топ-100 университетов стран БРИКС. И метрики рейтинга, и формула, по которой рассчитывается место в рейтинге, известны. Выкладываем эти данные в модель кластерного анализа и видим ничего не говорящую аморфную кучу. Какого-то понимания, как эти сто университетов стали топовыми, не возникает.

Что делать – повышать все показатели одновременно? Наши конкуренты делают то же самое. В результате мы просто немного сдвигаем эффективную границу, но не достигаем необходимого результата для принятия решения.

Обработка данных непараметрическим методом позволяет вместо аморфной кучки получить четыре четких кластера. За счет роста количества публикаций на одного преподавателя активно продвигаются китайские университеты. Им же принадлежит лидерство и по числу привлеченных студентов и преподавателей. Кластер, куда вошла и Высшая школа экономики, объединяет лучшие показатели по индексу научной цитируемости. Пока доля самих публикаций небольшая, но их цитируемость достаточно высока.

И все становится понятно: наверное, нецелесообразно для продвижения в рейтинге разбивать скудные денежные средства на все показатели. Логично основной упор сделать на один из них – либо тот, где дела идут не очень, либо, наоборот, усилить то, что хорошо работает. В данном случае не важно, какое решение будет принято. Важно, что мы выполнили исследовательскую задачу и выяснили, в чем отличие российских вузов от других эффективных университетов.

Каков общий вывод? Независимых данных не бывает. Сетевой анализ только один из вариантов статистического анализа, позволяющий отследить зависимости между данными, где единицей наблюдения является не точка, а две точки в пространстве и возможная связь между ними. Есть и другие способы оценки зависимости. Мир не сводится к одной зависимой переменной, а анализ данных – к линейной регрессии. Прикладной статистический анализ – другая система мышления, из данных надо уметь извлекать информацию.

Наша лаборатория, созданная в 2014 году, используя уже имеющиеся инструменты, а также самостоятельно разработанные, занимается решением реальных прикладных задач. У нас много сотрудников, много публикаций, нас хорошо знают в международном академическом пространстве. Лаборатория является базой самой крутой программы прикладной статистики сетевого анализа просто потому, что она – единственная, других таких программ в России нет.