Комплексные и сверхзлостные проблемы

We use cookies. Read the Privacy and Cookie Policy

Комплексные и сверхзлостные проблемы

Системный подход принесла доктору Ларри нынешний пост главы “Фонда Сколла по борьбе с глобальными угрозами”, имеющего мандат на защиту человечества от различных опасностей, среди которых конфликты на Ближнем Востоке, распространение ядерного оружия, пандемии, изменения климата и та борьба, что может развернуться из-за нехватки воды.

“Мы находим горячие точки либо места, где возможны проблемы. Взять, например, нехватку воды или борьбу между тремя ядерными державами – Пакистаном, Индией и Китаем. Около 95 % воды в Пакистане используется в сельскохозяйственных целях, верховья же основных рек находятся в Индии. Пакистанцы считают, что Индия манипулирует со шлюзами и контролирует объемы воды, которую получает Пакистан. Что касается рек, верховья которых находятся географически севернее Индии, индийцы полагают, будто китайцы регулируют поток воды с «Третьего полюса» – ледника и снежника гималайского плато”. Однако никто толком не знает, сколько воды проходит по этим речным системам, сколько шлюзов регулируют этот поток, где они расположены и с какой целью их используют. “Эти данные правительства всех трех стран держат в тайне и используют их в качестве политического рычага, – говорит доктор Ларри. – Поэтому мы поддерживаем сбор информации доверенной третьей стороной и стараемся сделать эту информацию открытой. Она поможет нам совершить следующий шаг в анализе ключевых узлов и болевых точек”.

Ключевую роль в борьбе с любой потенциальной глобальной пандемией гриппа, вызванной штаммами с мутациями, к которым ни у кого нет иммунитета, будет играть оперативное реагирование. Однако развитие событий невозможно предугадать, любая ситуация станет уникальной (например, во время последней пандемии в 1918 году еще не летали 747-е “боинги”). И все же ставки столь высоки, что ошибки просто недопустимы. Все это относит пандемию к числу “злостных” проблем – то есть не “злых”, а чрезвычайно трудных для разрешения.

А вот борьба с глобальным потеплением представляет собой “сверхзлостную” проблему: нет ни одной властной структуры, ответственной за нее, время на исходе, люди, занимающиеся решением проблемы, одновременно (вместе со всеми нами) ее создают, а официальные политики умаляют ее важность для нашего будущего[156]. Более того, как пандемия, так и глобальное потепление технически называются “комплексными проблемами”. Это значит, что тревожная ситуация связана с серией других, сопутствующих затруднений[157]. По словам доктора Ларри, здесь заложена чрезвычайно сложная дилемма, причем у нас отсутствуют многие данные, необходимые для ее разрешения.

Системы практически не видны невооруженным глазом, однако их функционирование можно сделать видимым, если собрать данные с определенного количества точек, чтоб стала заметна динамика развития. Чем больше данных, тем яснее становится картина. Добро пожаловать в эпоху больших данных!

Спустя годы после того периода увлечения нумизматикой в Индии доктор Ларри стал исполнительным директором-учредителем Google.org, некоммерческого звена Google. В рамках этой организации он запустил одно из первых знаменитых приложений по сбору больших данных, созданное для обнаружения эпидемий гриппа. Волонтерская команда инженеров Google в сотрудничестве с эпидемиологами из Центра по контролю и профилактике заболеваний в США проанализировала огромное количество поисковых запросов по таким ключевым словам, как “лихорадка” или “боль”, связанными с симптомами гриппа[158]. “Мы задействовали одновременно десятки тысяч компьютеров, изучили каждый запрос в Google за пять лет, чтобы разработать алгоритм, предсказывающий вспышки гриппа”, – вспоминает доктор Ларри. Полученный алгоритм помогает вычислить вспышку гриппа в течение дня, а не за две недели, которые, как правило, нужны Центру для обнаружения очагов болезни на основании отчетов врачей.

Мощное программное обеспечение анализирует огромный объем данных, а использование данных Google для обнаружения вспышки гриппа стало одной из первых попыток применить большие данные к огромной группе людей. В итоге появилось название “коллективный разум”. Большие данные позволяют нам понять, куда устремлен фокус коллективного внимания.

Область их применения безгранична. Например, если проанализировать связи между людьми (через звонки, твиты, СМС-сообщения и т. п.), то станет можно понять структуру связей “нервной системы” организации, проанализировать связанность. Люди с “гиперсвязями”, как правило, наиболее влиятельны: они являются социальными звеньями в организации, имеют доступ к информации и играют роль “серых кардиналов”.

Среди растущего количества способов коммерческого применения больших данных есть один, с помощью которого оператор сотовой связи однажды проанализировал звонки своих клиентов. Так были выделены “вожаки стаи” – люди, у которых больше всего связей с небольшой группой лиц, объединенных общими интересами. Компания выяснила: если такой вожак перейдет на новую мобильную услугу, предлагаемую оператором, члены “стаи” с очень большой долей вероятности поступят таким же образом. С другой стороны, если вожак откажется от этого оператора и перейдет к другому, остальные, скорее всего, последуют за ним[159].

“Ранее фокус организационного внимания был направлен на внутреннюю информацию, – рассказал мне Томас Дэвенпорт, занимающийся анализом больших данных. – Мы выжали из этого все, что могли, а потом были вынуждены обратиться к внешним источникам информации – Интернету, настроению заказчиков, рискам в цепи поставок и тому подобному”. Дэвенпорт, который ранее был директором Института стратегических изменений компании Accenture, на момент нашей беседы работал на факультете Гарвардской школы бизнеса. “Нам нужна экологическая модель, в которой рассматривается внешняя информационная среда – все, что происходит вокруг компании и может на нас сказаться”. Дэвенпорт полагает, что информация, которую организация получает из своих компьютерных систем, намного менее ценна, чем информация, поступающая из других источников совокупной информационной экосистемы после ее (информации) обработки специалистами. Поисковые системы могут выдать огромный пласт данных, в котором совершенно отсутствует контекст, необходимый для понимания этой информации, не говоря уже о глубоком ее постижении. Данные оказываются полезными только после соответствующей обработки[160]. В идеальном случае обработчик сосредоточивается на самом важном, отбрасывает все остальное, определяет контекст, в рамках которого эти данные имеют определенный смысл, и строит свое исследование таким образом, что ни у кого не возникает сомнений в том, почему данная информация столь значима. И только таким образом результат проделанной работы может привлечь внимание людей.

Лучшие обработчики информации не просто помещают данные в значимый контекст – они знают, какой нужно задать вопрос. Когда я разговаривал с Дэвенпортом, он работал над книгой, в которой менеджерам проектов по обработке больших данных рекомендовалось задавать примерно такие вопросы: Правильно ли мы формулируем проблему? Есть ли у нас все необходимые данные? Какие допущения стоят за алгоритмом, используемым для обработки данных? Отражает ли модель, в которую заложены эти предположения, действительную реальность?[161]

На конференции M. I. T., посвященной большим данным, один из выступающих отметил: финансовый кризис, начавшийся в 2008 году, был следствием сбоя в методе, поскольку по всему миру банкротились хеджевые фонды. Дилемма заключается в том, что математические модели, воплощенные в больших данных, представлены в упрощенной форме. Несмотря на выдаваемые точные цифры, математика, стоящая за ними, зиждется на алгоритмах и предположениях, способных обмануть слишком доверчивых.

На той же конференции Рэчел Шутт, старший статистик в Google Research, отметила, что наука о данных требует не только сугубо математических навыков: для эффективной работы нужны любознательные люди с широким кругозором, чьи инновационные начинания основаны не только на данных, но и на собственном опыте. В конце концов, даже самая точная человеческая интуиция для начала берет огромный пласт данных, прокручивает весь наш жизненный опыт – и только потом пропускает все это через фильтр мозга[162].

Данный текст является ознакомительным фрагментом.