1 00:00:00,000 --> 00:00:02,000 Время летит. 2 00:00:02,000 --> 00:00:04,000 Уже почти 20 лет прошло с тех пор как, 3 00:00:04,000 --> 00:00:08,000 желая пересмотреть то, как мы пользуемся информацией, 4 00:00:08,000 --> 00:00:11,000 то, как мы вместе работаем, я изобрёл Всемирную паутину. 5 00:00:11,000 --> 00:00:14,000 Теперь, 20 лет спустя, на TED 6 00:00:14,000 --> 00:00:18,000 я хочу попросить вас помочь в ещё одном пересмотре. 7 00:00:19,000 --> 00:00:23,000 Итак, возвратимся в 1989 год, когда 8 00:00:23,000 --> 00:00:26,000 я написал записку, в которой предложил глобальную гипертекстовую систему. 9 00:00:26,000 --> 00:00:29,000 Никто толком не обратил на нее внимания. 10 00:00:29,000 --> 00:00:33,000 Но спустя 18 месяцев — так возникают инновации, 11 00:00:33,000 --> 00:00:37,000 18 месяцев спустя мой босс сказал, что я могу развивать идею дальше 12 00:00:37,000 --> 00:00:39,000 как своего рода игрушечный проект — 13 00:00:39,000 --> 00:00:41,000 обкатать наш новый компьютер. 14 00:00:41,000 --> 00:00:44,000 И он дал мне время на написание кода. 15 00:00:44,000 --> 00:00:49,000 Я в общих чертах набросал своё видение HTML, 16 00:00:49,000 --> 00:00:52,000 гипертекстового протокола — HTTP, 17 00:00:52,000 --> 00:00:55,000 и идею об URL — всяких названиях, 18 00:00:55,000 --> 00:00:57,000 которые начинаются с HTTP. 19 00:00:57,000 --> 00:00:59,000 Я написал и выложил код. 20 00:00:59,000 --> 00:01:01,000 Почему я это сделал? 21 00:01:01,000 --> 00:01:03,000 В основном из-за неудовлетворённости. 22 00:01:03,000 --> 00:01:07,000 Я был разочарован — я разрабатывал программное обеспечение 23 00:01:07,000 --> 00:01:09,000 в этой большой, захватывающей лаборатории, 24 00:01:09,000 --> 00:01:11,000 куда приезжали люди со всех уголков мира, 25 00:01:11,000 --> 00:01:14,000 они привозили с собой всевозможные компьютеры 26 00:01:14,000 --> 00:01:17,000 со всевозможными форматами данных 27 00:01:17,000 --> 00:01:19,000 и всевозможными системами документирования. 28 00:01:19,000 --> 00:01:22,000 Так что если во всём этом многообразии 29 00:01:22,000 --> 00:01:24,000 я хотел понять, как что-то построить, 30 00:01:24,000 --> 00:01:26,000 из кусочков того и кусочков другого, 31 00:01:26,000 --> 00:01:30,000 все приходилось подключать к новой машине, 32 00:01:30,000 --> 00:01:32,000 разбираться, как запускать новую программу, 33 00:01:32,000 --> 00:01:37,000 я сталкивался с тем, что информация, которая мне нужна, сохранена в каком-то новом формате, 34 00:01:37,000 --> 00:01:39,000 не было никакой совместимости. 35 00:01:39,000 --> 00:01:41,000 Все это было очень досадно. 36 00:01:41,000 --> 00:01:43,000 Особенно досаждало то, что не использовался весь этот потенциал. 37 00:01:43,000 --> 00:01:46,000 Фактически, на всех этих дисках были документы. 38 00:01:46,000 --> 00:01:49,000 Если представить что они все — 39 00:01:49,000 --> 00:01:54,000 часть большой виртуальной системы документации, 40 00:01:54,000 --> 00:01:56,000 существующей, скажем, в интернете, 41 00:01:56,000 --> 00:01:58,000 жизнь была бы намного легче. 42 00:01:58,000 --> 00:02:02,000 И, когда у вас появилась идея наподобие этой, вы как бы срастаетесь с нею, 43 00:02:02,000 --> 00:02:04,000 и даже если никто не читает ваших записок — 44 00:02:04,000 --> 00:02:07,000 на самом деле он прочёл, уже после его смерти была найдена копия, 45 00:02:07,000 --> 00:02:10,000 он написал в углу карандашом: «неясно, но захватывающе». 46 00:02:10,000 --> 00:02:12,000 (Смех) 47 00:02:12,000 --> 00:02:16,000 Но в общем было трудно — действительно трудно объяснить, 48 00:02:16,000 --> 00:02:18,000 что из себя тогда представляла сеть. 49 00:02:18,000 --> 00:02:20,000 А теперь очень трудно объяснить, почему это было трудно объяснить тогда. 50 00:02:20,000 --> 00:02:23,000 Но потом, когда появился TED, сети не существовало, 51 00:02:23,000 --> 00:02:26,000 у таких понятий как щелкнуть были другие значения. 52 00:02:26,000 --> 00:02:28,000 Я могу показать кусок гипертекста, 53 00:02:28,000 --> 00:02:30,000 страницу со ссылками, 54 00:02:30,000 --> 00:02:34,000 и если щёлкнуть по ссылке — появится другая гипертекстовая страница. 55 00:02:34,000 --> 00:02:36,000 Не впечатляет. 56 00:02:36,000 --> 00:02:39,000 Вы знаете, это уже было, гипертекстовые документы на компакт-дисках. 57 00:02:39,000 --> 00:02:42,000 Что было сложно, так это представить, 58 00:02:42,000 --> 00:02:46,000 Представить, что любая ссылка могла вести 59 00:02:46,000 --> 00:02:48,000 к практически любому документу, который только можно представить. 60 00:02:49,000 --> 00:02:53,000 Перейти к этому пониманию было очень трудно. 61 00:02:53,000 --> 00:02:55,000 Но у некоторых получалось. 62 00:02:55,000 --> 00:02:58,000 Хотя это было сложно объяснить, существовало движение снизу, 63 00:02:59,000 --> 00:03:03,000 которое делало всё это крайне интересным. 64 00:03:03,000 --> 00:03:05,000 Самым захватывающим была 65 00:03:05,000 --> 00:03:07,000 не технология, не то, как она использовалась, 66 00:03:07,000 --> 00:03:09,000 а сообщество и атмосфера, в которой все эти люди 67 00:03:09,000 --> 00:03:11,000 оказывались и отправляли друг другу емейлы. 68 00:03:11,000 --> 00:03:13,000 Вот как это выглядело тогда. 69 00:03:13,000 --> 00:03:16,000 И знаете что? Забавно, но сейчас происходит то же самое. 70 00:03:16,000 --> 00:03:18,000 Тогда я попросил всех выложить свои документы — 71 00:03:18,000 --> 00:03:21,000 я сказал «не могли бы вы выложить свои документы в сеть?» 72 00:03:21,000 --> 00:03:24,000 И вы это сделали. 73 00:03:24,000 --> 00:03:25,000 Спасибо. 74 00:03:25,000 --> 00:03:27,000 Это был прорыв, не правда ли? 75 00:03:27,000 --> 00:03:29,000 Я имею в виду, это было довольно интересно 76 00:03:29,000 --> 00:03:31,000 мы увидели, что происходившее с сетью, 77 00:03:31,000 --> 00:03:33,000 абсолютно нас поражало. 78 00:03:33,000 --> 00:03:35,000 Вначале мы всё представляли существенно более примитивным, 79 00:03:35,000 --> 00:03:37,000 чем получалось, когда мы собирали сайт, 80 00:03:37,000 --> 00:03:39,000 с которым начинали работу. 81 00:03:39,000 --> 00:03:42,000 Теперь, я хочу, чтобы вы поместили свои данные в сеть. 82 00:03:42,000 --> 00:03:46,000 Оказывается, что до сих пор остаётся огромный неиспользованный потенциал. 83 00:03:46,000 --> 00:03:48,000 До сих пор остаётся огромное чувство досады, 84 00:03:48,000 --> 00:03:52,000 сохраняющееся потому, что данные в сети не представлены в виде данных. 85 00:03:52,000 --> 00:03:54,000 Что имеется в виду под «данными»? Чем отличаются документы от данных? 86 00:03:54,000 --> 00:03:57,000 Документы — это то, что мы читаем, так? 87 00:03:57,000 --> 00:04:00,000 Мы их читаем, переходим по ссылкам, и это всё. 88 00:04:00,000 --> 00:04:02,000 С данными с помощью компьютера можно делать всё, что угодно. 89 00:04:02,000 --> 00:04:08,000 Кто видел выступление Ганса Розлинга? 90 00:04:08,000 --> 00:04:12,000 Одно из выдающихся, да, многие его видели, — 91 00:04:12,000 --> 00:04:14,000 одно из выдающихся выступлений на TED. 92 00:04:14,000 --> 00:04:16,000 Ганс в своей презентации 93 00:04:16,000 --> 00:04:21,000 показал в различных цветах для разных стран 94 00:04:21,000 --> 00:04:24,000 уровень доходов по одной оси 95 00:04:24,000 --> 00:04:27,000 и уровень детской смертности, и он снял всё это анимированным во времени. 96 00:04:27,000 --> 00:04:31,000 Так вот, он взял эти данные и сделал презентацию, 97 00:04:31,000 --> 00:04:34,000 разрушившую многие мифы, 98 00:04:34,000 --> 00:04:38,000 касавшиеся экономик развивающихся стран. 99 00:04:38,000 --> 00:04:40,000 Он сделал слайд примерно так: 100 00:04:40,000 --> 00:04:42,000 Изначально у него были все данные, 101 00:04:42,000 --> 00:04:45,000 Хорошо, данные серые, квадратные и скучные 102 00:04:45,000 --> 00:04:47,000 мы так себе их и представляем, не правда ли? 103 00:04:47,000 --> 00:04:50,000 Потому что сами по себе данные мы использовать не можем, 104 00:04:50,000 --> 00:04:54,000 но на самом деле они во многом определяют то, что происходит в нашей жизни, 105 00:04:54,000 --> 00:04:57,000 потому что кто-то каким-то образом обрабатывает эти данные. 106 00:04:57,000 --> 00:04:59,000 В данном случае Ганс собрал данные, 107 00:04:59,000 --> 00:05:04,000 которые нашёл на сайте ООН и других. 108 00:05:04,000 --> 00:05:06,000 Он собрал их все вместе, 109 00:05:06,000 --> 00:05:09,000 объединил в нечто более интересное, нежели исходные фрагменты, 110 00:05:09,000 --> 00:05:14,000 и с помощью этой программы, 111 00:05:14,000 --> 00:05:16,000 разработанной, вроде, его сыном, 112 00:05:16,000 --> 00:05:19,000 сделал замечательную презентацию. 113 00:05:19,000 --> 00:05:21,000 Таким образом Ганс показал, 114 00:05:21,000 --> 00:05:25,000 что «смотрите, действительно важно иметь много данных». 115 00:05:25,000 --> 00:05:28,000 И я был рад увидеть, что вчера на вечеринке 116 00:05:28,000 --> 00:05:32,000 он повторял с большой убеждённостью, что «очень важно обладать данными». 117 00:05:32,000 --> 00:05:34,000 Я хочу, чтобы мы подумали о том, что произойдёт, 118 00:05:34,000 --> 00:05:38,000 если будут объединены не два фрагмента данных, не шесть, как сделал Ганс, 119 00:05:38,000 --> 00:05:43,000 но я хочу представить себе мир, в котором все разместили свои данные в сети, 120 00:05:43,000 --> 00:05:45,000 и практически всё, что только можно представить, находится в сети. 121 00:05:45,000 --> 00:05:47,000 Я называю это связанными данными. 122 00:05:47,000 --> 00:05:49,000 Связанные данные — это технология, она крайне проста. 123 00:05:49,000 --> 00:05:53,000 Если вы хотите поместить что-либо в сеть — есть три правила: 124 00:05:53,000 --> 00:05:56,000 во-первых, все эти HTTP имена, 125 00:05:56,000 --> 00:05:58,000 всё, что начинается с http, 126 00:05:58,000 --> 00:06:02,000 мы используем сейчас не просто для доступа к документам, 127 00:06:02,000 --> 00:06:04,000 а для доступа к тому, о чём говорят эти документы. 128 00:06:04,000 --> 00:06:06,000 Мы используем их для доступа к людям и местам, 129 00:06:06,000 --> 00:06:10,000 мы используем их для доступа к товарам и событиям. 130 00:06:10,000 --> 00:06:14,000 Концептуальные вещи самого разного рода теперь имеют названия, начинающиеся с HTTP. 131 00:06:14,000 --> 00:06:19,000 Второе правило: если я возьму одно из HTTP имён, найду его в сети, 132 00:06:19,000 --> 00:06:21,000 получу с него данные, 133 00:06:21,000 --> 00:06:23,000 используя протокол HTTP, 134 00:06:23,000 --> 00:06:26,000 я получаю в ответ некие данные в стандартном формате 135 00:06:26,000 --> 00:06:31,000 которые могут быть полезны тем, кто захочет узнать что-либо 136 00:06:31,000 --> 00:06:33,000 о чем-нибудь, об этом мероприятии — 137 00:06:33,000 --> 00:06:35,000 кто присутствует на мероприятии, что оно из себя представляет, про этого человека, 138 00:06:35,000 --> 00:06:37,000 где он родился и тому подобное. 139 00:06:37,000 --> 00:06:39,000 Так что второе правило — я получаю важную информацию. 140 00:06:39,000 --> 00:06:43,000 Третье правило заключается в том, что когда я получаю эту информацию, 141 00:06:43,000 --> 00:06:46,000 это не просто чей-то рост, вес и дата рождения. 142 00:06:46,000 --> 00:06:48,000 Полученная информация обладает взаимосвязями. 143 00:06:48,000 --> 00:06:50,000 Данные — это взаимосвязи. 144 00:06:50,000 --> 00:06:52,000 Интересно, данные — это взаимосвязи. 145 00:06:52,000 --> 00:06:56,000 Этот человек родился в Берлине, Берлин находится в Германии. 146 00:06:56,000 --> 00:06:59,000 И когда существуют взаимосвязи, когда они выражаются, 147 00:06:59,000 --> 00:07:02,000 тогда другой объект, с которым связан исходный, 148 00:07:02,000 --> 00:07:06,000 получает имя, начинающееся с HTTP. 149 00:07:06,000 --> 00:07:08,000 Итак, я могу взять и посмотреть этот объект. 150 00:07:08,000 --> 00:07:11,000 К примеру, я ищу человека — я могу найти город, где он родился, 151 00:07:11,000 --> 00:07:14,000 я могу найти регион, к которому он относится, 152 00:07:14,000 --> 00:07:17,000 его население и так далее. 153 00:07:17,000 --> 00:07:19,000 То есть я могу всё это просматривать. 154 00:07:19,000 --> 00:07:21,000 Вот собственно и всё. 155 00:07:21,000 --> 00:07:23,000 Это и есть связанные данные. 156 00:07:23,000 --> 00:07:26,000 Несколько лет назад я написал статью под названием «Связанные данные», 157 00:07:26,000 --> 00:07:30,000 и вскоре после этого всё завертелось. 158 00:07:30,000 --> 00:07:34,000 Идея связанных данных заключается в том, что мы получаем множество 159 00:07:34,000 --> 00:07:36,000 коробочек, как у Ганса, 160 00:07:36,000 --> 00:07:38,000 из которых появляется множество побегов. 161 00:07:38,000 --> 00:07:41,000 Это не просто масса других растений. 162 00:07:41,000 --> 00:07:43,000 Это не просто корень, поддерживающий растение, 163 00:07:43,000 --> 00:07:46,000 Но для каждого из этих растений, будь то 164 00:07:46,000 --> 00:07:49,000 презентация или анализ, кто-то пытается обнаружить закономерности в данных, 165 00:07:49,000 --> 00:07:52,000 они просматривают все данные 166 00:07:52,000 --> 00:07:54,000 и пытаются связать их вместе. 167 00:07:54,000 --> 00:07:56,000 По настоящему важное свойство данных заключается в том, 168 00:07:56,000 --> 00:07:58,000 что чем больше фрагментов вы связываете, тем важнее становится результат. 169 00:07:58,000 --> 00:08:00,000 Итак, связанные данные. 170 00:08:00,000 --> 00:08:02,000 Этот шаблон действий распространился дальше, 171 00:08:02,000 --> 00:08:06,000 и вскоре, Крис Спитцер из Свободного берлинского университета, 172 00:08:06,000 --> 00:08:08,000 один из первых людей, создавших интересные вещи, 173 00:08:08,000 --> 00:08:10,000 обратил внимание, что Википедия, 174 00:08:10,000 --> 00:08:13,000 знаете, Википедия — это онлайн энциклопедия 175 00:08:13,000 --> 00:08:15,000 содержащая в себе множество интересных документов. 176 00:08:15,000 --> 00:08:19,000 В этих документах есть небольшие информационные блоки, 177 00:08:19,000 --> 00:08:22,000 в которых представлены данные. 178 00:08:22,000 --> 00:08:26,000 Так вот, он написал программу, извлекавшую данные из Википедии 179 00:08:26,000 --> 00:08:28,000 и помещавшую их в шарик связанных данных, 180 00:08:28,000 --> 00:08:31,000 размещённый в сети, который он назвал dbpedia. 181 00:08:31,000 --> 00:08:35,000 На этом слайде dbpedia представлена синим шариком в центре. 182 00:08:35,000 --> 00:08:37,000 И если вы попробуете найти Берлин, 183 00:08:37,000 --> 00:08:39,000 вы обнаружите другие шарики данных, 184 00:08:39,000 --> 00:08:42,000 где также упоминается Берлин, и они связаны вместе. 185 00:08:42,000 --> 00:08:45,000 Таким образом, когда вы вытаскиваете из dbpedia данные о Берлине, 186 00:08:45,000 --> 00:08:47,000 вы вытаскиваете вместе с ними и всё эти вещи. 187 00:08:47,000 --> 00:08:50,000 И то, что всё это начинает расти — особенно захватывает. 188 00:08:50,000 --> 00:08:52,000 Это снова то самое движение снизу, так? 189 00:08:52,000 --> 00:08:55,000 Давайте немного подумаем о данных. 190 00:08:55,000 --> 00:08:58,000 В действительности данные существуют в самых разных формах. 191 00:08:58,000 --> 00:09:01,000 Подумайте о разнообразии сети, по-настоящему важно, 192 00:09:01,000 --> 00:09:04,000 что сеть позволяет размещать в себе любые типы данных. 193 00:09:04,000 --> 00:09:06,000 Так происходит с данными. Я мог бы говорить о всевозможных типах данных. 194 00:09:07,000 --> 00:09:11,000 Мы могли бы говорить о правительственных данных, корпоративных данных — они очень важны, 195 00:09:11,000 --> 00:09:14,000 есть научные данные, личные данные, 196 00:09:14,000 --> 00:09:16,000 метеорологические данные, данные о мероприятиях, 197 00:09:16,000 --> 00:09:20,000 о выступлениях, также есть новости и много чего другого. 198 00:09:20,000 --> 00:09:23,000 Я упомяну лишь небольшую их часть, 199 00:09:23,000 --> 00:09:25,000 чтобы вы смогли представить себе их разнообразие, 200 00:09:25,000 --> 00:09:29,000 могли увидеть, какой там потенциал . 201 00:09:29,000 --> 00:09:31,000 Давайте начнём с правительственных данных. 202 00:09:31,000 --> 00:09:33,000 Барак Обама в своей речи сказал, 203 00:09:33,000 --> 00:09:38,000 что данные американского правительства будут общедоступны в интернете 204 00:09:38,000 --> 00:09:40,000 в удобных форматах. 205 00:09:40,000 --> 00:09:42,000 И я надеюсь, что эти данные будут размещены в формате связанных данных. 206 00:09:42,000 --> 00:09:44,000 Это важно. Почему? 207 00:09:44,000 --> 00:09:47,000 Не только из-за прозрачности, да, прозрачность в действиях правительства важна, 208 00:09:47,000 --> 00:09:50,000 но сами данные – это данные из всех министерств. 209 00:09:50,000 --> 00:09:55,000 Подумайте, какое количество данных относится к американской жизни. 210 00:09:55,000 --> 00:09:57,000 Они по-настоящему полезны, у них есть ценность. 211 00:09:57,000 --> 00:09:59,000 Я могу воспользоваться ими в своей компании, 212 00:09:59,000 --> 00:10:01,000 если бы я был школьником, я мог бы воспользоваться ими, делая домашнюю работу. 213 00:10:01,000 --> 00:10:04,000 Мы говорим о том, что делаем мир лучше, 214 00:10:04,000 --> 00:10:06,000 делая эти данные доступными. 215 00:10:06,000 --> 00:10:10,000 На самом деле, если вы знаете о каких-либо данных 216 00:10:10,000 --> 00:10:12,000 в министерстве, то зачастую вы обнаруживаете, что 217 00:10:12,000 --> 00:10:15,000 эти люди поддаются сильному искушению оставить данные себе, 218 00:10:15,000 --> 00:10:18,000 Ганс называет это обниманием базы данных. 219 00:10:18,000 --> 00:10:20,000 Ты обнимаешь свою базу данных, ты не хочешь отпускать её, 220 00:10:20,000 --> 00:10:22,000 пока не сделаешь для неё красивый сайт. 221 00:10:22,000 --> 00:10:24,000 Я бы скорее предложил, что 222 00:10:24,000 --> 00:10:26,000 да, делайте красивый сайт, 223 00:10:26,000 --> 00:10:28,000 кто я такой, чтобы запрещать вам это делать? 224 00:10:28,000 --> 00:10:31,000 Делайте красивый сайт, но сначала 225 00:10:31,000 --> 00:10:34,000 дайте нам необработанные данные, 226 00:10:34,000 --> 00:10:36,000 они нам нужны. 227 00:10:36,000 --> 00:10:38,000 Нам нужны необработанные данные. 228 00:10:38,000 --> 00:10:41,000 Хорошо, теперь мы должны потребовать необработанные данные. 229 00:10:41,000 --> 00:10:43,000 Я попрошу вас потренироваться в этом, хорошо? 230 00:10:43,000 --> 00:10:44,000 Скажите «необработанные». 231 00:10:44,000 --> 00:10:45,000 Зал: Необработанные 232 00:10:45,000 --> 00:10:46,000 Тим: можете сказать «данные»? 233 00:10:46,000 --> 00:10:47,000 Зал: Данные 234 00:10:47,000 --> 00:10:48,000 Тим: Можете сказать «сейчас»? 235 00:10:48,000 --> 00:10:49,000 Зал: Сейчас! 236 00:10:49,000 --> 00:10:51,000 Тим: Идёт. Необработанные данные сейчас! 237 00:10:51,000 --> 00:10:53,000 Зал: Необработанные данные сейчас! 238 00:10:53,000 --> 00:10:57,000 Попрактикуйтесь. Это важно, потому что вы себе даже не представляете, сколько оправданий 239 00:10:57,000 --> 00:10:59,000 люди выдумывают, чтобы продолжать держаться за свои данные 240 00:10:59,000 --> 00:11:03,000 и не отдавать их вам, даже несмотря на то что вы как налогоплательщик за них заплатили. 241 00:11:03,000 --> 00:11:05,000 И так не только в Америке. Так во всём мире. 242 00:11:05,000 --> 00:11:08,000 И, конечно, не только в правительствах, но и в бизнесах. 243 00:11:08,000 --> 00:11:11,000 Ещё несколько мыслей о данных. 244 00:11:11,000 --> 00:11:16,000 Здесь на TED, мы хорошо осознаём 245 00:11:16,000 --> 00:11:21,000 огромные вызовы, стоящие в настоящее время перед человечеством — 246 00:11:21,000 --> 00:11:24,000 лечение раковых заболеваний, понимание механизмов болезни Альцгеймера, 247 00:11:24,000 --> 00:11:27,000 понимание экономики, чтобы сделать её чуть более стабильной, 248 00:11:27,000 --> 00:11:29,000 понимание того, как устроен мир. 249 00:11:29,000 --> 00:11:31,000 Люди, которые найдут ответы на эти вопросы, учёные, 250 00:11:31,000 --> 00:11:33,000 имеют наполовину сформировавшиеся идеи, 251 00:11:33,000 --> 00:11:36,000 пытаются сообщать их через сеть. 252 00:11:36,000 --> 00:11:39,000 Но значительная часть знаний человеческой расы в настоящий момент 253 00:11:39,000 --> 00:11:42,000 хранится в базах данных, зачастую на локальных компьютерах, 254 00:11:42,000 --> 00:11:45,000 они недоступны для совместного использования. 255 00:11:45,000 --> 00:11:48,000 На самом деле, я каснусь только одной области — 256 00:11:48,000 --> 00:11:50,000 если вы посмотрите, например, как разрабатываются лекарства 257 00:11:50,000 --> 00:11:53,000 для лечения болезни Альцгеймера, то там сейчас появляется масса связанных данных, 258 00:11:53,000 --> 00:11:55,000 потому что учёные из данной области понимают, 259 00:11:55,000 --> 00:11:58,000 что это прекрасное решение проблемы, 260 00:11:58,000 --> 00:12:02,000 их данные по геному находились в одной базе 261 00:12:02,000 --> 00:12:05,000 в одном здании, а данные по протеинам — в другой. 262 00:12:05,000 --> 00:12:08,000 Теперь они соединяют эти данные — связанные данные, 263 00:12:08,000 --> 00:12:11,000 и могут задать такой вопрос, который вы вряд ли зададите, 264 00:12:11,000 --> 00:12:13,000 я не задам. 265 00:12:13,000 --> 00:12:15,000 Какие протеины участвуют в сигнальной трансдукции, 266 00:12:15,000 --> 00:12:17,000 а также имеют отношение к пирамидальным нейронам? 267 00:12:17,000 --> 00:12:20,000 Итак, запомните эту фразу и поищите в Google. 268 00:12:20,000 --> 00:12:23,000 Само собой, страницы с ответом на этот вопрос в сети не существует, 269 00:12:23,000 --> 00:12:25,000 потому что никто не задавал этот вопрос раньше. 270 00:12:25,000 --> 00:12:27,000 Вы получите 223,000 результатов, 271 00:12:27,000 --> 00:12:29,000 но ни одного, которым вы сможете воспользоваться. 272 00:12:29,000 --> 00:12:32,000 Если адресовать тот же вопрос связанным данным, 273 00:12:32,000 --> 00:12:36,000 то получится 32 результата, каждый из которых — протеин с искомыми свойствами, 274 00:12:36,000 --> 00:12:38,000 и на каждый можно посмотреть. 275 00:12:38,000 --> 00:12:41,000 Для ученого умение формулировать эти вопросы, 276 00:12:41,000 --> 00:12:43,000 вопросы, связывающие различные дисциплины, 277 00:12:43,000 --> 00:12:46,000 это полнейшай трансформация. 278 00:12:46,000 --> 00:12:48,000 Это очень, очень важно. 279 00:12:48,000 --> 00:12:50,000 В настоящее время учёные загнаны в тупик, 280 00:12:50,000 --> 00:12:55,000 мощь данных, собранных другими учёными, недоступна, 281 00:12:55,000 --> 00:12:58,000 и чтобы справиться с этими проблемами, мы должны разблокировать данные. 282 00:12:58,000 --> 00:13:02,000 Если продолжу, вы подумаете, что все данные производятся большими институтами, 283 00:13:02,000 --> 00:13:05,000 и это не имеет никакого отношения к вам. 284 00:13:05,000 --> 00:13:07,000 Но это не так. 285 00:13:07,000 --> 00:13:09,000 На самом деле, данные составляют нашу жизнь. 286 00:13:09,000 --> 00:13:12,000 Вы авторизуетесь на сайте своей любимой социальной сети, 287 00:13:12,000 --> 00:13:14,000 вы говорите «Это мой друг». 288 00:13:14,000 --> 00:13:17,000 И вот, связь. Данные. 289 00:13:17,000 --> 00:13:20,000 Вы говорите «эта фотография такого-то человека». 290 00:13:20,000 --> 00:13:23,000 И вот, данные. Данные, данные, данные. 291 00:13:23,000 --> 00:13:25,000 Каждый раз, когда вы что-либо делаете в социальной сети, 292 00:13:25,000 --> 00:13:29,000 сайт собирает данные, использует и обрабатывает, 293 00:13:29,000 --> 00:13:33,000 чтобы сделать пребывание других людей на сайте более интересным. 294 00:13:33,000 --> 00:13:35,000 Но когда вы заходите на другой сайт со связанными данными, 295 00:13:35,000 --> 00:13:38,000 скажем, сайт о путешествиях, 296 00:13:38,000 --> 00:13:41,000 и говорите «я хочу послать эту фотографию всем членам такой-то группы», 297 00:13:41,000 --> 00:13:43,000 вы не можете этого сделать. 298 00:13:43,000 --> 00:13:45,000 В журнале Economist была статья на эту тему, многие люди писали об этом в своих блогах, 299 00:13:45,000 --> 00:13:46,000 огромное разочарование. 300 00:13:46,000 --> 00:13:48,000 Пробить брешь в закрытых хранилищах данных можно, создав совместимость 301 00:13:48,000 --> 00:13:50,000 между социальными сетями. 302 00:13:50,000 --> 00:13:52,000 Нам нужно это сделать с помощью связанных данных. 303 00:13:52,000 --> 00:13:55,000 Я скажу об ещё одном типе данных, возможно, наиболее впечатляющем. 304 00:13:55,000 --> 00:13:58,000 Прежде чем приехать сюда, я нашёл это место на OpenStreetMap. 305 00:13:58,000 --> 00:14:00,000 Это карта, но также и Вики. 306 00:14:00,000 --> 00:14:03,000 Приблизьте, и этот квадрат окажется театром, в котором мы сейчас находимся, 307 00:14:03,000 --> 00:14:05,000 The Terrace Theater. Но это имя не было обозначено на карте. 308 00:14:05,000 --> 00:14:07,000 Так что у меня была возможность перейти в режим редактирования, выбрать театр, 309 00:14:07,000 --> 00:14:12,000 добавить внизу его название и сохранить. 310 00:14:12,000 --> 00:14:15,000 И теперь, если вы зайдёте на OpenStreetMap.org, 311 00:14:15,000 --> 00:14:18,000 и найдёте это место, вы обнаружите, что у The Terrace Theater теперь есть название. 312 00:14:18,000 --> 00:14:20,000 Я сделал это. Я! 313 00:14:20,000 --> 00:14:22,000 Я проделал это с картой. Я только что это сделал! 314 00:14:22,000 --> 00:14:24,000 Я отметил имя на карте. И вы знаете что? 315 00:14:24,000 --> 00:14:27,000 Суть этой карты заключается в том, что каждый вносит свою лепту, 316 00:14:27,000 --> 00:14:30,000 а в итоге создаётся невероятный ресурс, 317 00:14:30,000 --> 00:14:33,000 потому что все остальные поступают так же. 318 00:14:33,000 --> 00:14:36,000 В этом и заключается смысл связанных данных. 319 00:14:36,000 --> 00:14:39,000 Смысл заключается в том, что каждый что-то делает, 320 00:14:39,000 --> 00:14:42,000 и всё это связывается. 321 00:14:42,000 --> 00:14:45,000 Так работают связанные данные. 322 00:14:45,000 --> 00:14:49,000 Вы вносите свой вклад, все остальные вносят свой. 323 00:14:49,000 --> 00:14:53,000 Возможно, у вас не найдется большого количества данных, чтобы разместить их там, 324 00:14:53,000 --> 00:14:56,000 но вы сможете их запросить. 325 00:14:56,000 --> 00:14:58,000 Мы практиковали это. 326 00:14:58,000 --> 00:15:02,000 Итак, связанные данные — это огромная тема. 327 00:15:02,000 --> 00:15:05,000 Я рассказал вам только малую часть. 328 00:15:05,000 --> 00:15:07,000 Данные присутствуют в каждом аспекте нашей жизни, 329 00:15:07,000 --> 00:15:10,000 каждом аспекте работы и отдыха. 330 00:15:10,000 --> 00:15:13,000 И дело не только в числе источников данных, 331 00:15:13,000 --> 00:15:16,000 но в связывании этих данных. 332 00:15:16,000 --> 00:15:19,000 Когда вы связываете данные, вы получаете могущество, 333 00:15:19,000 --> 00:15:22,000 которое недоступно лишь сети или документам. 334 00:15:22,000 --> 00:15:26,000 Вы получаете по-настоящему огромную силу. 335 00:15:26,000 --> 00:15:29,000 Итак, мы находимся на этапе, 336 00:15:29,000 --> 00:15:33,000 когда мы должны сделать это — люди, считающие, что это отличная идея. 337 00:15:33,000 --> 00:15:36,000 И все эти люди, а я думаю на TED много людей, которые что-то делают, 338 00:15:36,000 --> 00:15:38,000 даже несмотря на отсутствие возможности вернуть инвестиции быстро, 339 00:15:38,000 --> 00:15:41,000 потому что затея окупится только когда все остальные поступят так же, 340 00:15:41,000 --> 00:15:45,000 они сделают это потому, что они относятся к той категории людей, которые просто делают то, 341 00:15:45,000 --> 00:15:48,000 что принесёт результат, если все остальные сделают то же. 342 00:15:48,000 --> 00:15:50,000 Итак, это — связанные данные. 343 00:15:50,000 --> 00:15:52,000 Я хочу, чтобы вы это сделали. 344 00:15:52,000 --> 00:15:54,000 Я хочу, чтобы вы этого потребовали. 345 00:15:54,000 --> 00:15:56,000 И я думаю, эта идея достойна распространения. 346 00:15:56,000 --> 00:15:57,000 Спасибо. 347 00:15:57,000 --> 00:16:00,000 (Аплодисменты)