WEBVTT 00:00:00.000 --> 00:00:02.000 Thời gian trôi đi. 00:00:02.000 --> 00:00:04.000 Thật sự là gần 20 năm trước 00:00:04.000 --> 00:00:08.000 khi tôi muốn hệ thống lại cách chúng ta sử dụng thông tin, 00:00:08.000 --> 00:00:11.000 cách ta làm việc cùng nhau: tôi đã phát minh ra mạng toàn cầu. 00:00:11.000 --> 00:00:14.000 Bây giờ, đã là 20 năm, tại TED, 00:00:14.000 --> 00:00:18.000 tôi muốn nhờ sự giúp đỡ từ các bạn trong việc hệ thống mới. NOTE Paragraph 00:00:19.000 --> 00:00:23.000 Quay ngược về năm 1989, 00:00:23.000 --> 00:00:26.000 tôi đã viết một bản ghi nhớ về hệ thống siêu văn bản toàn cầu. 00:00:26.000 --> 00:00:29.000 Thật sự thì không có ai làm gì với nó hết. 00:00:29.000 --> 00:00:33.000 Nhưng 18 tháng sau - đây là cách sự đổi mới diễn ra - 00:00:33.000 --> 00:00:37.000 18 tháng sau, ông chủ nói tôi có thể thực hiện nó ở bên ngoài, 00:00:37.000 --> 00:00:39.000 như là một loại dự án cho vui, 00:00:39.000 --> 00:00:41.000 khởi động loại máy tính mới. 00:00:41.000 --> 00:00:44.000 Và do đó ông ấy đã cho tôi thời gian để mã hóa nó. 00:00:44.000 --> 00:00:49.000 Vì thế về cơ bản là tôi phác thảo HTML nên trông như thế nào: 00:00:49.000 --> 00:00:52.000 giao thức siêu văn bản, HTTP; 00:00:52.000 --> 00:00:55.000 ý tưởng về URLs, những cái tên cho những thứ khác 00:00:55.000 --> 00:00:57.000 mà bắt nguồn từ HTTP. 00:00:57.000 --> 00:00:59.000 Tôi viết bảng mã và để ra chỗ khác. NOTE Paragraph 00:00:59.000 --> 00:01:01.000 Tại sao tôi làm vậy? 00:01:01.000 --> 00:01:03.000 Cơ bản là thất bại. 00:01:03.000 --> 00:01:07.000 Tôi đã thất bại - tôi đã làm việc như một kĩ sư phần mềm 00:01:07.000 --> 00:01:09.000 trong phòng thí nghiệm khổng lồ và thú vị, 00:01:09.000 --> 00:01:11.000 rất nhiều người từ khắp nơi trên thế giới. 00:01:11.000 --> 00:01:14.000 Họ mang theo tất cả các loại máy tính khác nhau. 00:01:14.000 --> 00:01:17.000 Họ có tất cả các kiểu định dạng dữ liệu khác nhau, 00:01:17.000 --> 00:01:19.000 tất cả các kiểu, loại hệ thống tư liệu. 00:01:19.000 --> 00:01:22.000 Cho nên, trong sự đa dạng đó, 00:01:22.000 --> 00:01:24.000 nếu tôi muốn tìm ra cách xây dựng cái gì đó 00:01:24.000 --> 00:01:26.000 ngoài chỗ này một chút và chỗ kia một chút 00:01:26.000 --> 00:01:30.000 mọi thứ tôi nghiên cứu, tôi phải kết nối với vài thiết bị mới, 00:01:30.000 --> 00:01:32.000 tôi phải học vận hành chương trình mới, 00:01:32.000 --> 00:01:37.000 tôi sẽ tìm ra thông tin tôi cần trong định dang dữ liệu mới. 00:01:37.000 --> 00:01:39.000 Và tất cả những thứ đó không tương thích. 00:01:39.000 --> 00:01:41.000 Đó chỉ là thất bại. 00:01:41.000 --> 00:01:43.000 Thất bại là những tiềm tiềm năng chưa mở ra. NOTE Paragraph 00:01:43.000 --> 00:01:46.000 Thực tế, trong tất cả những cái đĩa này đều có những tư liệu. 00:01:46.000 --> 00:01:49.000 Nên nếu bạn chỉ tưởng tượng ra tất cả chúng 00:01:49.000 --> 00:01:54.000 trở thành một cái gì đó lớn lao, hệ thống tư liệu ảo trên trời, 00:01:54.000 --> 00:01:56.000 ví như là trên Internet, 00:01:56.000 --> 00:01:58.000 thế thì cuộc sống sẽ dễ dàng hơn nhiều. 00:01:58.000 --> 00:02:02.000 Một khi bạn đã có ý tưởng thì nó như kiểu trêu ngươi bạn 00:02:02.000 --> 00:02:04.000 ngay cả nếu người ta không đọc ghi chép của bạn -- 00:02:04.000 --> 00:02:07.000 -- thật ra là, sau khi chết bản thảo của ông được tìm thấy. 00:02:07.000 --> 00:02:10.000 Ông ghi bằng bút chì ở trong góc, "không rõ ràng, nhưng thú vị" NOTE Paragraph 00:02:10.000 --> 00:02:12.000 (Tiếng cười) NOTE Paragraph 00:02:12.000 --> 00:02:16.000 Nhưng nói chung là khó - nó thật sự khó để giải thích 00:02:16.000 --> 00:02:18.000 mạng web trông như thế nào. 00:02:18.000 --> 00:02:20.000 Khó để giải thích rằng hồi đó đã rất khó. 00:02:20.000 --> 00:02:23.000 Nhưng sau đó - OK, khi TED bắt đầu, không hề có mạng 00:02:23.000 --> 00:02:26.000 vậy nên những thứ như "click" không hề có nghĩa tương tự. 00:02:26.000 --> 00:02:28.000 Tôi có thể cho xem một phần siêu văn bản, 00:02:28.000 --> 00:02:30.000 một trang có đường liên kết, 00:02:30.000 --> 00:02:34.000 và khi ta bấm vào đường truyền và bing - một trang siêu văn bản khác mở ra. 00:02:34.000 --> 00:02:36.000 Không ấn tượng gì. 00:02:36.000 --> 00:02:39.000 Bạn biết đó, ta có các thứ trong siêu văn bản trong CD_ROMs. 00:02:39.000 --> 00:02:42.000 Cái khó là khiến họ tưởng tượng: 00:02:42.000 --> 00:02:43.000 vậy, hãy tưởng tượng đường truyền có thể đi đến 00:02:46.000 --> 00:02:48.000 tới hầu hết các tư liệu có thể tưởng tượng. 00:02:49.000 --> 00:02:53.000 Đó là bước nhảy mà rất khó để thực hiện. 00:02:53.000 --> 00:02:55.000 Ờ thì, một số người đã làm. 00:02:55.000 --> 00:02:58.000 Vậy nên, rất khó để giải thích, nhưng có một chuyển biến cơ sở. 00:02:59.000 --> 00:03:03.000 Và đó là cái làm nó trở nên hay nhất. 00:03:03.000 --> 00:03:05.000 Đó là điều thú vị nhất, 00:03:05.000 --> 00:03:07.000 không là kỹ thuật, không là thứ người ta đã làm 00:03:07.000 --> 00:03:09.000 mà là xã hội, tinh thần của mọi người 00:03:09.000 --> 00:03:11.000 làm cùng nhau, gửi thư điện tử. 00:03:11.000 --> 00:03:13.000 Đó là cái giống như vậy. NOTE Paragraph 00:03:13.000 --> 00:03:16.000 Bạn biết không? Nó buồn cười, nhưng giờ thì nó lại giống vậy. 00:03:16.000 --> 00:03:18.000 Tôi yêu cầu, nhiều hay ít, hãy đưa tư liệu 00:03:18.000 --> 00:03:21.000 Tôi nói, "Bạn có thể đưa các tư liệu lên trang web này không?" 00:03:21.000 --> 00:03:24.000 Và họ đã làm. 00:03:24.000 --> 00:03:25.000 Cảm ơn. 00:03:25.000 --> 00:03:27.000 Đó là một cú huých, đúng không? 00:03:27.000 --> 00:03:29.000 Ý tôi là, điều đó khá là thú vị 00:03:29.000 --> 00:03:31.000 vì ta khám phá các thứ trên trang web 00:03:31.000 --> 00:03:33.000 thật sự quá tuyệt vời. 00:03:33.000 --> 00:03:35.000 Hơn rất nhiều so với tưởng tượng ban đầu 00:03:35.000 --> 00:03:37.000 khi đặt địa chỉ web nhỏ ban đầu với nhau 00:03:37.000 --> 00:03:39.000 mà chúng ta bắt đầu với. 00:03:39.000 --> 00:03:42.000 Bây giờ, tôi muốn bạn đưa dữ liệu của bạn lên trang mạng. 00:03:42.000 --> 00:03:46.000 Hóa ra rằng vẫn có những tiềm năng khổng lồ chưa được mở khóa. 00:03:46.000 --> 00:03:48.000 Vẫn còn là sự thất bại lớn 00:03:48.000 --> 00:03:52.000 bởi vì ta không có dữ liệu trên trang mạng như là dữ liệu. NOTE Paragraph 00:03:52.000 --> 00:03:54.000 Ý là sao, "dữ liệu"? Khác gì nhau - tư liệu, dữ liệu? 00:03:54.000 --> 00:03:57.000 Tư liệu bạn đọc, đúng không? 00:03:57.000 --> 00:04:00.000 Nhiều hay ít, bạn đọc nó, bạn có thể theo đường dẫn, thế thôi. 00:04:00.000 --> 00:04:02.000 Dữ liệu-bạn có thể làm tất cả với máy tính 00:04:02.000 --> 00:04:08.000 Ai đã ở đây hoặc cách khác xem bài nói của Hans Rosling? 00:04:08.000 --> 00:04:12.000 Một trong những người tuyệt với - vâng nhiều người đã xem nó - 00:04:12.000 --> 00:04:14.000 một trong những bài nói tuyệt với của TED. 00:04:14.000 --> 00:04:16.000 Hans đưa ra bài thuyết trình 00:04:16.000 --> 00:04:21.000 trong đó ông đã chỉ ra, cho những đất nước khác nhau, trong màu sắc khác nhau - 00:04:21.000 --> 00:04:24.000 ông cho thấy mức độ thu nhập trên một trục 00:04:24.000 --> 00:04:27.000 ông cho thấy số tử vong trẻ sơ sinh, và biến đổi theo thời gian 00:04:27.000 --> 00:04:31.000 Do đó, ông đã lấy dữ liệu này và làm bài thuyết trình 00:04:31.000 --> 00:04:34.000 mà đã phá hủy rất nhiều chuyện hoang đường 00:04:34.000 --> 00:04:38.000 về kinh tế trong thế giới đang phát triển. NOTE Paragraph 00:04:38.000 --> 00:04:40.000 Ông thiết lập một trình chiếu nhỏ như vậy. 00:04:40.000 --> 00:04:42.000 Nó có chứa ngầm tất cả các dữ liệu 00:04:42.000 --> 00:04:45.000 Dữ liệu là màu nâu, hình hộp và nhàm chán 00:04:45.000 --> 00:04:47.000 và đó là thứ ta nghĩ về nó, đúng không? 00:04:47.000 --> 00:04:50.000 Vì dữ liệu không thể tự dùng một cách tự nhiên 00:04:50.000 --> 00:04:54.000 nhưng thực tế, dữ liệu chứa một lượng lớn những gì xảy ra trong cuộc sống chúng ta 00:04:54.000 --> 00:04:57.000 và nó như thế là vì ai đó lấy dữ liệu và làm cái gì đó với nó. 00:04:57.000 --> 00:04:59.000 Trường hợp này, Hans đặt dữ liệu với nhau 00:04:59.000 --> 00:05:04.000 ông đã tìm từ tất cả trang mạng và các thứ của nước Mỹ. 00:05:04.000 --> 00:05:06.000 Ông đã đặt chúng với nhau, 00:05:06.000 --> 00:05:09.000 kết hợp nó với vài thứ thú vị hơn bản gốc 00:05:09.000 --> 00:05:14.000 và sau đó ông đưa nó vào phần mềm này, 00:05:14.000 --> 00:05:16.000 mà tôi nghĩ con trai ông đã phát triển nó, 00:05:16.000 --> 00:05:19.000 và tạo ra bài thuyết trình tuyệt vời này. 00:05:19.000 --> 00:05:21.000 Và Hans đã tạo một điểm nhấn 00:05:21.000 --> 00:05:25.000 khi nói, "Nhìn xem, có nhiều dữ liệu thật sự rất quan trọng". 00:05:25.000 --> 00:05:28.000 Và tôi hạnh phúc khi thấy điều đó tại bữa tiệc tối qua 00:05:28.000 --> 00:05:32.000 khi ông ấy vẫn nói, rất mạnh mẽ, "Có nhiều dữ liệu thật sự rất quan trọng". NOTE Paragraph 00:05:32.000 --> 00:05:34.000 Vậy tôi muốn bây giờ chúng ta hãy nghĩ 00:05:34.000 --> 00:05:38.000 không chỉ hai mảnh dữ liệu được kết nối, hay sáu giống như ông ấy đã làm, 00:05:38.000 --> 00:05:43.000 nhưng tôi muốn nghĩ về một thế giới mà ở đó mọi người đều đưa dữ liệu lên mạng 00:05:43.000 --> 00:05:45.000 mọi thứ tưởng tượng ban đầu đều trên mạng 00:05:45.000 --> 00:05:47.000 và sau đó gọi là dữ liệu liên kết. 00:05:47.000 --> 00:05:49.000 Kỹ thuật là dữ liệu liên kết, rất đơn giản. 00:05:49.000 --> 00:05:53.000 Nếu bạn muốn đưa cái gì lên mạng thì có ba quy tắc: 00:05:53.000 --> 00:05:56.000 đầu tiên là tên HTTP - 00:05:56.000 --> 00:05:58.000 những thứ này bắt đầu với "http:" - 00:05:58.000 --> 00:06:02.000 bây giờ chúng tôi dùng chúng không chỉ cho tư liệu, 00:06:02.000 --> 00:06:04.000 chúng tôi dùng cho các thứ tư liệu đề cập. 00:06:04.000 --> 00:06:06.000 Chúng tôi dùng cho con người, địa điểm, 00:06:06.000 --> 00:06:10.000 chúng tôi dùng nó cho sản phẩm của bạn, dùng cho các sự kiện. 00:06:10.000 --> 00:06:14.000 Tất cả loại khái niệm, họ có tên bắt đầu với HTTP. NOTE Paragraph 00:06:14.000 --> 00:06:19.000 Quy tắc thứ hai, nếu bạn lấy một trong số các tên HTTP và bạn tra cứu nó 00:06:19.000 --> 00:06:21.000 và tôi làm về mạng với nó và lấy dữ liệu 00:06:21.000 --> 00:06:23.000 sử dụng giao thức HTTP từ mạng, 00:06:23.000 --> 00:06:26.000 tôi sẽ lấy về một vài dữ liệu với định dạng chuẩn 00:06:26.000 --> 00:06:31.000 là loại dữ liệu có ích mà vài người muốn biết 00:06:31.000 --> 00:06:33.000 về điều đó, về sự kiện đó. 00:06:33.000 --> 00:06:35.000 Ai ở sự kiện? Bất cứ gì về người đó, 00:06:35.000 --> 00:06:37.000 họ sinh ra ở đâu, những thứ như thế. 00:06:37.000 --> 00:06:39.000 Quy tắc hai tôi lấy về thông tin quan trọng NOTE Paragraph 00:06:39.000 --> 00:06:43.000 Quy tắc ba là khi tôi lấy lại thông tin đó 00:06:43.000 --> 00:06:46.000 nó không chỉ là chiều cao và cân nặng và nơi sinh của ai đó, 00:06:46.000 --> 00:06:48.000 nó có cả những mối quan hệ. 00:06:48.000 --> 00:06:50.000 Dữ liệu là những nối quan hệ. 00:06:50.000 --> 00:06:52.000 Thú vị là, dữ liệu là các mối quan hệ. 00:06:52.000 --> 00:06:56.000 Người này sinh ở Berlin; Berlin ở Đức. 00:06:56.000 --> 00:06:59.000 Khi có các mối quan hệ, bất cứ khi nào diễn tả một mối quan hệ 00:06:59.000 --> 00:07:02.000 khi đó những thứ khác có liên quan 00:07:02.000 --> 00:07:06.000 được đưa ra là một trong các tên bắt đầu với HTTP 00:07:06.000 --> 00:07:08.000 Do đó, tôi có thể tiếp tục tra cứu cái đó. 00:07:08.000 --> 00:07:11.000 Vậy tôi tìm một người - sau đó tôi có thể tìm thành phố sinh ra 00:07:11.000 --> 00:07:14.000 sau đó tôi có thể tìm nó thuộc vùng nào, trong thị trấn nào, 00:07:14.000 --> 00:07:17.000 dân số của nó, vân vân. 00:07:17.000 --> 00:07:19.000 Do đó tôi có thể duyệt những thứ đó. NOTE Paragraph 00:07:19.000 --> 00:07:21.000 Vậy nó thật sự là như thế. 00:07:21.000 --> 00:07:23.000 Đó là dữ liệu kết nối. 00:07:23.000 --> 00:07:26.000 Một vài năm trước tôi viết một bài báo tựa đề "Dữ liệu liên kết" 00:07:26.000 --> 00:07:30.000 và sớm sau đó, vài thứ bắt đầu xuất hiện. 00:07:30.000 --> 00:07:34.000 Ý tưởng về dữ liệu liên kết mà chúng tôi có rất rất nhiều 00:07:34.000 --> 00:07:36.000 về những cái hộp của Hans 00:07:36.000 --> 00:07:38.000 và có rất rất nhiều những thứ được nảy mầm. 00:07:38.000 --> 00:07:41.000 Nó không chỉ là toàn bộ nhiều cái cây khác. 00:07:41.000 --> 00:07:43.000 Nó không chỉ là rễ nuôi lớn cái cây, 00:07:43.000 --> 00:07:46.000 nhưng với mỗi cái cây, bất kể là gì - 00:07:46.000 --> 00:07:49.000 bài thuyết trình, phân tích, ai đó tìm các mẫu trong dữ liệu - 00:07:49.000 --> 00:07:52.000 họ sẽ thấy tất cả các dữ liệu 00:07:52.000 --> 00:07:54.000 và họ sẽ thấy nó liên kết với nhau, 00:07:54.000 --> 00:07:56.000 và điều thật sự quan trọng về dữ liệu 00:07:56.000 --> 00:07:58.000 là càng kết nối nhiều thứ, nó càng mạnh hơn. NOTE Paragraph 00:07:58.000 --> 00:08:00.000 Vậy, dữ liệu liên kết. 00:08:00.000 --> 00:08:02.000 Sự lan truyền đã vươn ra ngoài. 00:08:02.000 --> 00:08:06.000 Và, cũng khá sớm Chris Bizer tại trường Đại học Freie ở Berlin 00:08:06.000 --> 00:08:08.000 trong số người đầu tiên đưa lên thứ thú vị, 00:08:08.000 --> 00:08:10.000 ông để ý rằng Wikipedia - 00:08:10.000 --> 00:08:13.000 các bạn biết Wikipedia, bách khoa trực tuyến duy nhất 00:08:13.000 --> 00:08:15.000 với rất rất nhiều tư liệu thú vị trong đó. 00:08:17.000 --> 00:08:19.000 Trong tư liệu, có hình vuông, hình hộp nhỏ. 00:08:19.000 --> 00:08:22.000 Và trong hầu hết các hộp thông tin, là dữ liệu. 00:08:22.000 --> 00:08:26.000 Nên ông ấy viết chương trình lấy dữ liệu, trích nó từ Wikipedia, 00:08:26.000 --> 00:08:28.000 và bỏ vào một phần nhỏ dữ liệu liên kết 00:08:28.000 --> 00:08:31.000 trên trang mạng, mà ông gọi là dbpedia. 00:08:31.000 --> 00:08:35.000 Dbpedia thể hiện bằng khung màu xanh ở giữa trình chiếu này 00:08:35.000 --> 00:08:37.000 và nếu bạn thật sự tìm kiếm về Berlin, 00:08:37.000 --> 00:08:39.000 bạn sẽ thấy rằng có các vùng thông tin khác 00:08:39.000 --> 00:08:42.000 mà cũng có những thứ về Berlin, và chúng được liên kết với nhau. 00:08:42.000 --> 00:08:45.000 Vậy nếu bạn kéo dữ liệu về Berlin từ Dbpedia, 00:08:45.000 --> 00:08:47.000 bạn kết thúc bằng việc kéo cả các thứ khác 00:08:47.000 --> 00:08:50.000 Và thứ đang tồn tại bắt đầu phát triển. 00:08:50.000 --> 00:08:52.000 Đó cũng lại là cấp cơ sở. NOTE Paragraph 00:08:52.000 --> 00:08:55.000 Hãy nghĩ một chút về dữ liệu. 00:08:55.000 --> 00:08:58.000 Dữ liệu đến từ thực tế dưới rất rất nhiều hình thức khác nhau. 00:08:58.000 --> 00:09:01.000 Nghĩ về sự đa dạng của trang mạng. Nó thật sự rất quan trọng 00:09:01.000 --> 00:09:04.000 rằng trang mạng cho phép bạn đưa tất cả loại dữ liệu lên đó. 00:09:04.000 --> 00:09:06.000 Nó với dữ liệu, Tôi có thể nói về mọi loại. 00:09:07.000 --> 00:09:11.000 Ta có thể nói về dữ liệu chính phủ, dữ liệu doanh nghiệp rất quan trọng, 00:09:11.000 --> 00:09:14.000 có dữ liệu khoa học, có dữ liệu cá nhân, 00:09:14.000 --> 00:09:16.000 có dữ liệu thời tiết, dữ liệu về sự kiện, 00:09:16.000 --> 00:09:20.000 có dữ liệu về các bài nói, và có tin tức và có tất cả các thứ. 00:09:20.000 --> 00:09:23.000 Tôi chỉ định đề cập một vài trong số đó 00:09:23.000 --> 00:09:25.000 để bạn hiểu được sự đa dạng của nó, 00:09:25.000 --> 00:09:29.000 cũng để bạn thấy tiềm năng chưa mở khóa nhiều như thế nào. NOTE Paragraph 00:09:29.000 --> 00:09:31.000 Bắt đầu với dữ liệu chính phủ. 00:09:31.000 --> 00:09:33.000 Barack Obama đã nói trong bài diễn văn, 00:09:33.000 --> 00:09:38.000 rằng ông ấy - dữ liệu về chính phủ Mỹ sẽ có trên mạng 00:09:38.000 --> 00:09:40.000 dưới định dạng có thể tiếp cận. 00:09:40.000 --> 00:09:42.000 Hy vọng họ đưa nó lên như dữ liệu liên kết 00:09:42.000 --> 00:09:44.000 Điều đó là quan trọng. Tại sao quan trọng? 00:09:44.000 --> 00:09:47.000 Không chỉ vì minh bạch, minh bạch trong chính phủ là quan trọng 00:09:47.000 --> 00:09:50.000 nhưng dữ liệu này - đây là dữ liêu từ tất cả cơ quan chính phủ 00:09:50.000 --> 00:09:55.000 Nghĩ xem dữ liệu đó có giá bao nhiêu, nghĩ về cuộc sống ở Mỹ như thế nào. 00:09:55.000 --> 00:09:57.000 Nó thật ra rất hũu dụng. Nó có giá trị. 00:09:57.000 --> 00:09:59.000 Tôi có thể dùng nó trong công ty tôi. 00:09:59.000 --> 00:10:01.000 Tôi có thể dùng nó như đứa trẻ làm bài tập 00:10:01.000 --> 00:10:04.000 Vậy ta đang nói về việc tạo ra địa điểm, cho thế giới tốt hơn 00:10:04.000 --> 00:10:06.000 bằng cách tạo ra dữ liệu có sẵn. NOTE Paragraph 00:10:06.000 --> 00:10:10.000 Thực tế nếu bạn có trách nhiệm - nếu bạn biết về vài dữ liệu 00:10:10.000 --> 00:10:12.000 trong cơ quan chính phủ, bạn thường thấy 00:10:12.000 --> 00:10:15.000 những người đó, họ rất muốn giữ kín nó - 00:10:15.000 --> 00:10:18.000 Hans gọi đó là ôm chặt cơ sở dữ liệu. 00:10:18.000 --> 00:10:20.000 Bạn ôm cơ sở dữ liệu, bạn không muốn bỏ ra 00:10:20.000 --> 00:10:22.000 tới khi bạn tạo một trang mạng đẹp cho nó. 00:10:22.000 --> 00:10:24.000 Ừ thì, tôi muốn đề nghị thay vào đó - 00:10:24.000 --> 00:10:26.000 vâng, làm một trang mạng đẹp, 00:10:26.000 --> 00:10:28.000 tôi là ai mà nói là đừng làm một trang đẹp? 00:10:28.000 --> 00:10:31.000 Hãy làm một trang mạng đẹp, nhưng đầu tiên 00:10:31.000 --> 00:10:34.000 hãy cho chúng tôi dữ liệu không giả tạo, 00:10:34.000 --> 00:10:36.000 chúng tôi muốn dữ liệu. 00:10:36.000 --> 00:10:38.000 Chúng tôi muốn dữ liệu không giả tạo. 00:10:38.000 --> 00:10:41.000 Bây giờ, chúng ta phải yêu cầu dữ liệu thô. 00:10:41.000 --> 00:10:43.000 Và tôi sẽ yêu cầu bạn thực hành, được chứ? 00:10:43.000 --> 00:10:44.000 Hãy nói từ "thô"? NOTE Paragraph 00:10:44.000 --> 00:10:45.000 Khán giả: Thô. NOTE Paragraph 00:10:45.000 --> 00:10:46.000 Hãy nói "dữ liệu" NOTE Paragraph 00:10:46.000 --> 00:10:47.000 Khán giả: Dữ liệu. NOTE Paragraph 00:10:47.000 --> 00:10:48.000 L: Hãy nói "bây giờ" NOTE Paragraph 00:10:48.000 --> 00:10:49.000 Khán giả: Bây giờ! NOTE Paragraph 00:10:49.000 --> 00:10:51.000 Được rồi, "dữ liệu thô ngay bây giờ"! NOTE Paragraph 00:10:51.000 --> 00:10:53.000 Khán giả: Dữ liệu thô ngay bây giờ! NOTE Paragraph 00:10:53.000 --> 00:10:57.000 Thực hiện như vậy. Điều đó là quan trọng vì bạn không biết có bao nhiêu lý do đâu. 00:10:57.000 --> 00:10:59.000 Mọi người tìm cách để giữ dữ liệu của họ 00:10:59.000 --> 00:11:03.000 và không đưa nó cho bạn, cho dù bạn trả tiền cho nó như một người đóng thuế. 00:11:03.000 --> 00:11:05.000 Và đó không chỉ ở Mỹ. Mà toàn thế giới. 00:11:05.000 --> 00:11:08.000 Và dĩ nhiên không chỉ chính phủ- mà cũng có cả các doanh nghiệp. NOTE Paragraph 00:11:08.000 --> 00:11:11.000 Vì vậy tôi chỉ đề cập một vài suy nghĩ về dữ liệu. 00:11:11.000 --> 00:11:16.000 Bầy giờ chúng ta ở tại TED, và ta lúc nào cũng tỉnh táo 00:11:16.000 --> 00:11:21.000 với những thử thách khổng lồ trong xã hội loài nguời ngày nay 00:11:21.000 --> 00:11:24.000 chữa trị ung thư, hiểu bộ não cho bệnh Alzheimer, 00:11:24.000 --> 00:11:27.000 Hiểu nền kinh tế để làm cho nó ổn định hơn, 00:11:27.000 --> 00:11:29.000 Hiểu cách thế giới hoạt động. 00:11:29.000 --> 00:11:31.000 Giải quyết việc này là nhà khoa học 00:11:31.000 --> 00:11:33.000 Họ có nửa ý tưởng trong đầu, 00:11:33.000 --> 00:11:36.000 Họ cố giao tiếp những thứ đó qua mạng. 00:11:36.000 --> 00:11:39.000 Nhưng bây giờ có rất nhiều loại tri thức về loài người 00:11:39.000 --> 00:11:42.000 trong các cơ sở dữ liệu, thường nằm trong máy tính, 00:11:42.000 --> 00:11:45.000 và thật ra, là không được chia sẻ. NOTE Paragraph 00:11:45.000 --> 00:11:48.000 Thực tế, tôi sẽ chỉ đi vào một chuyện, 00:11:48.000 --> 00:11:50.000 ví dụ, bệnh Alzhelmer. 00:11:50.000 --> 00:11:53.000 Sự phát minh ra thuốc - toàn bộ dữ liệu liên kết sẽ xuất hiện 00:11:53.000 --> 00:11:55.000 vì nhà khoa học lĩnh vực này nhận ra rằng 00:11:55.000 --> 00:11:58.000 đây là cách tuyệt vời để ra khỏi những kho chứa, 00:11:58.000 --> 00:12:02.000 vì họ có dữ liệu gen trong một cơ sở dữ liệu 00:12:02.000 --> 00:12:05.000 trong một tòa nhà, và họ có dữ liệu về chất hữu cơ ở chỗ khác. 00:12:05.000 --> 00:12:08.000 Ngày nay, họ đang gắn bó với - dữ liệu liên kết - 00:12:08.000 --> 00:12:11.000 và bây giờ họ có thể hỏi những câu, mà bạn có thể sẽ không hỏi, 00:12:11.000 --> 00:12:13.000 tôi không hỏi - họ hỏi. 00:12:13.000 --> 00:12:15.000 Loại protein nào tham gia vào việc truyền tín hiệu 00:12:15.000 --> 00:12:17.000 và cũng liên quan với tế bào thần kinh hình tháp? 00:12:17.000 --> 00:12:20.000 Bạn tiếp nhận thật nhiều và bạn đưa nó lên Google. 00:12:20.000 --> 00:12:23.000 Dĩ nhiên, không có trang mạng nào trả lời câu hỏi đó 00:12:23.000 --> 00:12:25.000 vì không có ai đã trả lời nó trước đây. 00:12:25.000 --> 00:12:27.000 Bạn có 223,000 kết quả - 00:12:27.000 --> 00:12:29.000 không kết quả nào dùng được 00:12:29.000 --> 00:12:32.000 Bạn hỏi dữ liệu liên kết - đang được đặt cùng nhau 00:12:32.000 --> 00:12:36.000 32 kết quả, mỗi một đó là một chất đạm có các thuộc tính 00:12:36.000 --> 00:12:38.000 và bạn có thể nhìn thấy nó. 00:12:38.000 --> 00:12:41.000 Sức mạnh để hỏi những câu hỏi đó như một nhà khoa học - 00:12:41.000 --> 00:12:43.000 câu hỏi vượt qua các quy tắc khác nhau 00:12:43.000 --> 00:12:46.000 đó thật sự là sự thay đổi hoàn toàn. 00:12:46.000 --> 00:12:48.000 Điều đó rất rất quan trọng. 00:12:48.000 --> 00:12:50.000 Lúc này, nhà khoa học hoàn toàn lúng túng - 00:12:50.000 --> 00:12:55.000 sức mạnh của dữ liệu mà các nhà khoa học khác thu thập đc đã bị khóa 00:12:55.000 --> 00:12:58.000 và ta cần mở khóa nó để giải quyết những vấn đề khổng lồ. NOTE Paragraph 00:12:58.000 --> 00:13:02.000 Bây giờ, nếu tiếp tục thế này, bạn sẽ nghĩ tất cả dữ liệu đến từ tổ chức khổng lồ 00:13:02.000 --> 00:13:05.000 và không có gì liên quan tới bạn. 00:13:05.000 --> 00:13:07.000 Nhưng điều đó không đúng. 00:13:07.000 --> 00:13:09.000 Thực tế, dữ liệu là về cuộc sống. 00:13:09.000 --> 00:13:12.000 Bạn chỉ - đăng nhập vào địa chỉ mạng xã hội, 00:13:12.000 --> 00:13:14.000 cái bạn thích, nói, "Đây là bạn tôi" 00:13:14.000 --> 00:13:17.000 Bing! Mối quan hệ. Dữ liệu. 00:13:17.000 --> 00:13:20.000 Bạn nói, "Tấm ảnh này, nó mô tả người này". 00:13:20.000 --> 00:13:23.000 Bìng! Đó là dữ liệu. Dữ liệu, dữ liệu, dữ liệu. 00:13:23.000 --> 00:13:25.000 Mỗi lần bạn làm gì đó với mạng xã hội, 00:13:25.000 --> 00:13:29.000 trang mạng xã hội lấy dữ liệu và dùng nó - tái tạo nó 00:13:29.000 --> 00:13:33.000 và dùng nó để làm cho cuộc sống con người thú vị hơn. 00:13:33.000 --> 00:13:35.000 Nhưng, khi tới vị trí dữ liệu kết nối khác 00:13:35.000 --> 00:13:38.000 và lần này hãy nói về du lịch, 00:13:38.000 --> 00:13:41.000 và nói, "Tôi muốn gửi tấm ảnh này đến mọi người trong nhóm" 00:13:41.000 --> 00:13:43.000 bạn không thể vượt qua bức tường, 00:13:43.000 --> 00:13:45.000 Nhà Kinh tế viết về nó, nhiều người bàn tán 00:13:45.000 --> 00:13:46.000 sự thất bại to lớn. 00:13:46.000 --> 00:13:48.000 Cách đạp đổ các kho chứa là để đạt đồng bộ 00:13:48.000 --> 00:13:50.000 giữa các địa chỉ mạng xã hội. 00:13:50.000 --> 00:13:52.000 Ta cần làm vậy với dữ liệu liên kết. NOTE Paragraph 00:13:52.000 --> 00:13:55.000 Loại dữ liệu cuối cùng tôi nói đến, có lẽ thú vị nhất. 00:13:55.000 --> 00:13:58.000 Trước khi tôi xuống đây, tôi đã tìm trên OpenStreetMap 00:13:58.000 --> 00:14:00.000 OpenStreetMap là bản đồ, cũng là Wiki. 00:14:00.000 --> 00:14:03.000 Phóng to và cái hình vuông đó là nhà hát mà ta đang ngồi 00:14:03.000 --> 00:14:05.000 Nhà hát Terrace. Không có tên trên đó. 00:14:05.000 --> 00:14:07.000 Tôi vào phần biên tập, chọn nhà hát, 00:14:07.000 --> 00:14:12.000 Tôi có thể thêm cái tên vào bên dưới, và lưu nó lại. 00:14:12.000 --> 00:14:15.000 Và bây giờ nếu bạn vào OpenStreetMap.org, 00:14:15.000 --> 00:14:18.000 Khi tìm nơi này, bạn sẽ thấy Nhà hát Terrace có tên ở đó 00:14:18.000 --> 00:14:20.000 Tôi đã làm điều đó. Là tôi! 00:14:20.000 --> 00:14:22.000 Tôi làm thế với bản đồ. Vừa làm đó! 00:14:22.000 --> 00:14:24.000 Tôi đưa nó lên đó. Bạn biết gì không? 00:14:24.000 --> 00:14:27.000 Nếu bản đồ phố xá là về mọi nguời làm bổn phận của họ 00:14:27.000 --> 00:14:30.000 và nó tạo ra một nguồn không thể tin được 00:14:30.000 --> 00:14:33.000 vì mọi người khác làm việc của họ. 00:14:33.000 --> 00:14:36.000 Và đó là những gì về dữ liệu liên kết. 00:14:36.000 --> 00:14:39.000 Nó nói về mọi người đang làm phần của họ 00:14:39.000 --> 00:14:42.000 để làm ra một ít, và tất cả chúng đều kết nối với nhau. 00:14:42.000 --> 00:14:45.000 Đó là cách dữ liệu liên kết làm việc. 00:14:45.000 --> 00:14:49.000 Bạn làm bổn phận của mình. Những người khác làm của họ. 00:14:49.000 --> 00:14:53.000 Bạn có thể không tự có nhiều dữ liệu để đưa lên đây 00:14:53.000 --> 00:14:56.000 nhưng bạn biết yêu cầu nó. 00:14:56.000 --> 00:14:58.000 Và chúng ta sẽ tập luyện điều đó. NOTE Paragraph 00:14:58.000 --> 00:15:02.000 Vậy, dữ liệu liên kết - nó khổng lồ. 00:15:02.000 --> 00:15:05.000 Tôi chỉ nói một số ít rất nhỏ trong các thứ 00:15:05.000 --> 00:15:07.000 Có dữ liệu ở mỗi khía cạnh cuộc sống, 00:15:07.000 --> 00:15:10.000 mỗi khía cạnh của công việc và sở thích, 00:15:10.000 --> 00:15:13.000 và nó không chỉ là con số của nơi có dữ liệu, 00:15:13.000 --> 00:15:16.000 mà nó kết nối với nhau. 00:15:16.000 --> 00:15:19.000 Và khi bạn kết nối dữ liệu với nhau, bạn có sức mạnh 00:15:19.000 --> 00:15:22.000 theo cách không chỉ xảy ra với trang mạng, mà còn với tư liệu. 00:15:22.000 --> 00:15:26.000 Bạn sẽ có sức mạnh khổng lồ nhờ nó. 00:15:26.000 --> 00:15:29.000 Vậy, bây giờ chúng ta đang ở tại sân khấu 00:15:29.000 --> 00:15:33.000 nơi mà ta phải làm điều đó - những nguời nghĩ đó là ý hay. 00:15:33.000 --> 00:15:36.000 Tất cả mọi người - tôi nghĩ rất nhiều người ở TED làm nhiều thứ 00:15:36.000 --> 00:15:38.000 mặc dù không có sự hoàn vốn ngay tức khắc 00:15:38.000 --> 00:15:41.000 vì nó sẽ chỉ thật sự chi trả khi mọi người khác hoàn thành nó - 00:15:41.000 --> 00:15:45.000 họ sẽ làm bởi vì họ là kiểu người làm những thứ 00:15:45.000 --> 00:15:48.000 mà chỉ tốt nếu người khác đã làm nó. 00:15:48.000 --> 00:15:50.000 Nên nó được gọi là dữ liệu liên kết 00:15:50.000 --> 00:15:52.000 Tôi muốn bạn làm điều đó 00:15:52.000 --> 00:15:54.000 Tôi muốn bạn yêu cầu nó. 00:15:54.000 --> 00:15:56.000 Và tôi nghĩ nó là ý tường toàn cầu 00:15:56.000 --> 00:15:57.000 Cảm ơn. 00:15:57.000 --> 00:16:00.000 (Vỗ tay)