Repül az idő...
Már 20 éve annak,
hogy át akartam alakítani az információ feldolgozás módját,
azt ahogy együtt működhetünk - Feltaláltam a világhálót
Most, 20 évvel később, a TED-en
segítséget szeretnék kérni egy következő megújuláshoz
Tehát, menjünk vissza 1989-be
írtam egy rövid jegyzetet a globális hypertext rendszerről.
Senki nem nagyon törődött vele.
Aztán 18 hónappal később - a felfedezés már csak így megy -
18 hónappal később, a főnököm azt mondta, hogy mellékesen foglalkozhatok vele
mintegy szórakozásként,
próbálgassam vele az új számítógépet amit kaptunk.
Így kaptam időt a megvalósításra.
Felvázoltam a HTML alapjait,
hypertext protokoll - HTTP -
az URL lényegét - a dolgok elnevezésére
amik HTTP-vel kezdődnek.
Megírtam a kódot és nyilvánossá tettem.
Miért tettem?
Elsősorban az csalódottság miatt.
Csalódott voltam - programozóként dolgoztam
egy nagy és izgalmas helyen,
sok ember jött oda a világ sok részéről.
Mindenféle különböző számítógépet hoztak magukkal.
Nagyon sok különböző adat formátumot használtak.
Minden féle típusú dokumentációs rendszereik voltak.
Úgyhogy ha ebben a sokféleségben
ki akartam találni, hogy hogyan lehetne használni
egy kicsit ebből, egy kicsit abból
amibe beleláttam, mindig új gépekre kellett kapcsolódnom,
új programokat kellett megtanulnom,
a szükséges információk mindig valamilyen új formátumban voltak.
És ezek nem voltak kompatibilisek egymással.
Nagyon idegesítő volt.
Nagyon zavart ez a feltáratlan lehetőség.
Valójában minden lemez tele volt dokumentumokkal.
Ha elképzeljük mindezt
egy nagy, virtuális dokumentum rendszerben,
például az interneten,
az élet sokkal egyszerűbb lenne.
Ha egyszer megszületik egy ilyen ötlet, akkor az belül ott motoszkál
még akkor is ha mások el sem olvassák a jegyzeteimet -
a főnököm elolvasta, halála után találtuk meg az asztalán.
Ceruzával ezt írta a sarkára: "Bizonytalan, de érdekes"
(Nevetés)
De általában nehéz volt - nagyon nehéz volt elmagyarázni,
hogy mi a web.
Nehéz elmagyarázni most az embereknek, hogy akkor miért volt nehéz megérteni.
De akkor - amikor a TED elindult, még nem volt web,
az olyan szavak, mint "kattintás" egészen mást jelentettek.
Megmutatok valakinek egy hypertext-et,
egy oldal tele linkekkel,
rákattintunk a linkre és hopp - egy újabb hypertext oldal...
Nem lenyűgöző.
Mi már láttunk ilyet - CD-ken tárolunk hypertext formátumban dolgokat.
Ami nehéz volt, hogy el tudják képzelni.
Elképzelni azt, hogy egy link bárhova elvihet,
gyakorlatilag bármilyen dokumentumhoz.
Ez volt az a nagy lépés, amit akkor nagyon nehezen tudtak megtenni.
De néhányuknak mégis sikerült.
Bár nehéz volt elmagyarázni, de elindult egy mozgalom.
És ez tette igazán érdekessé.
Ez volt a legizgalmasabb dolog,
nem a technológia, nem az amit az emberek kezdtek vele,
hanem a közösség, az emberek összefogása,
emailek küldése.
Ilyen volt akkor.
De mi a helyzet? Vicces, de most is ugyanitt tartunk.
Többé-kevésbé mindenkit megkértem, hogy tegyék fel a dokumentumaikat -
Megkértem, hogy tegyék fel a dokumentumokat erre a "web dologra"
És feltették.
Köszönöm.
Élvezetes volt, nem?
Mármint elég érdekes,
mert rájöttünk, hogy ami a weben történik
tényleg lenyűgöző.
Sokkal több, mint amit eredetileg elképzeltünk
amikor az első honlapot összeraktuk
amivel indultunk.
Most azt szeretném, ha felraknánk az adatainkat a webre.
Látszik, hogy még mindig nagyon sok kihasználatlan lehetőség van.
Ez még mindig idegesítő
mert még mindig nem adat formában vannak az adatok a weben.
Mit értek adat alatt? Mi a különbség dokumentum és adat között?
A dokumentumot olvassuk.
Többnyire olvassuk, követhetjük a benne szereplő linkeket és ennyi.
Adat, amivel mindenféle dolgokat lehet csinálni a számítógépen.
Ki volt itt, vagy ki látta Hans Rosling előadását?
Az egyik nagyszerű - igen, sokan látták -
az egyik nagyszerű TED előadás.
Hans kivetítette ezt a prezentációt,
amin bemutatta különböző országokra különböző színekkel jelölve -
a bevételt az egyik tengelyen,
a csecsemőhalandóságot a másikon, időbeli animációval.
Fogta ezeket az adatokat és készített egy prezentációt
ami összetört néhány hiedelmet
a fejlődő világ gazdaságával kapcsolatban.
Egy ehhez hasonló diát vetített ki.
Mélyen a felszín alatt ott voltak az adatok,
barna, kocka alakúak, unalmasak,
és így is gondolunk rá, nem?
Mert az adatokat nem lehet önmagukban használni.
Valójában viszont az életünk nagy részét befolyásolják adatok
azért, mert valaki csinál valamit az adatokkal.
Ebben az esetben Hans összeszedte az adatokat
amit mindenféle ENSZ és egyéb weboldalakon talált.
Összerakta őket,
az eredetinél valami sokkal érdekesebb formába rendezte,
majd bevitte ebbe a programba,
amit azt hiszem eredetileg a fia fejlesztett,
és létrehozta ezt a csodás prezentációt.
És Hans rámutatott a lényegre,
amikor ezt mondta: "Nagyon fontos, hogy legyen sok adatunk".
És nagyon örültem neki, hogy a tegnap esti fogadáson
még mindig ezt hangsúlyozta: "Nagyon fontos, hogy sok adatunk legyen".
Most gondoljunk egy kicsit tovább,
ne csak két adat kapcsolatára, vagy hat adatéra, ahogy ő dolgozta fel,
hanem egy olyan világra, ahol mindenki felrakja az adatait a webre,
így gyakorlatilag minden amit el tudunk képzelni a weben lesz
és hívjuk ezt összekapcsolt adatoknak.
A technológia is összekapcsolt adat és nagyon egyszerű.
Ha valamit fel akarsz tenni a webre, három szabály van:
az első a HTTP nevek -
amik ilyen "http:" formával kezdődnek
ezeket most már nem csak dokumentumokra használjuk,
hanem bármire amiről a dokumentum szól.
Emberek, helyek leírására,
termékek vagy események megjelölésére is használjuk.
Mindenféle fogalomnak van HTTP-vel kezdődő neve.
A második szabály, hogy ha megnézek egy ilyen HTTP nevet
és a neten megkeresem az adatokat
a HTTP protokollon keresztül,
akkor valamilyen szabványos formában kell visszakapnom valamilyen adatot,
amire szükségem lehet és hasznos
annak a dolognak vagy eseménynek a leírására.
Ki lesz ott? Bármi erről a személyről,
hogy hol született például.
Tehát a második szabály, hogy fontos információt kapjak vissza.
A harmadik szabály, hogy amikor visszakapom az információt
akkor ne csak valakinek a magasságát, súlyát, születési idejét tudjam meg,
hanem kapcsolatokat is.
Az adatok kapcsolatok.
Érdekes, de az adatok kapcsolatok.
Ez az ember Berlin-ben született. Berlin Németországban van.
És amikor ilyen kapcsolatok jönnek létre,
akkor a másik dolog, amivel kapcsolatban áll,
kap egy újabb HTTP nevet.
Így megkereshetem ezt is.
Tehát megkeresek egy embert - megkereshetem, hogy hol született,
hol helyezkedik el az a város,
mekkora a népessége, stb.
Böngészhetek ezek között az adatok között.
És ez az.
Ez az összekapcsolt adat.
Írtam néhány évvel ezelőtt egy "Összekapcsolt adat" című cikket
és nem sokkal ezután elkezdtek dolgok történni.
Az összekapcsolt adat ötlete, hogy van nagyon-nagyon sok
ilyen dobozunk, mint Hansnak volt,
és nagyon sok minden sarjad ki belőlük.
Nem csak sok más növény,
nem csak egy növényt tápláló gyökér,
hanem minden ilyen növénynek, bármi is legyen az -
egy prezentáció, egy elemzés, mintázatok felismerése az adatok között -
az összes adatot figyelembe kell venni
és össze kell kapcsolni.
És ami nagyon fontos az adatokkal kapcsolatban,
hogy minél többet tudunk összekapcsolni, annál hatékonyabb.
Tehát összekapcsolt adat.
Az ötlet elindult.
És hamarosan Chris Bizer a berlini Freie Universitat-ról
aki az egyik első volt azok közül akik érdekes dolgokat hoztak fel,
felfedezte a Wikipediát -
az ismert online enciklopédiát
nagyon sok érdekes dokumentummal.
Ezekben a dokumentumokban vannak kis dobozok.
Ezekben az információs dobozokban pedig adatok.
Írt egy programot, ami a Wikipediából kinyeri az adatokat
és a összekapcsolt adatok egyik buborékjába tette őket
a weben, amit dbpedia-nak nevezett el.
A Dbpedia-t a kék buborék jelöli a dia közepén
és ha megkeressük Berlin-t
láthatjuk, hogy vannak egyéb adat buborékok is
amik szintén tartalmaznak valamit Berlinről és össze vannak kapcsolva.
Ha vesszük tehát az összes adatot, amit a dbpedia Berlinről tartalmaz
egyéb helyekről is magával fogja hozni az információkat.
És ami érdekes, hogy egyre növekszik.
Egy újabb mozgalom.
Gondolkozzunk egy kicsit az adatokról.
Nagyon sok formában lehetnek adatok.
Gondoljunk a web sokféleségére, ez nagyon fontos
hogy a webre bármilyen adatot felrakhatunk.
Tehát ezek az adatok, nagyon sokféle adatról lehetne beszélni.
Kormányzati adatokról, a vállalkozási adatok nagyon fontosak,
vannak tudományos adatok, személyes adatok,
időjárás adatok, események,
adatok előadásokról, hírek, és még sok minden más.
Csak néhányat fogok említeni
azért, hogy lássuk a sokféleséget,
és az ebben rejlő lehetőségeket.
Kezdjük a kormányzati adatokkal.
Barack Obama egyik beszédében azt mondta, hogy
- az amerikai kormányzati adatok elérhetőek lennének az interneten
hozzáférhető formákban.
És remélem, hogy összekapcsolt adatként fogják feltenni.
Ez fontos. Miért?
Nem csak az átláthatóság miatt, bár az átláthatóság fontos a kormányzatban,
hanem az adatok miatt - az összes kormányzati szervtől származó adat.
Gondoljunk bele mennyi adat van az amerikai életről.
És ez hasznos, értékes.
Használhatom a cégemben,
gyerekként a házi feladatomhoz.
A világ jobbításáról beszélünk
ha elérhetővé tesszük ezeket az adatokat.
Ha felelős vagy - ha tudsz valamilyen információról
egy kormányzati szervnél, gyakran azt látod,
hogy ezek az emberek nagyon meg akarják tartani maguknak -
Hans ezt adatbázis ölelésnek nevezi.
Magadhoz szorítod az adataidat, nem engeded ki
amíg nem készítettél neki egy nagyon szép honlapot.
Azt javasolnám, hogy inkább -
igen, csinálj szép honlapot,
ki vagyok én, hogy azt mondanám, hogy ne.
Készíts szép honlapot, de először
add ki a természetes adatokat,
szükségünk van az adatokra.
Természetes adatokra van szükségünk.
Most a nyers adatokat kérnünk kell.
És ezt most gyakoroljuk, rendben?
Mondjuk: "nyers"
Közönség: "nyers"
Tim Berners-Lee: mondjuk "adatokat"
Közönség: adatokat
Tim Berners-Lee: "most"
Közönség: most!
Egyben, "Nyers adatokat most!"
Közönség: "Nyers adatokat most!"
Ezt gyakoroljuk! Fontos, mert rengeteg kifogást tudnak
az emberek felhozni, hogy megtarthassák adataikat
és ne adják ki, még akkor sem ha adófizetőként fizetünk ezért.
És nem csak Amerikában, az egész világon így van.
És természetesen nem csak a kormányzatban, hanem a cégeknél is.
Még néhány gondolat az adatokról.
Itt vagyunk a TED-en, és mindig nagyon öntudtosak vagyunk
hogy az emberi társadalomnak mik a nagy kihívásai most -
rák gyógyítás, Alzheimer kórosok agyi működésének megértése,
a gazdaság megértése a stabilitás érdekében,
a világ működésének megértése.
Azoknak, akik ezeket megoldják - a tudósoknak -
félig megfogalmazott megoldásaik vannak a fejükben,
amit a weben keresztül próbálnak meg bemutatni.
De az emberi tudás nagy része jelenleg
adatbázisokban rejlik, egy-egy számítógépen
amit nem osztanak meg senkivel.
Nézzünk csak egy konkrét területet -
ha például az Alzheimer kórra keresünk,
gyógyszer felfedezések - nagyon sok összekapcsolt adat van,
mert a tudósok ezen a területen rájöttek,
hogy ez egy jó módja annak, hogy kiszabaduljanak ebből a zártságból,
mert a genomikai adataik egy adatbázisban vannak
egy adott épületben, a fehérje adataik pedig egy másikban.
Most összekötik ezeket - összekapcsolt adat -
és olyan kérdéseket tudnak feltenni, amit mi nem tennénk,
én nem tenném, ők igen.
Milyen fehérjék játszanak szerepet a jel továbbításban
és kapcsolódnak a piramis idegsejtekhez?
Ezt így ahogy van a Google-n keresnénk.
Persze nincs olyan oldal a weben, ami megválaszolta volna ezt a kérdés
mivel még senki nem tette fel.
Van 223000 találat -
de nincs használható eredmény.
Rákeresünk a összekapcsolt adatokban - amit most már összeállítottak -
32 találat, mindegyik olyan fehérje, amelyik rendelkezik az adott tulajdonságokkal
és meg is nézhetjük.
Az ereje annak, hogy ilyen kérdéseket tehetünk fel tudósként -
kérdéseket, amelyek különböző tudományterületeket kötnek össze -
egy tényleg nagy lehetőség.
Nagyon fontos.
A tudósok nagy akadályokba ütköznek -
a mások által összegyűjtött adatok elérhetetlensége miatt
és ezeket kéne feloldani, hogy a nagy kérdéseket kezelni lehessen.
Ha így folytatom, azt gondolhatnánk, hogy minden adat nagy intézményektől származik
és semmi közünk hozzá.
De ez nem igaz.
Valójában az adatok az életünkről szólnak.
Csak bejelentkezünk egy közösségi oldalra,
és azt mondjuk, hogy "Ez az ismerősünk".
Hopp! Kapcsolat. Adat.
Azt mondjuk, hogy "Ezen a képen ez a valaki szerepel".
Hopp! Adat, adat, adat.
Minden alkalommal, amikor közösségi oldalakon csinálunk valamit,
az oldal adatokat gyűjt és használ fel - újrahasznosít -
és az oldalon lévő emberek életét érdekesebbé teszi.
De amikor egy másik összekapcsolt adat oldalra megyünk -
mondjuk egy utazással kapcsolatos oldalra.
és azt mondjuk: "El szeretném küldeni ezt a képet mindenkinek ebben a csoportban"
nem tudunk átlépni a falakon.
Az Economist írt erről egy cikket, és sokan blogoltak is róla,
nagyon idegesítő.
Ahhoz, hogy kitörjünk a falak közül, meg kell valósítani az együttműködést
a közösségi oldalak között.
Ehhez az összekapcsolt adatra van szükség.
Még egy típusú adatról hadd beszéljek, talán ez a legérdekesebb.
Mielőtt ide jöttem, megnéztem az OpenStreetMap-et.
Ez egy térkép, de ugyanakkor egy Wiki oldal is.
Belenagyítok, és az a négyzet ott egy színház - ahol éppen most vagyunk -
A Terrace Színház. Nem volt rajta név.
Tehát beléptem a szerkesztő módba, kiválasztottam a színházat,
lent hozzáadtam a nevet és elmentettem.
És most ha visszamegyünk az OpenStreetMap.org oldalra,
és rákeresünk erre a helyre, látni fogjuk, hogy a Terrace Színháznak már van neve.
Én csináltam. Én!
Én csináltam azt a térképen. Én csináltam!
Én tettem fel oda.
Ha a street map-en mindenki ennyit megtesz,
hatalmas adatforrás jön létre
mert mindenki más is megtette a magáét.
És erről szól az összekapcsolt adat.
Hogy mindenki megteszi a maga kis részét
hogy létrejöjjön valami és aztán összekapcsolódik.
Így működik az összekapcsolt adat.
Te megteszed a te részed. Mindenki más a sajátját.
Lehet, hogy nincs sok adatod amit fel tudsz tenni
de igényünk van rá.
És ezt már gyakoroltuk.
Tehát összekapcsolt adat - ez hatalmas.
Csak nagyon kicsit mondtam el belőle.
Életünk minden területén vannak adatok,
a munka és a szórakozás területein
és nem csak az a lényeg, hogy hány helyről érkezik adat,
hanem ezek kapcsolata.
És amikor az adatok összekapcsolódnak, annak nagy ereje van,
ami a weben, a dokumentumokon keresztül nem érvényesül.
Nagyon sok mindent lehet kihozni belőle.
Tehát most itt tartunk,
amikor ezt meg kell valósítani - azoknak, akik ezt jó ötletnek tartják.
És mindenki - és azt hiszem, nagyon sok ilyen ember van a TED-en, akik ezért teszik -
még akkor is, ha nincs közvetlen nyereség,
mert csak akkor éri meg, ha mindenki más is megteszi -
megteszik, mert olyan emberek, akik csak megtesznek dolgokat
amiket jó lenne, ha mindenki megtenne.
OK, tehát ez az összekapcsolt adat.
Szeretném, ha mindannyian csinálnánk.
Szeretném, ha mindannyian igényt tartanánk rá.
És azt hiszem, hogy ez egy terjesztésre érdemes ötlet.
Köszönöm.
(Taps)