-
[Sebastian Thrun] Więc jakie jest Twoje podejście to tworzenia wyszukiwarki,
-
zbudowałeś jedną, prawda?
-
[Sergey Brin] - współzałożyciel Google] Tak. Myślę, że najważniejszą rzeczą
-
jeśli zamierzasz zbudować wyszukiwarkę
-
jest to, że musi ona mieć na początku dobry korpus.
-
W naszym przypadku użyliśmy sieci internetowej, która w tamtym czasie była o wiele mniejsza niż jest dzisiaj.
-
Było to także coś nowego i bardzo ekscytującego.
-
Natrafiliśmy na wiele nieoczekiwanych rzeczy.
-
[David Evans] Celem trzech pierwszych rozdziałów jest właśnie stworzenie tego korpusu.
-
Chcemy go zbudować
-
poprzez przeszukiwanie sieci i to jest to co robi "web crawler".
-
"Web crawler" to program, który pobiera informacje z sieci.
-
Jeśli pomyślisz o stronie, którą widzisz w swojej przeglądarce, otrzymujesz coś takiego.
-
Użyjemy strony Udacity jako przykładu.
-
Posiada dużo informacji, ma kilka obrazków oraz trochę tekstu.
-
Wszystko to pojawia się w Twojej przeglądarce, gdy wchodzisz na stronę.
-
Ważną rzeczą jest to, że ma linki.
-
Link jest to coś co prowadzi do innej strony.
-
Mamy, więc link do najczęściej zadawanych pytań,
-
mamy link do strony głównej kursu.
-
Jest jeszcze kilka linków na stronie.
-
Taki link może pojawić się z podkreśleniem
-
lub nie, zależy jakie są ustawienia Twojej przeglądarki.
-
Ważną rzeczą jest to co robi.
-
Jest to wskaźnik do innej strony.
-
Te inne strony również mogą mieć linki,
-
więc mamy kolejny na tej stronie.
-
Może prowadzi do mojej strony.
-
Wszystkie te strony, które możemy znaleźć za pomocą "web crawler'a"
-
są znajdywane poprzez te linki.
-
Niekoniecznie znajdzie wszystkie strony w sieci
-
Jeśli zaczniemy z dobrego źródła
-
znajdziemy ich wiele.
-
Zadaniem "crawlera" jest rozpocząć z jedną stroną,
-
znaleźć wszystkie linki na niej, przejść przez nie, by odnaleźć inne strony,
-
a potem na tych stronach przejść po linkach,
-
aby znaleźć inne strony, gdzie będzie jeszcze więcej linków.
-
W końcu będziemy mieli kolekcję wielu stron w sieci.
-
Takie jest nasze zadanie, stworzyć "web crawlera".
-
Chcemy znaleźć jakiś sposób, by zacząć ze źródła,
-
wyciągnąć linki na tej stronie,
-
przejść po nich do innych stron,
-
potem zebrać linki na tych stronach,
-
przejść po nich, itd.
-
Sporo roboty.
-
Nie będziemy robić wszystkiego już teraz.
-
Podczas pierwszego rozdziału tylko wyciągniemy link z strony.
-
Zaczniemy z kawałkiem tekstu.
-
Będzie posiadać link z adresem URL.
-
Chcemy znaleźć ten adres,
-
aby przejść do następnej strony.
-
Celem drugiego rozdziału
-
będzie podążanie za linkami.
-
Jeśli będzie wiele linków na jednej stronie, chcemy znaleźć je wszystkie.
-
W rozdziale drugim zajmiemy się
-
jak wyciągnąć wszystkie linki.
-
W rozdziale trzecim będziemy chcieli przejść dalej niż jedna strona.
-
Pod koniec rozdziału drugiego będziemy mogli wyświetlić wszystkie linki na stronie.
-
W rozdziale trzecim chcemy zebrać te linki, przejść po nich dalej,
-
aż w końcu nasz "crawler" zbierze wiele, wiele stron.
-
Pod koniec rozdziału trzeciego zbudujemy "web crawlera".
-
Będziemy mieć sposób na zbudowanie korpusu.
-
Trzy pozostałe rozdziały będą opierać się na tym jak odpowiadać na zapytania.
-
W rozdziale czwartym zajmiemy się jak dać dobrą odpowiedź.
-
Jeśli wyszukujesz frazy, chcesz otrzymać odpowiedź, która jest listą stron,
-
gdzie ta fraza się pojawia.
-
W rozdziale piątym zajmiemy się jak to zrobić
-
Potem w rozdziale szóstym nie będziemy chcieli znaleźć tylko listy stron,
-
lecz najlepszą stronę.
-
Wymyślimy jak oceniać wszystkie strony, na których fraza się znajduje.
-
Wychodzimy teraz trochę poza nasz plan,
-
ponieważ jedyne co zrobimy w rozdziale pierwszym
-
to wymyślić jak wyciągnąć link ze strony.
-
Wyszukiwarka jaką zbudujemy pod koniec
-
będzie funkcjonalna.
-
Będzie posiadać główne komponenty, które ma Google.
-
Z pewnością nie będzie tak potężna jak Google,
-
ale chcemy stworzyć coś prostego.
-
Chcemy mieć do napisania jak najmniejszą ilość kodu.
-
Musimy pamiętać także o naszym celu,
-
czyli nie tylko zbudowaniu wyszukiwarki,
-
a użyciu jej jako maszyny
-
do nauczenia się informatyki
-
oraz programowania,
-
więc rzeczy których się nauczymy przy tym
-
pozwolą nam rozwiązać wiele innych problemów.