Return to Video

Udacity CS 101 Unit 1-2: Web Crawler יחידה 1-2 בניית מנוע חיפוש cs101

  • 0:00 - 0:02
    ובכן מה דעתך על אופן בניית מנוע חיפוש
  • 0:02 - 0:03
    בנית כבר אחד, נכון?
  • 0:03 - 0:06
    כן. אני חושב שהדבר החשוב ביותר
  • 0:06 - 0:08
    אם הנך מתכוון לבנות מנוע חיפוש
  • 0:08 - 0:12
    זה להכיל מצבור ממש מתאים כדי להתחיל בו
  • 0:12 - 0:19
    במקרה שלנו השתמשנו ברשת האינטרנט, אשר בזמנו הייתה לבטח קטנה יותר מאשר היום.
  • 0:19 - 0:21
    אבל זה היה חדיש ומרגש
  • 0:21 - 0:23
    היו כל מיני דברים בלתי צפויים שם.
  • 0:23 - 0:26
    ובכן, המטרה של שלושת היחידות הראשונות של הקורס היא לבנות מצבור כזה.
  • 0:27 - 0:30
    ואנו רוצים לבנות את המצבור עבור מנוע החיפוש שלנו
  • 0:30 - 0:32
    על-ידי סריקת הרשת, וזה מה שסורק רשת עושה.
  • 0:32 - 0:36
    מהו סורק רשת? זוהי תוכנת מחשב האוספת תוכן מהרשת.
  • 0:36 - 0:40
    אם תחשבו על דף שרואים בדפדפן, יש לכם דף מעין זה.
  • 0:40 - 0:43
    ואנו נשתמש באתר הקורס כדוגמה לדף רשת.
  • 0:43 - 0:47
    יש בו הרבה תוכן, יש בו תמונות, יש בו קצת טקסט.
  • 0:47 - 0:51
    כל זה מגיע לדפדפן כאשר מבקשים את הדף .
  • 0:51 - 0:53
    הדבר החשוב שיש לו הם הקישורים.
  • 0:53 - 0:57
    ומהו קישור? זהו משהו שמפנה לדף אחר.
  • 0:57 - 1:00
    ובכן יש לנו קישור לשאילתות שנשאלות לעתים קרובות,
  • 1:00 - 1:02
    יש לנו קישור לדף:
    cs 101
  • 1:02 - 1:04
    יש גם כמה קישורים נוספים בדף הזה.
  • 1:04 - 1:07
    וקישור זה יתכן ויופיע בדפדפן עם קו תחתי
  • 1:07 - 1:09
    ייתכן ולא, תלוי כיצד הדפדפן שלך מוגדר.
  • 1:09 - 1:11
    אבל הדבר החשוב הוא,
  • 1:11 - 1:13
    קישור שהוא מצביע לדף רשת אחר .
  • 1:13 - 1:16
    והדפים האחרים ייתכן ויהיו להם גם קישורים
  • 1:16 - 1:19
    ובכן יש לנו קישור נוסף בדף זה
  • 1:19 - 1:23
    ייתכן וזה קישור לשמי, ושניתן להגיע בעקבותיו לדף הבית שלי.
  • 1:23 - 1:26
    וכל הדפים שאנו יכולים למצוא בעזרת סורק הרשת שלנו
  • 1:26 - 1:29
    הנם מאותרים על-ידי מעקב אחר הקישורים.
  • 1:29 - 1:31
    כך שלא בהכרח ימצא כל דף ברשת
  • 1:31 - 1:33
    אם נתחיל בדף גרעיני טוב
  • 1:33 - 1:35
    נמצא הרבה דפים
  • 1:35 - 1:37
    ומה שהסורק יעשה, הוא להתחיל בדף אחד,
  • 1:37 - 1:41
    מציאת את כל הקישורים בדף זה, לעקוב אחריהם כדי למצוא דפים אחרים
  • 1:41 - 1:45
    ואז בדפים האחרים הוא יעקוב אחר הקישורים שלהם
  • 1:45 - 1:48
    כדי למצוא דפים אחרים ובהם יהיו עוד הרבה קישורים.
  • 1:48 - 1:51
    ובסופו של דבר יהיה לנו אוסף של הרבה דפים ברשת.
  • 1:51 - 1:54
    ובכן זהו מה שאנו רוצים לעשות, לבנות סורק רשת.
  • 1:54 - 1:56
    אנו רוצים למצוא דרך כלשהי שמתחילה מדף גרעיני,
  • 1:56 - 1:59
    מחלצת את כל הקישורים בדף
  • 1:59 - 2:01
    עוקבת אחר קישורים אלה לדפים אחרים
  • 2:01 - 2:03
    ואז לאסוף את הקישורים של דפים אחרים אלה,
  • 2:03 - 2:05
    לעקוב אחריהם, לאסוף אותם.
  • 2:05 - 2:07
    ובכן זה נשמע כמו הרבה עבודה.
  • 2:07 - 2:09
    אנו לא נעשה זאת בשיעור הראשון.
  • 2:09 - 2:12
    ביחידה הראשונה אנו רק נחלץ קישור אחד.
  • 2:12 - 2:14
    ובכן אנו נתחיל עם מקבץ טקסטואלי
  • 2:14 - 2:17
    יהיה בו קישור עם
    URL
  • 2:17 - 2:19
    מה שאנו רוצים למצוא הוא את ה-יו.אר.אל הזה
    (URL = יו.אר.אל)
  • 2:19 - 2:21
    כך שנוכל לבקש את הדף הבא.
  • 2:21 - 2:23
    המטרה של היחידה השנייה
  • 2:23 - 2:25
    הנה להמשיך בחיפוש
  • 2:25 - 2:28
    אם יש הרבה קישורים בדף אחד, נרצה למצוא את כולם.
  • 2:28 - 2:30
    וזה מה שנעשה ביחידה השנייה,
  • 2:30 - 2:32
    נגלה כיצד להמשיך בחיפוש ולחלץ את כל הקישורים הללו.
  • 2:32 - 2:36
    ביחידה שלוש נרצה להמשיך מעבר לדף אחד.
  • 2:36 - 2:40
    בסיום היחידה השנייה נוכל להדפיס את כל הקישורים שבדף.
  • 2:40 - 2:44
    ביחידה שלוש אנו רוצים לאסוף את כל הקישורים, כך שנוכל להמשיך,
  • 2:44 - 2:47
    לסיים את המעקב, ולאסף הרבה דפים.
  • 2:47 - 2:50
    בסיומה של יחידה שלוש יהיה לנו סורק רשת בנוי.
  • 2:50 - 2:52
    תהיה לנו דרך לבנות את המצבור שלנו.
  • 2:52 - 2:57
    בשלושת היחידות הנותרות נראה כיצד נענים לשאילתות.
  • 2:57 - 3:01
    וביחידה ארבע נסיק כיצד לתת תגובה טובה.
  • 3:01 - 3:08
    כך שאם הנך מחפש/ת מלת מפתח תתקבל בתגובה רשימת דפים
  • 3:08 - 3:10
    השייכים למלת המפתח הזו.
  • 3:10 - 3:15
    וביחידה חמש נמצא דרך לעשות זאת יחסית לגודל, במקרה שיש לנו מצבור גדול.
  • 3:15 - 3:19
    וביחידה שש אנו לא רק רוצים למצוא רשימה
  • 3:19 - 3:21
    אנו רוצים למצוא את הרשימה הטובה ביותר.
  • 3:21 - 3:24
    כך שנדע כיצד לדרג את כל הדפים בהם מלת המפתח מופיעה.
  • 3:24 - 3:27
    אנו מעט מקדימים,
  • 3:27 - 3:30
    מאחר וכל מה שאנו עומדים לעשות ביחידה אחת,
  • 3:30 - 3:32
    הוא להבין כיצד לחלץ קישור אחד מדף.
  • 3:32 - 3:35
    ומנוע החיפוש שנבנה בסוף התהליך
  • 3:35 - 3:37
    יהיה מנוע חיפוש מתפקד.
  • 3:37 - 3:40
    יהיו לו את המרכיבים העיקריים של מנוע חיפוש כמו שיש לגוגל.
  • 3:40 - 3:43
    הוא בוודאי לא יהיה חזק כמו המנוע של גוגל
  • 3:43 - 3:44
    אנו רוצים לשמור על פשטות.
  • 3:44 - 3:46
    אנו רוצים לכתוב מעט קוד
  • 3:46 - 3:48
    ועלינו לזכור שמטרתנו העקרית
  • 3:48 - 3:50
    אינה לבנות מנוע חיפוש,
  • 3:50 - 3:52
    אלא שימוש, בתהליך בניית מנוע חיפוש, ככלי עזר
  • 3:52 - 3:55
    ללימוד מדעי המחשב.
  • 3:55 - 3:56
    וגם ללמוד תכנות
  • 3:56 - 3:58
    כך שלמידה תוך כדי עשייה
  • 3:58 -
    תאפשר לנו לפתור הרבה בעיות אחרות.
Title:
Udacity CS 101 Unit 1-2: Web Crawler יחידה 1-2 בניית מנוע חיפוש cs101
Description:

Professor David Evans gives an overview of the unit in CS 101.
פרופסור אוואנס נותן סקירה על יחידת המבוא למדעי המחשב 101

more » « less
Video Language:
English
Duration:
04:03

Hebrew subtitles

Revisions