הרשת הבלתי נראית – The Invisible Web

כשאנו תרים אחר מידע ברשת, ניצבים בפנינו שני אתגרים גדולים עיקריים: האתגר הראשון הוא הקושי לאתר מידע במהירות וביעילות – דבר שאמור להיות קל יותר בשימוש באופרטורים עליהם כבר כתבתי כאן. האתגר השני – שאנחנו בד”כ פחות מודעים אליו – הוא החיפוש ב”רשת הבלתי נראית“.

אפתח בהסבר פשטני על אופן העבודה של מנועי חיפוש כגון גוגל. ובכן, תוכנה שמכונה בשמות המסתוריים והמעקצצים “זוחלים”, “רובוטים” או “עכבישים”, עושה את דרכה ברשת האינטרנט, ומתייגת תכנים. אותם “זוחלים” עוברים בין הלינקים, ומאחסנים דפים לשליפה מהירה בזיכרון (בעבר היו הזוחלים הללו מסוגלים לעבור רק בדפים הכתובים ב-HTML או בטקסט, אבל כיום מנועי החיפוש יודעים להמיר גם פורמטים כגון PDF ולאחסן אותם).

ה”רשת הבלתי נראית” מורכבת מכל אותם דפים שה”זוחלים” של מנועי החיפוש לא מציגים לנו. המדובר במסה עצומה של דפים (ויש הסבורים כי “הרשת הבלתי נראית” גדולה אף פי 500 מהיקף הדפים הזמינים דרך מנועי חיפוש). כך למשל, הזוחלים לא יודעים להיכנס דרך מסך כניסה של בסיסי נתונים, קטלוגים, מאגרי מאמרים ועוד. הם גם מתעלמים בכוונה מחלק מהדפים בחיפוש, שהם סבורים שסתם יעמיסו על הגולש, ומתעלמים גם מהדפים שבעליהם לא רוצים שמנוע החיפוש יאתר אותם.

לכן, כשאנו ניגשים למחקר ברשת, אסור לנו להסתמך רק על חיפוש בגוגל, ואנחנו צריכים לשלב בחיפוש שלנו גם חיפוש ברשת הבלתי נראית.

הנה כמה טיפים:

1. בין מכרות הזהב ברשת ניתן למנות את הבאים:

2. הכנת רשימת מקורות שימושית וחיפוש נפרד ברשימת האתרים הללו בכל חיפוש, בנוסף לחיפוש ברשת. למשל: בלוגים מקצועיים או פרטיים בנושא החיפוש, פורומים, אתרי חברות, חברות יעוץ ועוד.

איך מאתרים כאלה? באופן משולב, הכולל:

  • חיפוש כללי של הנושא ואיתור חברות שהאתרים שלהם עולים בהקשר זה, וכן בחינה בתשומת לב של שמות חברות הנזכרות במאמרים / פרופילים על התעשיה או הנושא הרלוונטיים. במקרה שאחת החברות היא חברה ציבורית, כדאי לקרוא דוחות שנתיים שלה, על מנת לצבור ידע נוסף בנושא.
  • איתור של מקור לפי מאמר אחד שאיתרתם – לעתים יש דפים שמאופסנים על גבי הרשת וניתן להגיע אליהם באמצעות מנועי חיפוש, אך חיפוש ישיר באתר יניב הרבה יותר תוצאות מאלה שהגעתם אליהן דרך מנוע החיפוש, מסיבות שונות. מומלץ תמיד לבחון את האתר שהוא המקור למאמר המעניין שאיתרתם, בין אם ע”י לחיצה על עמוד הבית של האתר, ובין אם ע”י מחיקה של סיומת ה-URL עד שתגיעו ל-directory שיש גישה אליה (לעתים זה יהיה רק מהעמוד הראשי, כלומר תצטרכו למחוק את כל מה שמופיע אחרי הסיומת com או org או co.uk וכיו”ב).
  • חיפוש של מקור ספציפי באמצעות גוגל – לאחר שזיהיתם אתרים רלוונטיים, ניתן לנסות לערוך בהם חיפוש עמוק ע”י שימוש באופרטור :site. כלומר, להכניס את מילות החיפוש ואז להכניס את האופרטור ובצמוד לו את כתובת האתר שחשפתם, רצוי בלי ה-www משום שלעתים במקום www  יש שם של ספריה ספציפית (כגון finance.google.com, ir.nestle.com…) כך: site:XYZ.com
  • איתור של פורום/ ספריה / בלוג באמצעות חיפוש המלים הרלוונטיות, והוספת המילה directory, forum, database, blog וכיו”ב.

כמובן שבאופן אידאלי, מי שעורך מחקר באופן מקצועי, בין אם כפונקציה בחברה או כמידען או חוקר שוק (כמוני, למשל), צריך גם לרכוש מנוי למאגר אחד הכולל מאמרים ממקורות שונים בתשלום כגון מאגר המידע העסקי Nexis.com, וכן מנויים למאגרים מקצועיים אחרים בתשלום, משום שאין דרך לעקוף את דרישת התשלום על מאמרים איכותיים יותר.

אשמח לקבל מכם תגובות והפניות למקורות נוספים, וכמובן לענות על שאלות.

2 Comments Add yours

  1. דור says:

    יש בעיה בקישור. העתקת הקישור לשורת הפקודה או שמירתו בקובץ והפעלת לינק לא מוצאת את המאמר.
    מה שעושים זה לחפש בלתי נראית ולקוות שיציג את המאמר.

  2. hs 2 says:

    וואו מעמיק מאוד . יפה

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s