דף הבית » איך ל » כיצד לחלץ קישורים כבוי כל דף אינטרנט באמצעות PowerShell

    כיצד לחלץ קישורים כבוי כל דף אינטרנט באמצעות PowerShell

    PowerShell 3 כוללת תכונות חדשות רבות, כולל תכונות חדשות רבות עוצמה הקשורות לאינטרנט. הם מפשטים באופן דרמטי את אוטומציה של האינטרנט, והיום אנחנו הולכים להראות לך איך אתה יכול לחלץ כל קישור אחד מחוץ לדף אינטרנט, ובנוסף להוריד את המשאב אם אתה רוצה.

    לגרד את האינטרנט עם PowerShell

    ישנם שני cmdlets חדשים שהופכים את automating האינטרנט קל יותר, Invoke-WebRequest אשר עושה ניתוח תוכן קריא אדם קל יותר, ו- Invoke-RestMethod מה שהופך את התוכן קריא המכונה לקריאה יותר. מאחר שהקישורים הם חלק מה- HTML של דף, הם מהווים חלק מהחומר הקריא האנושי. כל מה שאתה צריך לעשות כדי לקבל דף אינטרנט הוא להשתמש Invoke-WebRequest ולתת לו כתובת אתר.

    Invoke-WebRequest-אורי 'http://howtogeek.com'

    אם לגלול למטה תראה את התגובה יש נכס קישורים, אנו יכולים להשתמש PowerShell 3 של החבר החדש תכונה ספירה כדי לסנן אותם.

    (Invoke-WebRequest-אורי 'http://howtogeek.com')

    כפי שאתה יכול לראות שאתה מקבל הרבה קישורים בחזרה, זה המקום שבו אתה צריך להשתמש בדמיון שלך כדי למצוא משהו ייחודי כדי לסנן את הקישורים שאתה מחפש. נניח שאנחנו רוצים רשימה של כל המאמרים בעמוד הראשון.

    (Invoke-WebRequest -Uri 'http://howtogeek.com') .Links | איפה - אובייקט $ _. Href-like "http *" | איפה class -eq "כותרת").

    עוד דבר נהדר שאתה יכול לעשות עם cmdlets החדש הוא אוטומציה הורדות היומיום. מאפשר להסתכל באופן אוטומטי scraping את התמונה של היום מחוץ לאתר Geo Nat, כדי לעשות זאת נוכל לשלב את cmdlets אינטרנט חדש עם Start-BitsTransfer.

    $ IOTD = (Invoke-WebRequest-אורי 'http://photography.nationalgeographic.com/photography/photo-of-the-day/'.Links | איפה whereHTML-like "* הורד רקע *"). Href
    Start-BitsTransfer -Source $ IOTD -הגדרה C: \ IOTD \

    זה כל מה שיש. יש לך כל טריקים מסודרים משלך? תן לנו לדעת את ההערות.