Ergebnis 1 bis 6 von 6

Thema: Amazon Crawling

Baum-Darstellung

  1. #4
    Senior
    THEMENSTARTER

    Avatar von Uranjitsu
    Registriert
    May 2016
    Beiträge
    210
    Gefällt mir!
    223
    Du gefällst: 158
    Zitat Zitat von 1stAid Beitrag anzeigen
    data-old-hires="https://images-na.ssl-images-amazon.com/images/I/61sJVMWE%2BKL._SL1320_.jpg"
    Du hast viel regex für etwas Bild;
    als flag setze sigel-line
    (?<=data-old-hires=\")(.*?)(?=\")
    https://regex101.com/r/UJo9aJ/1
    trifft.
    Wenn du ein anderes format brauchst kannst du dir den link "bauen" da die immer gleich aufgebaut werden z.B.
    https://images-na.ssl-images-amazon...._AC_US480_.jpg
    für ein pic mit 480 pixeln.

    In meinem Amazon(pic)crawler mache ich das seit Jahren ähnlich....
    Danke, das hat wunderbar geholfen

    PHP-Code:
    function get_data($url)
    {
        
    /* do some curl magic */
        
    $ch curl_init();
        
    curl_setopt($chCURLOPT_URL$url);
        
    curl_setopt($chCURLOPT_SSL_VERIFYPEERfalse);
        
    curl_setopt($chCURLOPT_FOLLOWLOCATIONtrue);
        
    curl_setopt($chCURLOPT_RETURNTRANSFER1);
        
    curl_setopt($chCURLOPT_CONNECTTIMEOUT3);
        
    $data curl_exec($ch);
        
    curl_close($ch);
        return 
    $data;
    }

    function 
    get_match($regex$content$pos 1)
    {
        
    /* do your job */
        
    preg_match($regex$content$matches);
        
    /* return our result */
        
    return $matches[intval($pos)];
    }

    function 
    amazonCrawler($url)
    {
        
    /* grab some data */
        
    $amazon_content get_data($url);
        
    $amazon['price'] = @get_match('!<span id="priceblock_ourprice" class="a-size-medium a-color-price">(.+)</span>!iUm'$amazon_content);
        
    preg_match_all('/(?<=data-old-hires=\")(.*?)(?<=\")/s'$amazon_content$amazon['image']);
        
        
    $array = array(
            
    $amazon['price'],
            
    $amazon['image'][0][1]
        );
        return (
    $array);
    }

    list(
    $amazon['price'], $amazon['image'][0][1]) = amazonCrawler('https://www.amazon.de/MSI-GE72-6QD161-Notebook-6700HQ-Skylake/dp/B015CJQAFM/ref=lp_4368994031_1_1?s=computers&ie=UTF8&qid=1480761465&sr=1-1');

    echo 
    "111111<br /><br />";
    echo 
    "Preis: ".$amazon['price']."<br />";
    echo 
    "Image: ".str_replace('"'''$amazon['image'][0][1])."<br />"

  2. Diesen Mitgliedern gefällt dieser Beitrag:


Ähnliche Themen

  1. Amazon Review "Helpful" Votes für mein Amazon Profil
    Von katze im Forum Business Daily Talk & OffTopic
    Antworten: 1
    Letzter Beitrag: 18.04.2021, 08:03
  2. Amazon Underground
    Von id12 im Forum Datenschutz & Privatsphäre (IT-Security)
    Antworten: 0
    Letzter Beitrag: 29.08.2015, 16:28

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein
  •  
SzeneBox.org... im Mittelpunkt der Szene!
© since 2015 szeneBOX.org - All Rights Reserved
Domains: www.szenebox.org