Hallo zusammen
Gibt es einen Linkgrabber der sich die Links von Streamcloud, auf die KinoX verlinkt, besorgt?
Wenn ja, wo würde ich so einen Linkgrabber finden?
Danke für eure Hilfe
Druckbare Version
Hallo zusammen
Gibt es einen Linkgrabber der sich die Links von Streamcloud, auf die KinoX verlinkt, besorgt?
Wenn ja, wo würde ich so einen Linkgrabber finden?
Danke für eure Hilfe
Lass doch soetwas einfach von einem unserer Coder schreiben. Wir haben doch genug hier.
Wirklich komplett alle Links auslesen könnte etwas dauern, sollte aber nicht unmöglich sein. Sofern die Herren und Damen nicht irgendwelche Filter/Firewall Regeln im Einsatz haben, die Crawler blockieren. Aber auch dann solltest du zu deinem gewünschten Ergebnis kommen.
Ums den Codern etwas leichter zu machen, hier mein Ergebnis nach ein paar Minuten durchsicht:
Crawlen kann man das ganze eigentlich recht einfach, weil es für alles Ajax Requests gibt, welche JSON retour liefern.
Als erstes holt man sich mal die Filmliste, diese bekommt man hier: /aGET/List/?sEcho=1&iColumns=7&sColumns=&iDisplayStart=0&iDis playLength=25&iSortingCols=1&iSortCol_0=2&sSortDir _0=asc&bSortable_0=true&bSortable_1=true&bSortable _2=true&bSortable_3=false&bSortable_4=false&bSorta ble_5=false&bSortable_6=true&additional=%7B%22fTyp e%22%3A%22movie%22%2C%22fLetter%22%3A%22A%22%7D
Die Parameternamen davon sollten selbstredend sein, diese kann man dann für alle Seiten bis zum Ende durch selbst anpassen. Dadurch erhält man die Links zu allen Filmen und kann dann mit dem Parsen davon beginnen. Das einzige, was man davon jedoch wirklich braucht, ist im JSON Array vom Film der 2. Wert mit dem Link. Vom Link braucht man nur den href, welchen man von /Stream/ und .html entledigen sollte.
Anschließend ruft man folgende Adresse mit dem Filmnamen auf /aGET/Mirror/Mad_Max_Fury_Road-1&Hoster=30 und schon bekommt man die URL zu Streamcloud. Bitte darauf achten, dass man Hoster=30 immer beibehält. Dieser ist global vergeben und steht für Streamcloud.
Implementierung von Proxies, zufälligen Intervallen der Abfragen usw. sollte selbstverständlich auch noch miteingebaut werden :)
In diesem Sinne, frohes crawlen!