Anmelden

Archiv verlassen und diese Seite im Standarddesign anzeigen : Similarweb- Der Spion unter uns



maz
11.03.2016, 14:13
Wie ihr vielleicht schon bemerkt habt, bin ich ein grosser Fan von similarweb (https://www.similarweb.com).
Wobei Fan eigentlich das falsche Wort ist, ich nutz es nur gerne, und habe auch ein wenig Angst oder eher Respekt von der Seite.
Für die denen der Name noch nichts sagt, Similarweb versucht die Besucherzahlen und einige weitere Infos von allen Seiten im Netz zu ermitteln. Und das gelingt ihnen meiner Meinung nach erstaunlich gut, selbst in der Szene.

Bei einem Thread hier wurde erwähnt, das die Daten sicher ziemlich falsch sind und nicht vergleichbar mit anderen Seiten, da jede Seite verschiedeen viel einbinde und Szene User sowieso alles unternehmen um nicht getaggt zu werden.
Ich versuche das ganze mal an szenebox.org zu wiederlegen

https://www.szenebox.org/images/_imported/2016/03/74.jpg
Erst mal das wichtigste die Besucherzahlen
Wie genau die stimmen könnte uns vermutlich nur Syrius verraten (falls überhaupt) aber übersschlagen wir die Zahl mal.
140k views im Februar. Das macht pro Tag 4800 Besuche. Diese Zahl ist relativ realistisch. Es kommt halt drauf an, wie oft man den selben Besucher wieder zählt. Bei meinen eigenen Seiten (non Warez) stimmen die zahlen ziemlich mit google Analytics überrein. Auch die anderen Zahlen hier könnten stimmen, viele schauen nur schnell rein und gehen gleich wieder.
Wenn man sich Seiten anschaut wie Linkcrypt oder Filecrypt, sieht man auch, dass die Trends zu stimmen scheinen. (In den letzten 2 Monaten hat Linkcrypt ca 5M Besucher verloren und Filecrypt hat ziemlich genau die 5M erhalten).

Jetzt die Frage: Wie zum Fick kommt Simlar an diese Zahl?
Klar, die Zugriffe über Google kann man vermutlich eingiermassen zählen (Naja zumindest wenn Google mit ihnen kooperiert). Aber wie man später hier noch sieht, ist ein knapper drittel der Besuche ein Direktaufruf (auch das scheint mir realistisch). Wer die Ankündigungen der Box nun aber gelesen hat weiss, das Syrius sich mühe gegeben hat und alle Tracker wirklich entfernt hat. Und die meisten Szene User dürften auch keine Toolbars oder sonnstige krüppelsoftware mitschleppen. Also woher kommt diese "genaue" Zahl?

https://www.szenebox.org/images/_imported/2016/03/75.jpg
Die Länder
Auch hier könnten die Zahlen wieder stimmen. Vorallem das 12.4% aus Niederlande kommen leuchtet durchaus ein, das dürften die PP VPNs und andere VPNs sein
Leider sehn wir hier blos die ersten 5 Läder. Diese Info ist wenn man seine Seite mit der Konkurrenz vergleichen will noch spannend.
Aber auch hier frag ich mich, woher weiss Similar das? Vorallem das mit den VPNs zeigt, dass es nicht einfach geraten ist.

https://www.szenebox.org/images/_imported/2016/03/76.jpg
Zugriffsarten
Nicht so spannend, eher für den Betreiber selbst, der vermutlich bessere Zahlen hat. In der Szene ist der Search Wert je nach Seite natürlich tief. Wie schon erwähnt scheint es mir für die Box zu passen. Denn die 44% Search sind realistisch, da die szenebox eine erstaunlich hohe Googlewertung (ich mein nicht den nichtssagenden Pagerank) hat. Das sehen wir aber später.

https://www.szenebox.org/images/_imported/2016/03/77.jpg
Die Referrals, das wohl spannendste für die Spionage
Wer wissen will, weshalb die Seite XY so beliebt ist, soll die Referals mal anschauen. Das mach ich nun auch mal.
Filecrypt steht ganz oben, das leuchtet ein, schliesslich ist es auch die mit Abstand "grösste" Seite die mit der Szenebox zutun hat. (Guter Schachzug von euch hier eine Coop einzugehen)Auch die anderen Seiten dürften aber allen bekannt sein nehm ich mal an. Auch hier wäre es natürlich schoön die weiteren Seiten auch zu sehen.

Und wo gehen die User danach hin?
Zu den üblichen verdächtigen, wobei mich das Mlcboard etwas überrascht hat. ber ist auch nicht unrealistisch.
Auch hier wieder ein fettes Fragezeichen, woher will das Similarweb wissen?


https://www.szenebox.org/images/_imported/2016/03/78.jpg
Die Suchwörter über die man zur Box findet
Klar da sind die üblichen verdächtigen, die jeder erwartet. Denn obwohl es viel grössere Szene Seiten gibt, scheint die Szenebox doch realtiv hoch gerankt zu sein, und einige Seiten in der Szene geben sich natürlich auch mühe nicht bei Google zu erscheinen.
Aber ein Keyword sticht dann doch raus! "kim gloss playboy". Ich konnte es kaum galuben und klcikte deshalb auf die Lupe die sogleich eine Google Suche (https://www.google.ch/search?q=kim+gloss+playboy)startet. Und siehe da:
https://www.szenebox.org/images/_imported/2016/03/79.jpg
Die Szenebox ist bei google auf Platz eins (gut gemacht Don!) vor dem Bravo. Also kann man auch hier sagen, die Daten könnten wohl stimmen. Diese erhebung empfinde ich aber auch als eine der einfachsten.

https://www.szenebox.org/images/_imported/2016/03/80.jpg
Der Rest, den ich nicht sehr spannend finde und ich auch nicht ganz verstehe
Similar versucht die Seite auch noch einzuordnen, was ihr hier bei der Szenebox sogar einigermassen gelingt wie ich finde. Wenn ich die Box einteilen müsste würde es wohl ähnlich aussehen. Blos der Adult Anteil ist vermutlich etwas höher.
Die also visited websites stimmen bei mir schon eher selten und auch hier scheinen einige seltsam. (Wobei vermutlich ein häufiger Szenebox User bei Allaboutcards arbeitet.)

Die Topics kann man eher kübeln, das scheint nicht wirklich sinnvoll. Oder wird hier regelmässig über Kanye der ein cockol(d) ist, diskutiert und ich bekomm sowas einfach nicht mit?

Es gäbe auch noch zwei weitere Kategorien, das Social und Display advertising, das empfinde ich aber für die Szene als recht nutzlos.

Nun, das Tool ist aus meiner Sicht sehr praktisch um einiges über Fremde Seiten zu erfahren. Mann kann dann auch gleich 2 Seiten miteinander vergleichen, verliert dann aber fast alle Infos:
https://www.szenebox.org/images/_imported/2016/03/81.jpg


Wer nun denkt, nagut, dieses Tool ist ja sehr Praktisch und der Premium Service lohnt sich für mich sicher, da ich dann viel mehr Daten sehe hat sicher recht. Aber Similarweb ist scheiss teuer!

https://www.szenebox.org/images/_imported/2016/03/82.jpg
Und ich habe noch angefragt, was das Advenced Packet kosten würde (das Basic ist ja fast das free Paket) und mir wurden 1100$ veranschlagt, pro Monat natürlich und wenn ichs ein Jahr lang nehm. Also für 13200 im Jahr. Naja und da kauf ich mir dann lieber ein Auto.


Was haltet ihr von den Zahlen? Und wundert es euch auch ein wenig, wie Similarweb an die Daten kommt?
Smilarweb hat zwar ein PDF zur Datenerhebung aber das ist sehr vage: https://www.similarweb.com/downloads/our-data-methodology.pdf

PS: Evt. gehört der Thread auch in den SEO Bereich
PPS: Ich musste leider alle Smiles entfernen, da ich hier anscheinend "nur" 10 Bilder verlinken kann. Einiges ist aber im Prinzip mit einem ;) zu lesen.

syrius
11.03.2016, 15:48
Ich vermute einfach mal, dass diese Zahlen über DNS abgegriffen werden. Technisch ist das machbar... ich bin mir aktuell nur unsicher wie man einen DNS anzapft. Dafür musste es sonst ja öffentliche Services/API's geben. Das nächste was ich mir denken kann, dass Google hier öffentliche Schnittstellen hat, und Similarweb das einfach in ein verständliches Frontend gepackt hat - was am naheliegensten ist.

Nuka
11.03.2016, 16:08
Wird da irgendwo definiert was "Visits" sind?

fuckedup
11.03.2016, 16:13
Total Visits

The sum of all desktop visits (non unique) to the analyzed domain, app or industry within the chosen time frame and segment (Website Traffic Sources, Geography, etc.).

A “visit” refers to a visit that occurred within a 30-minute block of time. For example, if a user enters the same site multiple times within 30 minutes, it will be counted as one visit.

maz
11.03.2016, 16:16
DNS kann man anzapfen? Naja gut, möglich wäre es schon...
Die google Infos sind sicher nicht so das geheime, da geb ich dir recht. Gut möglich dass die sogar eine offene API dafür anbieten.


Und nein, soweit ich weiss leider nicht. Aber in etwa so google analytics das definiert. Es sind aber nicht Visits sondern "Sitzungen". Bei meinen Seiten ist die Visit Zahl von Similar regelmässig ca 10% unter dem was Google Sitzungen nennt.
Kannst dich also ungefähr danach richten.

EDIT: Interessant, hab ich bisher übersehen :emoji19:. Danke :D

fuckedup
11.03.2016, 16:22
Our data comes from 4 main sources: 1) A panel of over 200 million monitored devices, currently the largest panel in the industry. 2) Local internet service providers (ISPs) located in many different countries. 3) Our web crawlers that scan every public website to create a highly accurate map of the digital world, and 4) Hundreds of thousands of direct measurement sources from websites and apps that are connected with us directly. This last source of data helps us to constantly improve our learning set, fine tune our algorithms and reach accurate estimations about traffic stats for ALL websites and mobile apps.

mehr infos:
https://www.similarweb.com/downloads/our-data-methodology.pdf

wenn die natürlich daten von ISPs bekommen, macht es die sache um einiges einfacher für sie ;)

maz
11.03.2016, 16:26
Ich kenn diese Info, aber ganz ehrlich, dass sie die mehrheit der Deutschen Provider anzapfen können und dürfen (sowie die der Niederlande und der Schweiz) kann ich kaum glauben. ;)

Jana-Maria
11.03.2016, 16:27
Eine Google-API gibt es von Analytics.
https://developers.google.com/analytics/

maz
11.03.2016, 16:37
Das ist soweit ich das sehe nur die Analytics API, mit der man nur die Daten seiner eigen Seite bekommt. Und sehr viele Seiten nutzen ja auch kein Analytics.

- - - - - - - - - - Beitrag nachträglich erweitert - - - - - - - - - -

Und so einfach kann das alles aber nicht sein, den Alexa versucht ja was ähnliches, die gibts schon länger und ihre Daten sind ziemlich falsch. (Und soweit ich weiss, zeigen sie auch nur das Verhältniss zu anderen Seiten und keine Zugriffszahlen). Und zumindest früher stammte der grossteil der daten aus der alexa toolbar, was die Resultate massiv verzog.
Und Similar (und Alexa) sind auch die einzigen mir bekannten Seiten die sowas anbieten.

fritzi
11.03.2016, 16:40
Ehrlich?

Die errechnen es genauso wie Alexa, Browserplugins machen es möglich.

Jeder der sich ein bisserl mit Statistik auskennt wird dir bestätigen können das dazu nichtmal allzuviele Benutzer nötig sind um das halbwegs valide hochzurechen. Es gab da schöne Tricks um bei Alexa zu schummeln mit hilfe der Toolbar. Sinn dahinter war es die Besucherzahlen in der Statistik hochzutreiben um den potentiellen Verkaufswert der Seite zu erhöhen. Heutzutage verlässt man sich lieber auf GA und Alexa ist dadurch relativ unbedeutend geworden.

Die Qualität der Ergebnisse schwankt dabei ganz schön, je weniger Besucher und/oder spezielles Publikum desto stärker weichen die Zahlen voneinander ab.
Bei einigen Seiten bei denen ich Zugriff habe und die für ein Publikum gedacht sind die keine Ahnung haben was ein Browseraddon ist stimmt es nichtmal annähernd. Bei den meisten anderen schwankt es +/- 10% um die realen Zahlen.

Nichtsdestotrotz ist es eine schöne Hilfe um Besucherzählen zumindest abschätzen zu können.

maz
11.03.2016, 16:47
Meinst du Plugins oder Addons?
Das einige der Daten über die adblocker addons rausgehen kann sein. Zwischen Alexa und Similarweb gibts aber massive Unterschiede. Wenn man die genauen Zahlen von einigen Seiten kennt sieht man das sofort. Und so ab 20k scheinen die Daten zu stimmen. Und vorher ist die Seite sowieso nicht sehr spannend.

Bei meinen Seiten seh ich aber keine Unterschiede zwischen Seiten wo die User FF & Chrome und einen adblockn haben (oder andere addons) und Seiten die zu 60% vom IE besucht werden.

fritzi
11.03.2016, 17:23
Ich meine Plugins (https://chrome.google.com/webstore/detail/similarweb-site-traffic-s/hoklmmgfnpapgjgcpechhaamimifchmp) für den Browser. Die werden bestimmt nicht von nem Adblock aufgehalten ;)
Ja Alexa ist bedeutungslos mittlerweile, die Toolbar von denen habe ich schon seit ewigkeiten nicht mehr in freier Wildbahn gesehen. Und wie gesagt, man braucht nur relativ wenig besucher mit Plugin um das vernünftig hochrechnen zu können. Natürlich sind auf großen Seiten tendenziell mehr BEsucher damit unterwegs weswegen das sich dann auch genauer berechnen lässt. Bei kleinen Seiten kann es sein das noch nie einer dabei war und deswegen stimmt es hinten und vorne nicht.

Das sich jemand Javascripte einbindet die für Símiliar tracken und die dann evt von Adblock aussortiert werden habe ich noch nie gesehen.

Wobei man auch anhand der Backlinks und der Suma-Keywords rückschlüsse auf die Besuchermenge ziehen kann. Sofern man genügend Daten hat mit denen man das vergleichen kann. Aber alleine reicht das nicht aus.

maz
11.03.2016, 17:37
Ich meinte das die Adblocker selbst die Daten dafür liefern könnten. Aber das sowie die Plugin Idee ansich ist nicht so einfach umzusetzen, denn du müsstest eine sehr regelmässoge Verteilung über alle Länder und Interessesgruppen hinkriegen. Ausserdem kannst du nicht einfach eins der beliebtesten Plugins (oder Addons) mit massenhaft Trackingmassnamen füllen, das würde sofort von wem bemerkt werden und da die meisten nicht "bespitzelt" werden möchten wäre das Plugin sofort weg vom Fenster.

fuckedup
11.03.2016, 17:59
den meisten ist ihre privatsphäre scheiß egal, hautpsache alles läuft. also daran würde es eher nicht scheitern. ansonsten wären nicht die größten datenkraken immer noch die beliebtesten und meistgenutzten dienste ;)

vlado
11.03.2016, 18:07
Similarweb ist realistischer als Alexa.com.
Darum schaue ich nur noch bei Similarweb.

Was ich aber komisch finde, wieso gibt es keine Daten von Streamcloud.eu?
https://www.similarweb.com/website/streamcloud.eu

maz
11.03.2016, 18:24
Hab ich mich auch schon gefragt, es gibt aber schon Daten nur das Land Ranking und Global Ranking fehlt. Kann man aber reproduzieren.

fritzi
11.03.2016, 18:36
Hab ich mich auch schon gefragt, es gibt aber schon Daten nur das Land Ranking und Global Ranking fehlt. Kann man aber reproduzieren.

264

Stimmt.


Aber ich glaube du verrennst dich. Similiarweb hat sein eigenes Addon, warum um himmels willen sollte irgendein Adblocker ihnen Daten liefern? bzw wie kommst du auf die Idee?


Und du überschätzt die Menge an Nutzern die man dazu braucht um halbwegs brauchbare Statistiken zu liefern. Infratest Dimap nutzt für Umfragen nur eine Datenbasis von 1000 befragten Leuten und rechnet sie meistens relativ genau auf 80 Millionen hoch. Similiarweb hat garantiert wesentlich mehr nutzer. Und diese kommen auch von der ganzen Welt, dank des Addons können sie auch ziemlich genau feststellen wo wer herkommt und wo wer hingeht. Das sie diese Daten sammeln steht in ihren Privacy Policies (https://www.similarweb.com/privacy-policy). Du brauchst nicht weiter versuchen um die Ecke zu denken. Es ist relativ klar woher diese Daten stammen.

maz
11.03.2016, 18:45
Das Similar Addon hat doch kein User (Chrom + FF zusammen unter 200'000 DLs- > vermutlich so 50'000 aktive Weltweit) installiert. Du brauchst realtiv genaue Daten um zusehen, von welchen Seiten die User kommen. Oder meinst du 2-3 reichen? Und nochmals, das Plugin müsste enorm regelmäss verteilt sein. Wenn es in Deutschland zB "bloss" 10'000 wären würde das niemals solche Daten bei der szenebox genereren.

Und klar hätten die Addblocker interesse Similarweb die Daten zu geben. Es ist ja völlig kar, das Similarweb Daten auch einkauft. Und wer denkt das Afdblocker einfach nur zum wohle der Menschheit geschrieben werden irrt sich gewalltig. (Zumindest bei allen grossen).



Our data comes from 4 main sources: 1) A panel of over 200 million monitored devices, currently the largest panel in the industry. Also weit mehr als einfach ihr Plugin :D Die Zahl reicht dann vermutlich schon eher für genauere Aussagen.

Und die Tatsache das man seine Seite direkt verlinken kann über die (ich mach das bei meinen Seiten immer) hilft ihnen natürlich auch ziemlich :)

...hundreds of thousands of direct measurement sources from websites

R@zorB@ck
12.03.2016, 20:10
Hier mal ein interessanter Artikel zu similarweb:
Mit diesen dubiosen Methoden verdient SimilarWeb Geld (http://www.onlinemarketingrockstars.de/spyware-und-ad-injection-die-dubiosen-methoden-von-similarweb/)

Shepard
13.03.2016, 18:32
Similar Web geht eigentlich noch. Da gibt es Andere die richtig Gas geben Beispiel https://www.webtrekk.com/

mjaeger
16.03.2016, 04:09
Similarweb ist realistischer als Alexa.com.
Darum schaue ich nur noch bei Similarweb.

Was ich aber komisch finde, wieso gibt es keine Daten von Streamcloud.eu?
https://www.similarweb.com/website/streamcloud.eu

Das kommt davon wen man nur EU Traffic auf Seite erlaubt. Versuch ma Streamcloud mit einer Amerikanischen IP (oder einfach ausserhalb der EU) anzusurfen du erhälst 404.

Ist auch gut um Archive zu verarschen :emoji40:
( https://web.archive.org/web/20160313151746/http://streamcloud.eu/ ) <-- komisch jeden tag ist die Seite auf 404 :)

edit:
Auch noch recht amüsant vorallem die Top Referring Sites:
https://www.similarweb.com/website/imdb.com#referrals

Aber nun halt ich die klappe xD
Lg

maz
16.03.2016, 13:16
IMDB die Infoseite für die Szene :D

Und danke für die Aufklärung, wusste nicht mal das Streamcloud Länder blockt.

Ghandy
05.04.2016, 04:05
Es gibt die Möglichkeit, SimilarWeb den Zugriff auf die eigenen Daten von Google Analytics zu erlauben. Bis man das tut, sind die Zugriffszahlen sehr viel höher. Ich habe Google Analytics rausgeworfen, ansonsten sind deren "Schätzungen" sehr realistisch und deutlich besser, als ich je von Alexa gesehen habe. Das ist ein Startup aus Israel, ich arbeite sehr gerne mit deren Angaben. Danke für den Link, den Artikel über die Firma schaue ich mir an.