Web Mining of Firm Websites: A Framework for Web Scraping and a Pilot Study for Germany, Kinne und Axenbeck 2018

Aktuell haben  Kinne and Axenbach (2018) das Netzwerk von mehr als 3.700 Berliner Softwareunternehmen publiziert. Die Größe der Kreise repräsentiert nicht die Unternehmensgröße, sondern deren Grad der Vernetzung. Die Autoren haben die Information aus den Homepages der Unternehmen mit Hilfe von Webscraping und Datamining extrahiert. Da die Mehrheit der Unternehmen des IT-Sektors und nahezu alle Unternehmen mit mehr als 25 Mitarbeitern eine Homepage haben, enthält das gezeigte Bild nahezu die Gesamtheit aller Berliner  Softwareunternehmen. Die mehr als 700 Verbindungen basieren auf Hyperlinks, welche sich auf den Unternehmenshomepages befinden. Vergleicht man das Netzwerk mit den Berliner Innovationshotspots kann man Gemeinsamkeiten, aber auch Unterschiede erkennen, die in zukünftigen Forschungsarbeiten untersucht werden.

Share

Leave a Reply

Your email address will not be published. Required fields are marked *