Für die Betrachtung von aktuellen Entwicklungen am Arbeitsmarkt bietet die Analyse von  Online-Stellenanzeigen (OJA – Online Job Advertisement) ein großes Potential. Folgende Fragestellungen können beantwortet werden: Welche Fachkräfte und Kompetenzen werden benötigt? Existiert bei der Suche nach Arbeitskräften ein regionaler Unterschied? Welchen Einfluss hat Corona auf unterschiedliche Branchen? Um dieses Potential auszuschöpfen, ist einiges an Know-how gefragt, um am Ende ein valides und repräsentatives Ergebnis zu erhalten. Auf einem vom Bundesinstitut für Berufsbildung und der Bertelsmann Stiftung organisiertem Forum diskutieren Expert:innen für die Analyse von OJA verschiedene Vorgehensweisen und Verfahren, methodische Knackpunkte sowie aktuelle Forschungsergebnisse.  

In dieser Blogreihe stellen jene Expert:innen aus verschiedenen Institutionen in kurzen Vortragsvideos (10 – 15 Minuten) Lösungsansätze zu methodischen Herausforderungen vor, die bei der OJA-Analyse auftreten können. Thematisiert werden unterschiedliche Fragestellungen, die während des Analyseprozesses auftreten können: Von der Datenbereinigung über die Prüfung der Repräsentativität bis hin zur Auswahl von passenden Klassifikationen, auch Taxonomien genannt, und der Entwicklung und Evaluation von Algorithmen, die wichtige Informationen aus den OJA herauslesen sollen. Auch auf aktuelle Arbeiten wird kurz eingegangen. Alle Vorträge wurden von den Expert:innen auf dem letzten Forum im November 2021 gehalten.  

Video: Modellbasierte Anwendungen des Text-Pre-Processing mit Stellenanzeigen aus dem Web  

In seinem Vortrag thematisiert Dr. Felix Busch vom Stellenmarkt-Monitor Schweiz (Soziologisches Institut, Universität Zürich) die beiden Anwendungen Text Zoning, auch Segmentierung genannt, und Erkennung von Boilerplate. Beides sind Anwendungen aus dem Bereich des Pre-Processing. Herr Dr. Busch zeigt beim Thema Text Zoning auf, wie anhand des überwachten Maschinellen Lernens und der neuronalen Sprachmodellierung
(NLM Architektur) Online-Stellenanzeigen in sinnvolle Strukturelemente unterteilt werden können. Das zweite Thema des Vortrags ist die Erkennung von Boilerplate (Werbung, Links-Listen oder Sidebars) in Online-Stellenanzeige. Die Erkennung wird anhand einer binären Klassifikation in Inserats-spezifische und Boilerplate-spezifische Sprache durchgeführt.  

 

Hier finden Sie weitere spannende Arbeiten von Herrn Dr. Busch bzw. vom Stellenmarkt-Monitor Schweiz: 

  • Buchmann, Marlis, Helen Buchs, Felix Busch, Simon Clematide, Ann-Sophie Gnehm, und Jan Müller. 2022. „Swiss Job Market Monitor: A Rich Source of Demand-Side Micro Data of the Labour Market“. European Sociological Review jcac002. doi: 10.1093/esr/jcac002.    
  • Gnehm, Ann-Sophie, und Simon Clematide. 2020. „Text Zoning and Classification for Job Advertisements in German, French and English“. S. 83–93 in Proceedings of the Fourth Workshop on Natural Language Processing and Computational Social Science. Association for Computational Linguistics. 

 

Weitere Beiträge aus der Reihe „Gewusst wie: Analyse von Online-Stellenanzeigen“:

Gewusst wie: Analyse von Online-Stellenanzeigen (1/11) – Aufbereitung eines Datenschatzes

Gewusst wie: Analyse von Online-Stellenanzeigen (2/11) – Erkennung von Dubletten

Gewusst wie: Analyse von Online-Stellenanzeigen (3/11) – Sicherung der Qualität

Gewusst wie: Analyse von Online-Stellenanzeigen (4/11) – Wie repräsentativ sind die Daten?

Gewusst wie: Analyse von Online-Stellenanzeigen (5/11) – Evaluation

Gewusst wie: Analyse von Online-Stellenanzeigen (6/11) – Aufdecken von versteckten Informationen

Gewusst wie: Analyse von Online-Stellenanzeigen (7/11) – Mit Machine Learning zur Antwort

Gewusst wie: Analyse von Online-Stellenanzeigen (8/11) – Zuordnung von Berufe

Gewusst wie: Analyse von Online-Stellenanzeigen (9/11) – Gewinnung von Taxonomien

Gewusst wie: Analyse von Online-Stellenanzeigen (10/11) – Genese und Anreicherung von Kompetenzwörterbüchern

Gewusst wie: Analyse von Online-Stellenanzeigen (11/11) – Werben mit Nachhaltigkeit in Azubistellen