wissenschaftliche*r Mitarbeiter*in (100%) im Bereich Machine Learning und Natural Language Processing

wissenschaftliche*r Mitarbeiter*in (100%) im Bereich Machine Learning und Natural Language Processing

'mei a Ute Schmid - 'aho
Number of replies: 0

Der Lehrstuhl Information Processing and Analytics der
Humboldt-Universität zu Berlin befasst sich mit der Extraktion von
Wissen aus großen Datenmengen und nutzt dabei Technologien und
Verfahren aus den Bereichen Data Mining & Machine Learning, Linked
Data, Information Extraction und Natural Language Processing. Er
betreibt zusammen mit den Universitäten Kassel und Würzburg das
Social-Bookmarking-System BibSonomy (http://dev.bibsonomy.org/).

In einer Kollaboration mit dem Internet Archive (https://archive.org/)
soll eine Methode zur Datierung von Webseiten entwickelt werden. Die
wenigen vorhandenen Verfahren (siehe
https://www.bibsonomy.org/user/jaeschke/web+archive+estimate+time)
sind auf vielen (v.A. älteren) Webseiten nur sehr eingeschränkt
nutzbar. Daher soll untersucht werden, inwiefern sich mittels
maschineller Lernverfahren Modelle trainieren lassen, die gute
Ergebnisse auf ausgewählten Korpora des Internet Archive erzielen.

Wir suchen für dieses Projekt Sie als wissenschaftliche*r Mitarbeiter*in
(100%)

Das Entgelt erfolgt nach E 13 TV-L. Die Stelle hat einen Umfang von 40
Stunden/Woche. Die Stelle ist gem. § 2 Absatz 2
Wissenschaftszeitvertragsgesetz (WissZeitVG) entsprechend der
Projektdauer bis 31.07.2021 befristet – eine Verlängerung des
Vertrages wird angestrebt. Es besteht die Möglichkeit zu einer
Promotion im Fach Informatik oder Informationswissenschaft.

Ihre Aufgaben:

- Erforschung und Anwendung von Methoden und Algorithmen in den
  Bereichen Maschinelles Lernen, Informationsextraktion sowie Web und
  Data Mining
- Verarbeitung großer, heterogener Daten, insbesondere Web-Daten, in
  der Größenordnung bis zu 100 Terabyte
- Anwendung innovativer Technologien beispielsweise zum Aufbau einer
  Such- und Analyseinfrastruktur
- Austausch mit Fachcommunities und Aufbau eines Netzwerkes mit
  Forschenden
- wissenschaftliche Dokumentation und Präsentation von Entwicklungen
  und Ergebnissen

Ihr Profil:

Erforderlich sind:

- Abgeschlossenes wiss. Hochschulstudium in bevorzugt Informatik,
  Mathematik, Physik oder Computational Linguistics
- gute Kenntnisse in mindestens einem der folgenden Bereiche:
  Informationsextraktion, Maschinelles Lernen, Natural Language
  Processing
- Erfahrung im Umgang mit großen Datenmengen, idealerweise Web- oder
  Social-Media-Daten
- sehr gute Programmierkenntnisse und Erfahrung im Umgang mit modernen
  Softwareentwicklungs-Werkzeugen
- Erfahrung in der Bedienung von Linux-basierten Rechnersystemen
- sehr gute Deutsch- und gute Englischkenntnisse in Wort und Schrift

Erwünscht sind:

- Interesse an teamorientierter Forschungsarbeit auf internationalem
  Niveau in einem interdisziplinären Team von Informatikern*innen und
  Informationswissenschaftlern*innen
- Interesse an der Verarbeitung und Analyse von Web-Daten,
  insbesondere der Datierung von Webseiten sowie der
  Informationsextraktion
- Kenntnisse im Bereich Named Entity Recognition and Linking, Linked
  Data, Stochastik, Web Archivierung

Die Bereitschaft zu gelegentlichen Dienstreisen aus Anlass von
Projekttreffen oder Tagungen wird erwartet.

Unser Angebot:

- eine abwechslungsreiche Tätigkeit in einem dynamischen und
  spannenden Forschungsumfeld, in dem Teamarbeit, Transparenz, offene
  Innovationsprozesse und ständige Weiterbildung unverzichtbar sind
- leistungsorientiertes und forschungsstarkes Team
- die Altersvorsorge für den öffentlichen Dienst (VBL)
- ein Arbeitsplatz in Berlin Mitte
- Austausch und Kooperation mit den Mitarbeiter*innen und
  Doktorand*innen des Instituts für Bibliotheks- und
  Informationswissenschaft sowie mit dem Internet Archive
- Chancengleichheit und Vereinbarkeit von Beruf und Familie
- die Möglichkeit, ausgiebig Erfahrung im Umgang mit großen
  Datenmengen sowie der geeigneten Infrastruktur (Cluster-System) und
  aktuellen Technologien (z.B. Apache Spark) zu sammeln


Sie fühlen sich angesprochen?

Dann machen Sie jetzt den nächsten Schritt und bewerben Sie sich:

Bewerbungsschluss ist der *11. Dezember 2019*. Die
Humboldt-Universität zu Berlin ist bestrebt, den Anteil an Frauen zu
erhöhen, und begrüßt deshalb besonders die Bewerbung von
Frauen. Schwerbehinderte Bewerber/innen werden bei entsprechender
Eignung bevorzugt berücksichtigt. Bitte senden Sie uns Ihre
aussagekräftige Bewerbung mit Anschreiben, Lebenslauf,
Universitätsabschlusszeugnis, und eine informative Kurzzusammenfassung
der letzten Abschlussarbeit (max. eine Seite) unter Angabe der
Kennziffer DR/207/19 an die Humboldt-Universität zu Berlin,
Philosophische Fakultät, Institut für Bibliotheks- und
Informationswissenschaft, Prof. Robert Jäschke (Sitz: Dorotheenstraße
26), Unter den Linden 6, 10099 Berlin oder bevorzugt per E-Mail in
einer PDF-Datei an robert.jaeschke@hu-berlin.de. Auf die Vorlage von
Lichtbildern/Bewerbungsfotos verzichten wir ausdrücklich und bitten
daher hiervon abzusehen.

Sie haben Fragen? Dann wenden Sie sich gern an Prof. Dr. Robert
Jäschke (robert.jaeschke@hu-berlin.de), Tel. 030 2093-70960.

Wir freuen uns darauf, Sie kennenzulernen!

https://www.personalabteilung.hu-berlin.de/de/stellenausschreibungen/wissenschaftlicher-mitarbeiter-m-w-d-mit-vorauss-vollzeit-e-13-tv-l-hu-drittmittelfinanzierung-befristet-bis-30-06-2021


-- Prof. Dr. Robert Jäschke Humboldt University Berlin & L3S Research Center Hannover < https://amor.cms.hu-berlin.de/~jaeschkr/ >>><<< +49 (0)30 2093-70960 > < World Literature: http://weltliteratur.net/ >< http://bibsonomy.org/ >