Об этом курсе
Недавно просмотрено: 2,746

100% онлайн

Начните сейчас и учитесь по собственному графику.

Гибкие сроки

Назначьте сроки сдачи в соответствии со своим графиком.

Начальный уровень

Прибл. 22 часа на выполнение

Предполагаемая нагрузка: 2 - 3 h/Woche, insg. 6 Wochen...

Немецкий

Субтитры: Немецкий, Английский

Приобретаемые навыки

Natural Language ProcessingParsingDigital PreservationCorporaNamed-Entity Recognition

100% онлайн

Начните сейчас и учитесь по собственному графику.

Гибкие сроки

Назначьте сроки сдачи в соответствии со своим графиком.

Начальный уровень

Прибл. 22 часа на выполнение

Предполагаемая нагрузка: 2 - 3 h/Woche, insg. 6 Wochen...

Немецкий

Субтитры: Немецкий, Английский

Программа курса: что вы изучите

Неделя
1
3 ч. на завершение

Woche 1 - Wege in die digitale Welt

In der ersten Woche werden wir darüber sprechen, wie Texte digitalisiert und zum Beispiel in XML dargestellt werden können und was OCR (optical character recognition) für die Anwendung in der Praxis bedeutet. Wir befassen uns außerdem mit der Erstellung von Korpora und den Schwierigkeiten, denen wir dabei begegnen können. Viel Spaß!

...
3 видео ((всего 49 мин.)), 4 материалов для самостоятельного изучения, 2 тестов
3 видео
1.2 - Herausforderungen bei der Korpusakquisition16мин
1.3 - Digitalisierungszentrum ZB12мин
4 материала для самостоятельного изучения
Die Dozenten dieses MOOC's10мин
Guidelines zur Bearbeitung des MOOCs10мин
Lernziele Modul 15мин
Material Modul 110мин
2 практического упражнения
Was wissen Sie bereits zum Thema Digitalisierung?8мин
Testen Sie Ihr Wissen zum Thema Korpusakquisition8мин
Неделя
2
2 ч. на завершение

Woche 2 - Strukturierte und nachhaltige Repräsentation von Korpusdaten

In der zweiten Woche beschäftigen wir uns mit der strukturierten und nachhaltigen Repräsentation von Korpusdaten. Wir werden über die Markup Language XML sprechen und einige wichtige Standards zur Textrepräsentation kennenlernen. In der zweiten Hälfte dieses Moduls geht es anschließend um das Thema der automatischen Text- und Wortsegmentierung. Viel Spaß mit den Videos!

...
2 видео ((всего 45 мин.)), 3 материалов для самостоятельного изучения, 2 тестов
2 видео
2.2 - Textsegmentierung21мин
3 материала для самостоятельного изучения
Lernziele Modul 25мин
Einführungstext XML: Strukturierte und nachhaltige Repräsentation von Korpusdaten15мин
Material Modul 210мин
2 практического упражнения
XML und TEI P5: Wie viel wissen Sie bereits?12мин
Testen Sie Ihr Wissen zum Thema Textsegmentierung6мин
Неделя
3
4 ч. на завершение

Woche 3 - Eigenschaften von Korpora und grundlegende Analysemethoden

In der dritten Woche geht es um die wichtigsten Eigenschaften von Korpora, um grundlegende Analysemethoden in der Korpuslinguistik und Grundbegriffe wie Worthäufigkeiten, Kollokationen, N-Gramme. Im letzten Teil wird Ihnen Noah Bubenhofer noch einen Ausblick auf die visuelle und graphische Darstellung von Texteigenschaften geben. Viel Spaß!

...
3 видео ((всего 92 мин.)), 3 материалов для самостоятельного изучения, 3 тестов
3 видео
3.2 - Hands-on Korpusanalysen27мин
3.3 - Visualisierung und graphische Darstellung32мин
3 материала для самостоятельного изучения
Lernziele Modul 35мин
Visuelle Bergtour durch ein Kollokationsnetz10мин
Material Modul 310мин
2 практического упражнения
Theorie: Grundbegriffe der Korpuslinguistik6мин
Praxis: Korpusabfragen und Analysemethoden6мин
Неделя
4
2 ч. на завершение

Woche 4 - Automatische Korpusannotation mit computerlinguistischen Werkzeugen

In diesem Modul geht es um die automatische Korpus-Annotation mit linguistischen Informationen wie Part-Of-Speech-Tags (Wortarten) und Lemmas (Grundformen), aber auch um die Schwierigkeiten, die eine solche automatische Annotation mit sich bringen kann. Wir werden besprechen, wie die automatische Erkennung von Eigennamen oder geographischen Namen (Named Entities) abläuft und im dritten Teil noch auf die automatische Syntax-Analyse von Texten eingehen. Viel Spaß!

...
3 видео ((всего 63 мин.)), 3 материалов для самостоятельного изучения, 2 тестов
3 видео
4.2 - Erkennung, Klassifikation und Linking von Named Entities17мин
4.3 - Syntaktische Analyse16мин
3 материала для самостоятельного изучения
Lernziele Modul 45мин
Named Entities in der Praxis10мин
Material Modul 410мин
2 практического упражнения
Wortarten und Grundformen automatisch bestimmen8мин
Testen Sie Ihr Wissen zu NER und Syntaxanalyse10мин
4.8
Рецензии: 3Chevron Right

Лучшие отзывы о курсе Технологии обработки естественных языков в гуманитарных науках

автор: DHNov 19th 2017

Sehr gut strukturierter Kurs! Man lernt viele aktuelle Methoden, Begriffe und Tools kennen, die man in dne unterschiedlichsten Projekten anwenden kann! Ein zeitnaher Kurs zu einem spannenden Thema!

Преподаватели

Avatar

Martin Volk

Prof. Dr.
Institute of Computational Linguistics
Avatar

Noah Bubenhofer

Dr.
Institute of Computational Linguistics
Avatar

Simon Clematide

Dr. phil.
Institute of Computational Linguistics

О Цюрихский университет

Founded in 1833, the University of Zurich (UZH) is Switzerland’s largest university, with a cur­rent enrollment of over 26,000 students. Made up of seven faculties covering approximately 100 different subject areas, UZH is proud to offer the most comprehensive aca­demic program in the country....

Часто задаваемые вопросы

  • Зарегистрировавшись на сертификацию, вы получите доступ ко всем видео, тестам и заданиям по программированию (если они предусмотрены). Задания по взаимной оценке сокурсниками можно сдавать и проверять только после начала сессии. Если вы проходите курс без оплаты, некоторые задания могут быть недоступны.

  • Оплатив сертификацию, вы получите доступ ко всем материалам курса, включая оцениваемые задания. После успешного прохождения курса на странице ваших достижений появится электронный сертификат. Оттуда его можно распечатать или прикрепить к профилю LinkedIn. Просто ознакомиться с содержанием курса можно бесплатно.

Остались вопросы? Посетите Центр поддержки учащихся.