Lempi (right_to_cry) wrote,
Lempi
right_to_cry

Разбирала ссылки, заодно решила поделиться с общественностью накопленным добром. Пост регулярно обновляется.


История и литература

http://svr-lit.niv.ru/ — материалы по литературе Средних веков и Возрождения. На сайте есть ссылки на другие периоды
http://feb-web.ru/ — русская литература и фольклор
http://cudl.lib.cam.ac.uk/collections/ — библиотека Кембриджа
http://www.vostlit.info/Texts/Dokumenty/index.phtml?id=2070  — средневековые исторические источники (на русском, к сожалению)
http://www.philol.msu.ru/~tezaurus/library.php?view=a — литературоведение
http://www.bartleby.com/211/ — история английской и американской литературы (CAMBRIDGE HISTORY OF ENGLISH AND AMERICAN LITERATURE)
http://www.esawyer.org.uk/about/index.html — Anglo-Saxon Charters
http://www.british-history.ac.uk/Default.aspx — British History
http://www.mediaevum.de/haupt2.htm — портал по медиевистике
http://www.mgh.de/ — Monumenta Germaniae Historica
http://www.regionalgeschichte.net/bibliothek/linksammlung/thematische-links/deutsche-landesgeschichte.html — Links zur Deutschen Landesgeschichte
http://www.libraryireland.com/about.php — free information on all aspects of Ireland



Корпуса, словари, атласы и монографии

http://www.ruscorpora.ru/ — нац. корпус русского языка
http://www.slavatlas.org/index.html — общеславянский лингвистический атлас
http://www.koeblergerhard.de/anwbhinw.html — словарь древненорвежского
http://www.gutenberg.org/ebooks/10625?msg=welcome_stranger — A Concise Dictionary of Middle English
http://quod.lib.umich.edu/c/cme/ — Middle English texts
http://www.utexas.edu/cola/centers/lrc/ — материалы по и.-е. языкам
http://bosworth.ff.cuni.cz/ — словарь древнеанглийского
http://www.natcorp.ox.ac.uk/ — The British National Corpus
http://www.dwds.de/  — немецкий словарь + корпуса
http://www.mhdwb-online.de/index.html — словарь средневерхненемецкого
http://www.lextutor.ca/concordancers/concord_g.html — немецкий корпус
http://www.atlas-alltagssprache.de/  — Atlas zur deutschen Alltagssprache
http://www.idiotikon.ch/ — словарь швейцарского немецкого
http://woerterbuchnetz.de/DWB/ — словарь братьев Гримм (онлайн)
http://alexmidd.co.uk/Marmaria/ohg/ohg_primer_contents.htm#contents — краткий обзор древневерхненемецкого (с текстами)
http://korpora.zim.uni-due.de/Fnhd/quellen.html — Quellenverzeichnis des Digitalen Fruehneuhochdeutschkorpus
https://abdn.ac.uk/skaldic/db.phpSkaldic Poetry of the Scandinavian Middle Ages
http://www.ethnologue.com/ — статистика по языкам мира
http://www.alt.germ.uni-tuebingen.de/abteilungen/mediaevistik/Materialien/Merkverse/index.html#Abteilung1 — Mediävistische Merkverse (мнемонические стихи на тему истории немецкого языка)
http://www.utexas.edu/cola/centers/lrc/books/piep00.html — Proto-Indo-European Phonology by Winfred P. Lehmann
https://korpling.german.hu-berlin.de/annis3/ — корпус древневерхненемецкого
http://mhdbdb.sbg.ac.at/index.en.html — Middle High German Conceptual Database.



Тексты

http://www.fordham.edu/Halsall/sbook.asp — средневековые тексты (по большей части в переводах на современные языки)
http://www.fbit.ru/free/myth/texty/mabinogi/home.htm — Мабиногион (на русском)
http://bestoflegends.org/index.html — европейские легенды
http://titus.uni-frankfurt.de/indexe.htm?/texte/texte2.htm#mndl — корпус текстов на индоевропейских языках
http://www.maryjones.us/ctexts/index.html — кельтские тексты (с сопроводительными переводами на английский)
http://celt.ucc.ie/index.html — ирландские тексты
http://www.ucd.ie/tlh/ — ирландские тексты
http://www.gutenberg.org/cache/epub/2383/pg2383.html —The Canterbury Tales
http://www.librarius.com/cantales.htm — они же (оригинал + построчный перевод)
http://quod.lib.umich.edu/cgi/t/text/text-idx?c=cme;idno=MaloryWks2 — «Смерть Артура», оригинал (в общем корпусе среднеанглийских текстов)
http://www.beowulfepic.com/ — сайт о «Беовульфе»
http://www.textlog.de/philosophie.html — тексты по философии (немецкий)
http://www.russianplanet.ru/filolog/epos/index.htm — европейские и восточные эпосы (русский)
http://www.hs-augsburg.de/~harsch/augustana.html — тексты на латыни, греческом, английском, немецком, французском, итальянском
http://lutherbibel.net/ — Библия Лютера
http://www.handschriftencensus.de/ — немецкие средневековые рукописи
http://anglosaxonpoetry.camden.rutgers.edu/ — Old English poetry (в переводе на современный английский)

Разное

http://at.mansbjorkman.net/ — письменности Амана (+ шрифты!)
http://conjugation.com/ — спряжение глаголов для ленивых (разные языки)
http://baharna.com/celtic/index.htm#bibliography — краткий путеводитель по Туата Де Дананн (со ссылками на литературу)




NLP
Sprachtechnologie in den Digital Humanities https://www.coursera.org/learn/digital-humanities/home/welcome
ПО для построения частотных списков лексики: AntConc http://www.laurenceanthony.net/software/antconc/.

Морфологические частеречные разметчики:
FreeLing http://nlp.lsi.upc.edu/freeling/
Stanford Log-linear Part-Of-Speech Tagger http://nlp.stanford.edu/software/tagger.shtml
TreeTagger http://corpus.leeds.ac.uk/mocky/
FreeLing: http://nlp.lsi.upc.edu/freeling/index.php?option=com_content&task=view&id=18&Itemid=47

Ресурсы и библиотеки для реализации FSA и FST
PC-Kimmo - http://www-01.sil.org/pckimmo/
foma - https://code.google.com/p/foma/
Xerox Finite-State Tool (Lauri Karttunen, Tamás Gaál, and André Kempe) - http://www.cis.upenn.edu/~cis639/docs/xfst.html
FST Morphology - http://web.stanford.edu/~laurik/fsmbook/home.html

Web scraping (Texte von HTML Seiten extrahieren)
BootCaT (Tool, um eigene Korpora basierend auf WEB-Inhalten zu erstellen)
XML Einführung (Tutorial w3schools)
Инструменты для немецкого языка https://pub.cl.uzh.ch/wiki/public/kitt
Wortsegmentierung an einem deutschen Text (interaktive Übung im CLab)
TreeTagger (Part-of-Speech-Tagger für verschiedene Sprachen)
Tokenisierung (CLab)
TreeTagger (Part-Of-Speech Tagger für verschiedene Sprachen)
TüBa (Baumbank aus syntaktisch-annotiertem Korpus)
Tiger Treebank (POS-Tagging und syntaktische Analyse)
STTS Tagset (Stuttgart-Tübingen-Tagset)
Porter Stemmer (Stemming zum Abtrennen morphologischer Flexionsendungen)
Durm Lemmatizer (Lemmatisierung von Substantiven)
CONNEXOR-Tagger (NLP - Natural Language Processing - Tagger)
GeoNames (Geographische Datenbank für Ortsnamen)
Wikidata (hilfreiche Datenbank für Named Entity Recognition)
TimeML (Markup Language für Zeitausdrücke)
Mate Tools (Toolkit für statistisches Natural Language Processing)
Conditional Random Fields (Tutorial CLab zum Taggen von sequenziellen Daten)
Universales Dependenzformat (multilinguale Baumbanken mit Annotationen)
CONNEXOR-Tagger (NLP - Natural Language Processing - Tagger)
TIGER-Treebank (POS-Tagging und syntaktische Analyse)
ParZu (The Zurich Dependency Parser for German)
WebAnno (und ein dazugehöriges YouTube Tutorial)
EXMARaLDA (Annotation von digitalen Audio- und Videodaten)
Arborator (Annotation von syntaktischen Dependenzen)
RSTTool (Annotation der rhetorischen Textstruktur)
ANNIS Framework (Suche, Visualisierung und Export von annotierten Korpora)
Artigo (Annotation von kunsthistorischen Bildern)
TypeWright (Manuelles Validieren von OCR für englische Literatur)
Codeswitching (Wechsel zwischen zwei Sprachen)
EM-Algorithmus (Expectation Maximization)
lingua-ident (Spracherkennungs-Tool)
InterText (Alignment-Tool mit graphischer Benutzeroberfläche für Satzalignierung in parallelen Korpora)
HunAlign (Alignment-Tool für Satzalignierung in parallelen Korpora)
BleuAlign (Alignment-Tool für Wortalignierung in parallelen Korpora)
GIZA++ (Alignment-Tool für Wortalignierung in parallelen Korpora)
The Classical Language Toolkit http://cltk.org/




Python
Learn to Program: The Fundamentals https://www.coursera.org/learn/learn-to-program/home/welcome
NLTK https://www.nltk.org/book/ch01.html
langid.py (Python-Programm zur automatischen Spracherkennung von Texten)
Основы программирования на Python https://www.coursera.org/learn/python-osnovy-programmirovaniya/home/welcome
Интерактивный учебник языка Питон http://pythontutor.ru/




XML
Основы XML для начинающих пользователей https://www.ibm.com/developerworks/ru/library/x-newxml/index.html
https://tei-c.org/
https://msiter.ru/tutorials/uchebnik-xml-dlya-nachinayushchih/chto-takoe-xml
XML - Einführung (Extensible Markup Language Tutorial)
XML - Syntax (w3schools)
Zeichenkodierung (ASCII, Unicode, UTF-8, UTF-16, UTF-32)
TextGrid (TEI-XML Editor für digitales Editieren und Publizieren)




Визуализация

OpenLayers 3
Leaflet (JavaScript Library)
Gephi (Visualisierungssoftware für Graphen und Netzwerke)
GraphViz (Graph Visualisierungssoftware)
D3.js (Visualisierung mit JavaScript)
P5.js (Visualisierung mit JavaScript)
Processing (Visualisierungssoftware)
Bubenhofer: Geokollokationen.
Nachtrag: Vega, Lyra, Polestar und Voyager. (Vega ist eine abstrakte Beschreibungssprache für Visualisierungen, die dann automatisch in HTML 5, Canvas oder SVG realisiert werden)
Sprachtechnologie in den Digital Humanities https://www.coursera.org/learn/digital-humanities/home/welcome
Tags: Dеr Dаtiv ist dem Gеnitiv sein Tоd, translation is a myth, Éire, дети тумана, лингвистика, понедельник начинается в субботу, тайны третьей планеты, язык мой
Subscribe
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

  • 6 comments