marcinmilkowski.pl
Korpusy
  Odnośnik Odsłony
  Link   OPUS - an open source parallel corpus
Wolnodostępne korpusy równoległe (europarlament, EMEA, KDE, napisy do filmów)
653
  Link   Leeds collection of Internet corpora
Między innymi korpus polski.
714
  Link   Analizator leksykalny języka polskiego Stanisława Galusa
Program zawiera słownik morfologiczny w źródłowej postaci (plik tekstowy).
730
  Link   MyMemory
Coś między korpusem a słownikiem: sieciowa, wolnodostępna pamięć tłumaczeń
934
  Link   LAGUN Corpus
Wielojęzyczny korpus językowy online (polski, baskijski, angielski, francuski, hiszpański)
1023
  Link   Korpus tekstów staropolskich
Stosunkowo niewielki korpus tekstów staropolskich w formacie TEI, bez anotacji morfosyntaktycznych.
1004
  Link   JRC-Acquis Multilingual Parallel Corpus
Zawiera także tłumaczenia polskie. Obszerny, dostępny w postaci źródłowej.
907
  Link   Lexware Culler
Mało znany korpus języka polskiego z wyszukiwarką online (trzeba wybrać Polish Misc z listy rozwijanej w polskim górnym rogu)
1024
  Link   Korpus referencyjny języka polskiego PELCRA
Projekt PELCRA ma na celu stworzenie korpusu języka polskiego obejmującego ponad 100 milionów segmentów słów tekstu. Korpus bez anotacji morfosyntaktycznych, obecnie serwer w konserwacji (odsyła do innej kopii w sieci).
963
  Link   Korpus słownika frekwencyjnego
Korpus słownika frekwencyjnego polszczyzny współczesnej  zestaw tekstów zebranych w latach 1963-1967 na potrzeby badań nad częstością występowania wyrazów w języku polskim.
953
  Link   Korpus PWN
Korpus PWN - czyszczony z błędów, mniej obszerny od IPI PAN, dostępny tylko częściowo bezpłatnie.
1027
  Link   Korpus IPI PAN
Korpusy IPI PAN, obszerne i wolnodostępne, ze znakomitą wyszukiwarką Poliqarp.
1029