A Magyar Nemzeti Szövegtár (MNSZ) munkálatai 1998 elején kezdõdtek el a Magyar Tudományos Akadémia Nyelvtudományi Intézetének Korpusznyelvészeti Osztályán Váradi Tamás vezetésével.
Az MNSz nemcsak a Magyarországon beszélt nyelvet, hanem a határon túli magyar nyelvváltozatokat is feldolgozza. Az MNSz jelenleg kb. 154 millió szövegszót tartalmaz, amely 2005 végégig kiegészül a nyelvi irodák munkatársai által Szlovákiában, Ukrajnában, Romániában és Szerbiában összegyûjtött, mintegy 15 millió kisebbségi helyzetben használt szövegszóval. Az erdélyi iroda munkatársai 6 millió szövegszót, a felvidékiek 4 millió szövegszót, a kárpátaljaiak 3 millió szövegszót, Szerbiából és Horvátországból 2 millió szövegszót gyûjtöttek össze.
Az összegyûjtött szavak a magyar nyelv jellegzetes megnyilvánulásainak reprezentánsai.
A részleteket lásd:
http://corpus.nytud.hu/mnszworkshop/workshop.html
SzSZ