Skip to content

Studentské práce

Detail studentské práce

Title: Zpracování rozsáhlých textových dat
Typ práce: Bakalářská práce , Diplomová práce
Obor:
Rok zadání:
Zadáno: volné
Dokončeno:
Investor: Švec Jan

Detail

Zpracování rozsáhlých textových dat

Pro účely většiny praktických úloh z oblasti rozpoznávání řeči je nutné sestavit rozsáhlý textový korpus pro sestavení tzv. jazykového modelu. V současné době na KKY běží projekt Jazykového modelování z webu, který obsahuje řádově gigabajty textových dat určených pro automatické zpracování a využití jako trénovacích dat v úlohách modelování  jazyka.

Předmět DP/BP

Výzkumná práce v oblasti zpracování rozsáhlých textových dat, např. zpracování "syrových" dat z webu, označení pojmenovaných entit, sumarizace textu, analýzy tématu a další

Požadavky na studenta

  • Spolehlivost
  • Schopnost a ochota programovat a testovat algoritmy v jazyce Python