Studentské práce
Detail studentské práce
Název: | Pokročilé metody ve vyhledávání informací |
---|---|
Typ práce: | Diplomová práce |
Obor: | |
Rok zadání: | 2015/2016 |
Zadáno: | zadáno Veronika Řežábková |
Dokončeno: | |
Zadavatel: | Zajícová Lucie |
Detail
Zadání:
1.Prostudujte teoretické základy oboru vyhledávání informací, typy používaných metod a jejich vlastnosti, způsoby vyhodnocení výsledků vyhledávání informací.
2.Detailně se seznamte se základními metodami pro vyhledávání informací – vektorový model, jazykové modelování a pravděpodobnostní modely.
3.Nastudujte si pokročilé metody pro vyhledávání informací, mezi nimi zejména LSA (Latent Semantic Analysis ), LDA (Latent Dirichlet Allocation ) a možnost využití neuronových sítí (zejména RNN a LSTM) v oblasti vyhledávání informací. Metody porovnejte a popište jejich výhody a nevýhody a předpokládané zlepšení oproti základním metodám v konkrétně řešeném problému.
4.Implementujte v programovacím jazyku Python jednu ze základních metod pro vyhledávání informací a některou z pokročilých metod vybranou na základě porovnání jako nejlepší pro konkrétní problém vyhledávání v kolekci automatických přepisů řeči.
5.Vyhodnoťte výsledky testovaných metod a porovnejte je.
Doporučená literatura:
MANNING, Christopher D., RAGHAVAN, Prabhakar a SCHÜTZE, Hinrich. Introduction to information retrieval. 1st pub. New York: Cambridge University Press, 2008. xxi, 482 s. ISBN 978-0-521-86571-5.
BAEZA-YATES, R. a RIBEIRO, Berthier de Araújo Neto. Modern information retrieval. Harlow: Addison-Wesley, 1999. xx, 513 s. ISBN 0-201-39829-X.
Thomas K Landauer and Susan Dumais (2008) Latent semantic analysis. Scholarpedia, 3(11):4356.
Wei, Xing. Topic models in information retrieval. ProQuest, 2007.