Repozytorium publikacji - Politechnika Gdańska

Ustawienia strony

english
Repozytorium publikacji
Politechniki Gdańskiej

Treść strony

Parallel Computations of Text Similarities for Categorization Task

In this chapter we describe the approach to parallel implementation of similarities in high dimensional spaces. The similarities computation have been used for textual data categorization. A test datasets we create from Wikipedia articles that with their hyper references formed a graph used in our experiments. The similarities based on Euclidean distance and Cosine measure have been used to process the data using k-means algorithm. We describe the evaluation method used of the clustering quality as its parallel implementation. Finally we discuss achieved results, point some improvements and perspectives for future development. Proposed implementation can be used as evaluation task for measuring the relevancy of simulator described in Chapter.

Autorzy

Informacje dodatkowe

Kategoria
Publikacja monograficzna
Typ
rozdział, artykuł w książce - dziele zbiorowym /podręczniku w języku o zasięgu międzynarodowym
Język
angielski
Rok wydania
2013

Źródło danych: MOSTWiedzy.pl - publikacja "Parallel Computations of Text Similarities for Categorization Task" link otwiera się w nowej karcie

Portal MOST Wiedzy link otwiera się w nowej karcie