Klasifikacija ključnih besed iz bibliografskih enot

Prenesi PDF

Iz bibliografskih podatkov slovenskih raziskovalcev v sistemu COBISS ni preprosto določiti raziskovalnega področja, ki je obravnavano v bibliografskem viru. Podatek, iz katerega je mogoče razbrati raziskovalno področje, so ključne besede. Za cilj smo si postavili razvrščanje (klasificiranje) ključnih besed iz bibliografskih enot raziskovalcev. Za izhodišče smo izbrali klasifikacijo ARRS. Da bi dosegli najboljše rezultate, smo posebno pozornost namenili izbiri in pripravi besedil za strojno učenje. Za razvrščanje ključnih besed iz bibliografskih enot raziskovalcev smo uporabili orodje Oracle data miner za podatkovno rudarjenje. Izbrali smo metodo podpornih vektorjev, ki se uspešno uporablja pri klasifikaciji besedil.

Sorodne objave