Flag Counter
AKILLI SİSTEMLER VE UYGULAMALARI DERGİSİ
JOURNAL OF INTELLIGENT SYSTEMS WITH APPLICATIONS
J. Intell. Syst. Appl.
E-ISSN: 2667-6893
Creative Commons License This work is licensed under a Creative Commons Attribution 4.0 International License.

Ontology Based Tweet Classification

Ontoloji Desteğiyle Tweet Sınıflandırma

How to cite: Yaman NB, İyican ME, Diri B. Ontology based tweet classification. Akıllı Sistemler ve Uygulamaları Dergisi (Journal of Intelligent Systems with Applications) 2018; 1(2): 157-161. DOI: 10.54856/jiswa.201812047

Full Text: PDF, in Turkish.

Total number of downloads: 621

Title: Ontology Based Tweet Classification

Abstract: This study aims to develop a system that classifies tweets by their subject and implement it as a mobile application. Tweets from user's home timeline are classified into topics taken from the user. Classification is done by using the ontologies of the topics'. Wikipedia pages and TDK definitions of the terms are used while creating the ontologies. Links referencing other Wikipedia pages that found in the terms' Wikipedia page are taken as ontological relations. Strength of these relations are calculated using the Wikipedia descriptions and TDK definitions. Ontology of the topic is created using terms with strong relations. Tweets' relations with ontologies are calculated. Tweets are placed under the topics they are most related to. It is seen that the proposed algorithm is only suitable to classify tweets into maximum of five classes as a result of this study. Three reasons could be observed. First, tweets don't contain enough distinctive words for this algorithm to work. Second, sources chosen to create ontologies don't contain words that are frequently used in daily lives and frequently present in tweets. Third, increasing class count decreases the threshold which tweets' scores has to surpass to be included in a class, therefore causing tweets to be classified into irrelevent classes.

Keywords: Ontology; ontological relations; Wikipedia; Twitter; classification


Başlık: Ontoloji Desteğiyle Tweet Sınıflandırma

Özet: Bu çalışma, tweetleri konularına göre sınıflandıran bir sistem geliştirmeyi ve bu sistemin bir mobil uygulama olarak gerçeklenmesini amaçlamaktadır. Kullanıcının ana zaman akışındaki tweetler, kullanıcıdan alınan konu başlıklarına göre sınıflandırılmıştır. Sınıflandırma işlemi konu başlıklarının ontolojileri kullanılarak gerçekleştirilmiştir. Ontolojiler oluşturulurken, kavramların Vikipedi sayfa açıklamaları ve TDK tanımları kullanılır. Kavramların Vikipedi sayfa açıklamalarında bulunan, başka Vikipedi sayfalarına referans veren bağlantıların, ontolojik bağlantılar olduğu kabul edilir. Vikipedi sayfa açıklamaları ve TDK tanımları kullanılarak, bu bağlantıların bağ kuvveti hesaplanır. Kuvvetli ontolojik bağları olan kavramlardan, konu başlığının ontolojisi oluşturulur. Tweetlerin, ontolojiler ile ilintililikleri ölçülür.Tweetler, ilintili oldukları konu başlıkları altında kullanıcıya sunulurlar. Çalışmalar sonucunda, önerilen bu algoritmanın, tweetleri en fazla beş sınıf için sınıflandırmaya uygun olduğu görülmüştür. Bunun genel olarak üç sebebi olduğu gözlemlenmiştir. Birincisi, tweetlerin içeriğindeki kelimelerde konuları yeterli sayıda ayırt edici kelime bulunamamaktadır. İkincisi, ontolojilerin oluşturulması için seçilen kaynaklarda, tweetlerde çokca geçen ve günlük hayatta kullanılan kelimeler kullanılmamaktadır. Üçüncü olarak, sınıf sayısının artması, tweetlerin sınıflara girebilmesi için aşmaları gereken puan eşik değerinin düşmesine, bu durum da birbiri ile ilişkisi olmayan tweetlerin sınıflara yerleşmesine sebep olmaktadır.

Anahtar kelimeler: Ontoloji; ontolojik ilişkiler; Wikipedi; Twitter; sınıflandırma


Bibliography:
  • Statista. Twitter: Number of monthly active users 2010-2017. 2017. Retrieved from https://www.statista.com/statistics/282087/numberof-monthly-active-twitter-users/ on June 28, 2017.
  • Adali S, Sonmez AC. Integrating ontology based information extraction and document structure analysis for event extraction and entity recognition. itudergisi Part D: Engineering 2011; 10(3): 27-36.
  • Tellioglu A, Rahmet F, Diri B. Document classification using ontology graph. In Signal Processing and Communication Application Conference (SIU), May 16-19, 2016, Zonguldak, Turkey, pp. 385-388.
  • Mayda I. Text classification with word trajectories. MSc Thesis, Yildiz Technical University, 2016.
  • Giray G. Development of an ontology-based semantic relatedness measurement method and its application to automatic measurement of text coherence. PhD Thesis, Yildiz Technical University, 2011.