Skip to content
Başak Tepe edited this page Oct 17, 2025 · 36 revisions

Turkish Parliamentary Corpus Analysis (1920-2025)

This repo is contributed by @iremnuy and @basak-tepe, serving as the central hub for our project's documentation and collaboration.

We are focusing on analyzing a comprehensive corpus of Turkish parliamentary proceedings spanning from 1920 to 2024. Currently our focus is on semantic shift and MP-speech topic relations.

We may expand the analysis in future phases by integrating European parliamentary datasets for comparative research.

Roadmap

Stage Start Date End Date Status
Research, data scraping, EDA CmpE 491 and Summer Period Complete
PoC of semantic shift, topic analysis, and visualization after 2007 15.09.2025 15.10.2025 Complete
Process and include more data (1960-2007) 15.10.2025 31.10.2025
Complete semantic shift and topic-mp analysis 31.10.2025 12.11.2025
Midterm Report 12.11.2025
Work on visualization 12.11.2025 10.12.2025
Final Report 10.12.2025

Right now, we would like to seek answers to following:

# Over the course of years:
1 Which concepts, notions, or terms were subject to semantic shift?
2 Which subjects persisted and were dominant?
3 Which subjects did not come up often and were overlooked?
4 Which MPs had a political stance that persisted?
5 Which MPs had a political stance that changed?
6 Which MPs talked about which subject?
7 Which MPs did not talk about which subject?
8 Which MPs contributed to the discourse the most and were the most active?
9 Which MPs did not contribute to the discourse often and were on the passive side?
10 Which MP talked about which subject dominantly?
11 Which MP avoided or did not contribute to which subjects?

The following is an example of the information unit "Açıklama" that we use for analysis from parliamentary texts.

{
"_index": "parliament_speeches",
"_id": "term26-year3-session99-12",
"_score": 7.6840296,
"_source": {
"session_id": "term26-year3-session99",
"term": 26,
"year": 3,
"file": "tbmm26074099.txt",
"speech_no": 12,
"province": "Erzurum",
"speech_giver": "Mustafa Ilıcalı",
"speech_title": "Filistin’de yaşanan katliam karşısında Cumhurbaşkanı, Hükûmet ve Meclisin Türkiye’nin yerini tam olarak ortaya koyduğuna,
sözde barışı, demokrasiyi, insan haklarını savunanların Filistin’deki çığlığa sessiz kaldıklarına ve Süper Lig yolunda Ümraniyespor’la 
maç yapacak olan Erzurumspor’a başarılar dilediğine ilişkin",
"page_ref": "100",
"content": "MUSTAFA ILICALI (Erzurum) – Teşekkürler Başkanım.\n     ABD’nin Kudüs’te İsrail Büyükelçiliği açması kararı sonrası Filistinli 
kardeşlerimiz sokağa\ndöküldü. Yapılan haklı mücadelelerini bizler de destekliyoruz. Protestolara karşılık katil İsrail askerleri\ngerçek 
mermiler kullanarak katliam yaptılar. 60 Filistinli Müslüman kardeşimiz yaşamını yitirdi, 2\nbinden fazla kardeşimiz yaralandı. Başta 
Cumhurbaşkanımız Sayın Recep Tayyip Erdoğan olmak\nüzere, Hükûmetimiz ve partimiz, Meclisimiz İsrail’in bu tutumu karşısındaki yerimizi tam 
olarak\nortaya koydu.\n     Ben de buradan ifade etmek isterim ki sözde barışı, demokrasiyi, insan haklarını savunanlar\nFilistin’deki çığlığa 
sessiz kalıyorlar. Yapılan bu çifte standart ve yapılan katliam tarihin sayfalarında\nyerini mutlaka alacaktır. Demokrasi savunucusu, 
medeniyet timsali Batı’nın gelecek nesillere bu\ndurumu nasıl izah edeceğini çok merak ediyorum. Cumhurbaşkanımızın her platformda dile 
getirdiği\nüzere dünya 5’ten büyüktür ve er geç adalet yerini bulacaktır.\n      (Mikrofon otomatik cihaz tarafından kapatıldı)\n     MUSTAFA
ILICALI (Erzurum) – Her devrin bir firavunu var ise elbette bir Musa’sı da vardır.\nABD’nin tutumunu ve katil siyonist rejimin Müslüman 
kardeşlerimize karşı uyguladığı katliamı\nnefretle kınıyorum. Yaşasın Filistin halkının direnişi diyorum.\n    Bugün, Süper Lig yolunda 
Ümraniye Spor’la önemli bir maç yapacak olan Erzurumspor’a da\nbaşarılar diliyorum. (AK PARTİ sıralarından alkışlar)\n      BAŞKAN – Biz de 
her iki takıma başarılar diliyoruz Sayın Ilıcalı.\n      Teşekkür ederim.\n      Sayın Dilipak? Yok.\n      Sayın Şimşek…"
}
}

This project is supervised by @uskudarli

Risks

OCR Mistakes

Weekly Progress (CMPE492)

📌 Table of Contents

📌 Team Information

🛠 Project Management

  • We use Notion for organizing tasks and documentation.

👥 Team Members

📅 Weekly Meetings

  • Every Monday @ 17:00

🎓 Advisor Meeting

  • Every Wednesday 18.00

📚 Research & Resources

Parliament Studies

Digital Humanities

Clone this wiki locally