Year 2017, Volume 14 , Issue 2, Pages 1 - 14 2017-07-15

Güncel Biçimiyle Sözlü Türkçe Derlemi: Teknik ve İstatistiksel Bir Çözümleme

Güneş ACAR [1]


Bu makalenin öncelikli amacı Prof. Dr. Şükriye Ruhi'nin öncülüğünde
geliştirilen ODTÜ Sözlü Türkçe Derlemi'nin (STD) oluşturulmasında
kullanılan teknolojileri ve iş akışlarını açıklamaktır. STD'nin
oluşturulmasında merkezi bir konumda olan Web Tabanlı Derlem Yönetim
Sistemi, kayıtların çeviriyazısı, kontrolü ve yayınlanmasını kolaylaştıran bir
dizi iş akışını, veri biçimini ve dışa aktarma seçeneklerini barındırmaktadır.
Derlem yönetim sistemi, proje araştırmacıları tarafından Python programlama
dili kullanılarak geliştirilmiş olup, farklı rollere sahip proje üyelerinin
çevrimiçi bir arayüzden uzaktan ortaklaşa çalışabilmelerini sağlamaktadır.
STD kapsamında 286,391 sözcüklük konuşmanın çeviriyazısı tamamlanmış
ve kontrolden geçmiş, 79,189 sözcüklük konuşma ise bütünüyle yayına hazır
hale getirilmiştir. Makalede derlemdeki bu kayıtlarla ilgili genel istatistikler
sunularak STD'nin daha geniş çaplı bir sürümü için yapılması gerekenler
tartışılmaktadır.

Sözlü Derlem, Derlem Yönetim Sistemi, EXMARaLDA
  • Acar, M. G. C. & Eryılmaz, K. (2010). Sözlü Derlem İçin Web Tabanlı Yönetim Sistemi. 24. Ulusal Dilbilim Kurultayı Bildiri Kitabı. 17-18 Mayıs 2010, 437-443.
  • DiPierro, M. (2009). Web2py Enterprise Web Framework. Wiley Publishing.
  • DiPierro, M. (2011). Web2py for scientific applications. Computing in Science & Engineering, 13(2), 64-69.
  • Schmidt, T. (2004). Transcribing and annotating spoken language with EXMARaLDA. In Proceedings of the LREC-Workshop on XML based richly annotated corpora, Lisbon 2004.
  • Ruhi, Ş., Işık-Güler, H., Hatipoğlu, Ç., Eröz-Tuğa, B., & Çokal Karadaş, D. (2010). Achieving representativeness through the parameters of spoken language and discursive features: the case of the Spoken Turkish Corpus. Language Windowing through Corpora. Visualización del lenguaje a través de corpus. Part II. Universidade da Coruna, 789-799.
  • TÜİK. İl, yaş grubu ve cinsiyete göre nüfus. Erişim Adresi: http://www.tuik.gov.tr/PreIstatistikTablo.do?istab_id=945. Erişim tarihi: 26/06/2017.
Subjects Social
Journal Section Makaleler
Authors

Author: Güneş ACAR
Institution: KU Leuven
Country: Belgium


Dates

Publication Date : July 15, 2017

APA Acar, G . (2017). Güncel Biçimiyle Sözlü Türkçe Derlemi: Teknik ve İstatistiksel Bir Çözümleme . Dil ve Edebiyat Dergisi , 14 (2) , 1-14 . Retrieved from http://ded.mersindilbilim.info/en/pub/issue/33365/323795