Yıl 2016, Cilt 13, Sayı 2, Sayfalar 71 - 108 2016-07-15

Colligational Patterns of Turkish Multi-Word Units
Türkçede Çok Sözcüklü Birimlerin İşlev Dizisi Örüntüleri

Colligational Patterns of Turkish Multi-Word Units

Yeşim Aksan [1] , Ümit Mersinli [2] , Serap Altunay [3]

253 235

In multi-word unit (MWU) extraction studies, most of the challenges for rich morphology languages like Turkish can be overcome by the study of how colligational filtering works in our minds, along with how statistical and collocational sorting affects the process. Based on the assumption that lexicalization of any given collocation as a MWU also requires compatibility to some lexical or morphosyntactic constraints, this study will present the morphosyntactic tendencies observed in colligational patterns of Turkish MWUs and discuss their implications on language-specific MWU filtering processes. The aim of the study is to discuss if in Turkish, associative strength is enough for a collocation to be lexicalized as a MWU or not. Another purpose of the study is to show some morphosyntactic and lexical constraints that may validate collocations to be lexical multi-word units in Turkish. The paper will also underscore the methodological perspectives of MWU identification valid for rich-morphology languages. To achieve these goals, we first extracted MWU candidates -trigrams- from a 10-million-word sub-corpus of Turkish National Corpus (TNC) by using Text-NSP (Banerjee & Pederson, 2011). After that, the 3-grams were annotated by using the NLP dictionary of TNC-tagger, and classified according to their colligational patterns and lexical categories of the MWU. Most frequently observed colligational patterns are argued to be morphosyntactic tendencies governing MWU lexicalization in Turkish. In this respect, the study aims to contribute to the understudied area of formulaic language in Turkish.

Çok sözcüklü birim (ÇSB) çıkarımı çalışmalarında, Türkçe gibi zengin biçimbilime sahip dillerde karşılaşılan pek çok güçlük, bu süreci etkileyen istatistik sıralamanın yanında, işlevsel ayıklamanın, zihnimizde nasıl işlediği üzerine çalışarak aşılabilir. Herhangi bir sözcük dizisinin ÇSB olarak sözlükselleşmesi için, bazı sözlüksel ve biçimsözdizimsel kısıtlamalara da uygun olması gerekeceği varsayımından hareketle, bu çalışma, Türkçe’de işlevsel örüntülerde gözlenen biçimsözdizimsel eğilimlere ve bu eğilimlere dayalı olarak, Türkçe’de ÇSB ayıklama sürecine ilişkin çıkarımlara değinecektir. Çalışmanın amacı, Türkçe’de bir sözcük dizisinin, ÇSB olarak sözlükselleşmesi için, içerdiği sözcükler arasındaki ilinti gücünün yeterli olmadığını göstermek ve bu sözcük dizilerinin kabul edilebilir ÇSB’ler olarak sözlükçemizde yer alması için gerekli olan biçimsözdizimsel ve sözlüksel kısıtlamaları tartışmaktır. Çalışma bu yönüyle, zengin biçimbilimli dillere özel bir ÇSB çıkarım yöntemiyle ilgili de bir bakış açısı sunmayı amaçlamaktadır. Belirtilen amaçlar doğrultusunda, öncelikle, Text-NSP (Banerjee & Pedersen, 2011) kullanılarak, Türkçe Ulusal Derlemi’nin 10 milyon sözcüklük bir alt-derleminden ÇSB adayları -üçlü diziler- çekilmiştir. Sonrasında, bu üçlü sözcük dizileri TUD-işaretleyicinin içerdiği Doğal Dil İşleme (DDİ) sözlüğü yardımıyla işaretlenmiş ve içerdikleri işlev dizileri ve sözcük türlerine göre sıralanmıştır. Sonuç olarak, bu en sık gözlenen işlev dizilerinin, Türkçe’de çok sözcüklü birimlerin sözlükçeye yerleşmesinde etken olan biçimsözdizimsel eğilimler olduğu savlanmıştır. Bu yönüyle çalışma, Türkçe’de fazlaca çalışılmayan kalıp dil kullanımı (İng. formulaic language) konusuna katkı sunmayı hedeflemektedir.

  • Ädel, A., & Erman, B.,Recurrent word combinations in academic writing by native and non-native speakers of English: A lexical bundles approach,81-92,2012,31
Konular Sosyal
Yayımlanma Tarihi 2016
Dergi Bölümü Makaleler
Yazarlar

Yazar: Yeşim Aksan
Kurum: Mersin University
Ülke: Turkey


Yazar: Ümit Mersinli
Kurum: Mersin University
Ülke: Turkey


Yazar: Serap Altunay
Kurum: Mersin University
Ülke: Turkey


Bibtex @araştırma makalesi { mersinjll299956, journal = {Dil ve Edebiyat Dergisi}, issn = {1304-6594}, eissn = {2149-0856}, address = {Mersin Universitesi}, year = {2016}, volume = {13}, pages = {71 - 108}, doi = {}, title = {Türkçede Çok Sözcüklü Birimlerin İşlev Dizisi Örüntüleri}, key = {cite}, author = {Mersinli, Ümit and Aksan, Yeşim and Altunay, Serap} }
APA Aksan, Y , Mersinli, Ü , Altunay, S . (2016). Türkçede Çok Sözcüklü Birimlerin İşlev Dizisi Örüntüleri. Dil ve Edebiyat Dergisi, 13 (2), 71-108. Retrieved from http://ded.mersindilbilim.info/issue/27091/299956
MLA Aksan, Y , Mersinli, Ü , Altunay, S . "Türkçede Çok Sözcüklü Birimlerin İşlev Dizisi Örüntüleri". Dil ve Edebiyat Dergisi 13 (2016): 71-108 <http://ded.mersindilbilim.info/issue/27091/299956>
Chicago Aksan, Y , Mersinli, Ü , Altunay, S . "Türkçede Çok Sözcüklü Birimlerin İşlev Dizisi Örüntüleri". Dil ve Edebiyat Dergisi 13 (2016): 71-108
RIS TY - JOUR T1 - Türkçede Çok Sözcüklü Birimlerin İşlev Dizisi Örüntüleri AU - Yeşim Aksan , Ümit Mersinli , Serap Altunay Y1 - 2016 PY - 2016 N1 - DO - T2 - Dil ve Edebiyat Dergisi JF - Journal JO - JOR SP - 71 EP - 108 VL - 13 IS - 2 SN - 1304-6594-2149-0856 M3 - UR - Y2 - 2016 ER -
EndNote %0 Dil ve Edebiyat Dergisi Türkçede Çok Sözcüklü Birimlerin İşlev Dizisi Örüntüleri %A Yeşim Aksan , Ümit Mersinli , Serap Altunay %T Türkçede Çok Sözcüklü Birimlerin İşlev Dizisi Örüntüleri %D 2016 %J Dil ve Edebiyat Dergisi %P 1304-6594-2149-0856 %V 13 %N 2 %R %U
ISNAD Aksan, Yeşim , Mersinli, Ümit , Altunay, Serap . "Türkçede Çok Sözcüklü Birimlerin İşlev Dizisi Örüntüleri". Dil ve Edebiyat Dergisi 13 / 2 (Temmuz 2016): 71-108.