Translate

venerdì 10 maggio 2024

Sull'arabo coranico

A differenza di quanto molti pensano all'esterno del mondo islamico, ma in parte anche all'interno, l'arabo coranico non è la lingua oggi parlata dagli arabofoni di ogni latitudine, né l'artificiale lingua araba standard moderna, ovvero la fuṣḥā, e addirittura neanche quella classica letteraria, la fuṣḥā at-turāthīyah. Certo, si basano tutte sull'arabo coranico, distanziandosene progressivamente, ma questo è considerabile a tutti gli effetti come una lingua ormai solo liturgica. Generalizzando, si dice che l'arabo utilizzi un enorme vocabolario di milioni di termini, comprensibile andando il mondo arabofono dalla Siria alle isole Comore e dall'Oman alla Mauritania, mentre si stima (poiché il concetto di parola singola nella lingua araba è vago e un calcolo definitivo non si è ancora imposto) che l'arabo coranico sia composto da un vocabolario di circa 7mila diversi termini, contando tutte le possibili varietà ascrivibili allo stesso lemma. Fra questi, alcuni si ripetono talmente tante volte che secondo una consolidata tradizione basta conoscerne qualche centinaio (sottintendendo la conoscenza della grammatica araba) per comprendere il significato letterale dell'80% del testo coranico. Allego le statistiche e il parere in merito dato da Kais Dukes (رَحِمَهُ اللَّهُ), docente di linguistica computazionale presso l'Università di Leeds e autore del Quranic Arabic Corpus, ad oggi una delle risorse più complete per le statistiche linguistiche sul Corano: 

Total number of space-seperated words = 77,430

Number of *unique* surface forms (i.e. space-separated word-forms including clitics) = 18994

Number of unique words by *stem* = 12183

Number of unique words by *root* = 1685 (not necessarily a great metric for unique word counting, e.g. pronouns have no Semitic root)

Number of unique words by *lemma* = 3382 (excluding verbs, and other words where lemma is not annotated).

[...]

As an estimate, I would say that there are at most 7,000 unique "words" in the Quran in the sense of what you would need to have a lexicon with wide-ranging coverage for the Quran. Something also interesting to note, is the Zipfian distribution. A handful of words (e.g. the top 100 words) will cover a very large percentage of the actual Quran, i.e. most verses. (the 80/20 rule).

Fonte: Number of Unique Words in the Quran (quickestwaytoquran.blogspot.com)