Vox Romanica
vox
0042-899X
2941-0916
Francke Verlag Tübingen
10.24053/VOX-2025-003
vox841/vox841.pdf0216
2026
841
Kristol De StefaniArPeR. Un corpus digitale dei periodici dialettali romani tra secondo Ottocento e primo Novecento
0216
2026
Martina Ludovisihttps://orcid.org/0009-0006-9777-3553
La contribution vise à décrire les objectifs et les premiers résultats du projet ArPeR – Archivio dei Periodici Romaneschi. Le projet vise à créer des archives numériques en libre accès réunissant les périodiques en dialecte romain publiés entre 1870 et 1920, en s’appuyant à la fois sur des matériaux déjà numérisés et sur de nouvelles reproductions photographiques. La plateforme, qui représente le produit numérique du projet ArPeR, sera accessible au début de l’année 2026 et permettra d’effectuer des recherches avancées dans le corpus en ciblant l’auteur, le périodique, la date et les formes linguistiques. Le projet constitue une ressource précieuse pour la recherche historique et littéraire, et a l’ambition de devenir un outil de référence pour l’étude du romanesco post-unitaire. Les matériaux seront librement consultables et réutilisables selon les principes FAIR.
vox8410051
DOI 10.24053/ VOX-2025-003 Vox Romanica 84 (2025): 51-67 ArPeR. Un corpus digitale dei periodici dialettali romani tra secondo Ottocento e primo Novecento* Martina Ludovisi (Università di Perugia) https: / / orcid.org/ 0009-0006-9777-3553 Résumé: La contribution vise à décrire les objectifs et les premiers résultats du projet ArPeR - Archivio dei Periodici Romaneschi . Le projet vise à créer des archives numériques en libre accès réunissant les périodiques en dialecte romain publiés entre 1870 et 1920, en s’appuyant à la fois sur des matériaux déjà numérisés et sur de nouvelles reproductions photographiques. La plateforme, qui représente le produit numérique du projet ArPeR , sera accessible au début de l’année 2026 et permettra d’effectuer des recherches avancées dans le corpus en ciblant l’auteur, le périodique, la date et les formes linguistiques. Le projet constitue une ressource précieuse pour la recherche historique et littéraire, et a l’ambition de devenir un outil de référence pour l’étude du romanesco post-unitaire. Les matériaux seront librement consultables et réutilisables selon les principes FAIR. Parole chiave: Romanesco, Archivio dei Periodici Romaneschi, Pubblicistica romana postunitaria 1. Introduzione Lo scopo del presente contributo è informare sull’avvio del progetto « ArPeR . Archivio dei periodici romaneschi» che è finalizzato alla creazione di un archivio digitale open access dei periodici dialettali romani pubblicati tra il 1870 e il 1920*. Il progetto * Il progetto ArPeR è stato avviato il 1 ° agosto 2024 con il sostegno del Fondo Nazionale Svizzero per la Ricerca Scientifica nell’ambito delle borse PostdocMobility (2024-2026, N° P500PH_222332). Come si vedrà più avanti, ArPeR coopera con la Biblioteca Nazionale Centrale di Roma e con l’Archivio Capitolino. Si ringraziano, oltre ai direttori e ai bibliotecari, Vincenzo Faraoni (La Sapienza, Università di Roma), Michele Loporcaro (Universität Zürich), Roman Sosnowski (Università Jagellonica di Cracovia) e Giulio Vaccaro (Università degli Studi di Perugia) che si sono resi disponibili a prestare consulenza scientifica. Sono molto grata a Eleonora Delfino e Carolina Bianchi per i loro commenti e suggerimenti a una versione precedente di questo lavoro presentata al XXXI Congrès international de linguistique et de philologie romanes (Lecce, 30 giugno-5 luglio 2025). Ringrazio infine i due revisori anonimi per le loro osservazioni. La scelta dell’arco cronologico 1870-1920 riflette la fase in cui, come si vedrà nel §3, il romanesco mostra significativi mutamenti strutturali, sia convergenti verso lo standard sia divergenti e antiitaliani (cf. Faraoni 2021). 52 Martina Ludovisi DOI 10.24053/ VOX-2025-003 Vox Romanica 84 (2025): 51-67 coinvolge diversi collaboratori dell’Università degli Studi di Perugia (Melissa Bertolini Rodrigues, Elisa Endemini, Giorgia Falbo, Gaia Mammarella), un’unità tecnica coordinata da Fabrizio Nicolò e si avvarrà, dal 2026, dell’esperienza di alcuni ricercatori dell’Università Jagellonica di Cracovia, sede dove il progetto troverà la sua conclusione. L’architettura del database si ispira a quella originariamente adottata per l’ Archivio della Tradizione Romanesca ( ATR ) 1 - ideato da Giulio Vaccaro, partner internazionale - ma, come si illustrerà nel §2, è stata significativamente potenziata per offrire strumenti di interrogazione più flessibili e mirati. Va considerato che i periodici attualmente disponibili su portali come Internet Culturale sono perlopiù in lingua italiana e anche laddove presenti testi in dialetto non vengono fornite all’utente indicazioni precise circa la loro localizzazione o consistenza, rendendo più onerose le ricerche mirate, sia in termini di tempo che di impegno 2 . Il progetto intende colmare questa lacuna offrendo una piattaforma unificata e open access che, oltre alla riproduzione fotografica delle testate dialettali considerate per il progetto 3 , fornisca un corpus interrogabile per autore, periodo di pubblicazione, testata e forme linguistiche. Tuttavia, prima di trattare dell’utilità di uno strumento come ArPeR attraverso un esempio di ricerca concreto (§3.1), sarà necessario fornire una descrizione del corpus (§1.1) e una presentazione della piattaforma (§2). 1.1 I testi dell’Archivio Per creare un archivio digitale dedicato alla pubblicistica dialettale romana era necessario, anzitutto, tener conto dei progetti di digitalizzazione già avviati, così da valorizzare le risorse esistenti. Ciò vuol dire che il database integra testi che derivano da due tipi di fonti: periodici già digitalizzati, per i quali sono stati creati rimandi ipertestuali alle fotoriproduzioni archiviate sulle piattaforme originarie, e giornali non ancora disponibili in formato digitale, per i quali, invece, si è reso necessario procedere a nuove fotoriproduzioni. In quest’ultimo caso si è privilegiato il materia- 1 Basata sul software Gattoweb; sull’ ATR si veda il profilo delineato in Vaccaro (2012: 80). Si ringraziano gli autori di aver consentito di accedere privatamente alla banca dati. 2 Per quanto riguarda i periodici romani, sono diverse le istituzioni che hanno attivato progetti di digitalizzazione le cui riproduzioni sono accessibili tramite il portale Internet Culturale [https: / / www.internetculturale.it]: la biblioteca digitale della Biblioteca Nazionale Centrale di Roma, che ospita una sezione dedicata ai giornali storici, la Biblioteca Universitaria Alessandrina, che ha reso disponibile la collezione Periodici della provincia di Roma tra Ottocento e Novecento con un totale di oltre 60.000 immagini digitalizzate e circa 80 testate. Menzione particolare, infine, per la Digiteca della Biblioteca di Storia moderna e contemporanea [http: / / digiteca.bsmc.it/ ? l=periodici] e per la banca dati Repubblica Romana del 1849 [http: / / www.repubblicaromana-1849.it/ index.php? 3/ periodici]. 3 Sia le testate già digitalizzate, per le quali sono previsti collegamenti ipertestuali alle piattaforme che le ospitano, sia quelle sfuggite agli interventi di digitalizzazione, rese accessibili grazie al presente progetto (cf. subito infra). 53 DOI 10.24053/ VOX-2025-003 Vox Romanica 84 (2025): 51-67 ArPeR . Un corpus digitale dei periodici dialettali romani le con maggiore incidenza di testi in dialetto 4 (come il Rugantino ) o con un periodo di pubblicazione più esteso (è il caso del Capitan Fracassa ). L’Archivio comprenderà i testi romaneschi tratti dai seguenti giornali, un primo nucleo destinato ad ampliarsi: - «Don Pirloncino» (30 luglio 1871-2 gennaio 1887) 5 ; - «Capitan Fracassa» (annate 1884-1891), (annate 1902-1905) 6 ; - «Fornarina» (7 gennaio 1882-3 giugno 1883) 7 ; - «Il Rugantino» (annate: 1887-1896; 1919-1920) 8 ; - «Casandrino in dialetto romanesco» (8 agosto-14 ottobre 1897) 9 ; - «La Frusta: giornale politico morale» (annata: 1873) 10 ; - «La Frusta: periodico umoristico illustrato» (annate 1907, 1909-1910) 11 . Sono stati esclusi dal corpus tutti i testi redatti in una varietà diversa dal romanesco: ciò comprende sia l’italiano, sia quelle varietà dialettali, perlopiù stilizzate, che venivano impiegate con fini caricaturali. Si veda l’esempio in (1): (1) «La Frusta» (numero 17: 22 gennaio 1873) Lettera Ciociara Servo Assignoria Frintino a gli dudeci de chissu mese. Lei Signoria, mo tu che pu manijà la frusta si gliasso e che fai arizzà gli pilo a s’ursi arrajàti che sò vunuti a capaballo, vuristi propia sapè come è la faccenna di jiterza (1) alloco alla piazza di gli Cummune? Migna dì la virità, ecco come i gli fatto. […] Autore: Li Danese de Monte Radicino Note: (1) L’altro ieri Queste varietà venivano utilizzate prevalentemente per connotare personaggi regionali e, nella maggior parte dei casi, non sappiamo quanto esse siano riconducibili a una reale competenza linguistica da parte degli autori, spesso ignoti: per questo, pur consapevoli che esse potrebbero costituire, sotto diversi profili di ricerca, una fonte 4 Cf. infra per la discussione sulle parti non in romanesco. 5 Disponibile sul sito http: / / digiteca.bsmc.it/ ? l=periodici&t=Don%20Pirloncino# [3.5.2025]. 6 In corso di digitalizzazione: Archivio Capitolino, collocazione QUOTIDIANI QUO.119. 7 Disponibile al link https: / / www.google.it/ books/ edition/ _/ Zui5g9-3FZYC? hl=it&gbpv=0 [30.4.2025]. 8 In corso di digitalizzazione: Archivio Capitolino, collocazione PERIODICI PER 182. 9 In corso di digitalizzazione: Archivio Capitolino, collocazione PERIODICI PER 804. 10 Disponibile al link https: / / books.google.it/ books? id=gIhdAAAAcAAJ&pg=PA144&dq#v=onepage&q&f=false [7.5.2025]. 11 Disponibile sulla piattaforma Internet Culturale: https: / / www.internetculturale.it/ it/ 16/ search? q=la+Frusta&instance=&__meta_typeLivello=periodico&__meta_publisherString=roma+ %3A+tip.+ed.+romana%2C+1909-1910 [11.5.2025]. 54 Martina Ludovisi DOI 10.24053/ VOX-2025-003 Vox Romanica 84 (2025): 51-67 utile, è parso doveroso escluderle per tutelare l’integrità e la coerenza del corpus e, di conseguenza, la validità del dato linguistico che da esso emerge. Ad ogni modo, le sezioni in varietà diverse da quella capitolina non sono perse: grazie alle riproduzioni fotografiche l’utente può visionare integralmente il fascicolo originale, soluzione che consente di preservare l’omogeneità del corpus ed evitare interferenze nei dati dell’archivio. 2. La piattaforma: struttura La piattaforma per l’interrogazione della banca dati testuale, che sarà resa pubblica a partire dalla prima metà del 2026, è tuttora in fase di controllo e di implementazione; di séguito un esempio del prototipo: Fig. 1. Interfaccia di ricerca di ArPeR . La ricerca della stringa bac* ha restituito tutte le forme che iniziano con quella sequenza. Senza entrare nel dettaglio, basti dire che la modalità di interrogazione è analoga a quella già nota agli utenti di Gattoweb e dei corpora relativi 12 : anche in questo caso, infatti, una volta effettuata la ricerca, si accede a una schermata (in Gattoweb chiamata «accumulatore») dove è possibile selezionare, fra la serie di 12 Anche i caratteri jolly sono gli stessi impiegati, ad esempio, per le ricerche all’interno del corpus OVI, ormai largamente noti agli studiosi. 55 DOI 10.24053/ VOX-2025-003 Vox Romanica 84 (2025): 51-67 ArPeR . Un corpus digitale dei periodici dialettali romani forme individuate nel corpus di ArPeR , quelle utili ai fini della propria indagine e salvarle temporaneamente in un’area di lavoro 13 . ArPeR fornisce per ogni occorrenza rintracciata il contesto immediato (che può essere allargato) e i metadati completi, in ordine: testata, numero del fascicolo, autore (se noto), titolo del testo. La nota «Ricerca n. 1» in alto a sinistra dell’immagine sta a indicare che si tratta della prima ricerca dell’utente: ArPeR consente infatti interrogazioni multiple sul corpus (semplicemente inserendo un’altra forma nella cella sottostante) e combinazioni di più parametri. In quest’ultimo caso, selezionando uno specifico autore della lista o cliccando sulla rivista che ci interessa, si può circoscrivere il campo d’indagine formando sottoinsiemi del corpus: tale funzionalità permette di realizzare liste di testi e di autori collegate alla forma indagata e, quindi, di identificare con precisione in quali riviste e/ o autori essa ricorre. 2.1 L’interazione ArPeR - Stylo Come anticipato (§1), il progetto troverà la sua conclusione presso la sede dell’Università Jagellonica di Cracovia, dove da più di dieci anni si collabora alla messa a punto di Stylo (cf. Eder/ Kestemont/ Rybicki 2013), il software per l’analisi stilometrica sviluppato dal team di Computational Stylistics dell’ateneo 14 . Impiegato ormai da tempo e con successo nelle ricerche attributive su corpora letterari, Stylo consente di applicare modelli statistico-quantitativi all’analisi testuale. D’altra parte, una delle principali sfide emerse nel corso del progetto riguarda l’anonimato degli autori, i quali scrivono spesso sotto pseudonimo o pubblicano testi privi di firma; un ostacolo notevole se si considera che uno dei filtri offerti da ArPeR è proprio quello dedicato agli autori. In merito al problema degli pseudonimi, tra i casi più documentati, si segnala quello di Giggi Zanazzo, figura centrale della pubblicistica romanesca postunitaria: infatti, prima come importante autore dialettale, poi in qualità di direttore del Rugantino , ebbe modo di scrivere in moltissime testate e sotto diversi pseudonimi, di cui molti a lui sicuramente riconducibili poiché registrati e trascritti dallo stesso nel codice 2420 della Biblioteca Angelica (cf. Ludovisi 2023: 11-13, 18-19) 15 . In casi simili, l’analisi stilometrica permetterà, auspicabilmente, di formulare ipotesi attributive fondate su vari indicatori, quali frequenze lessicali, lunghezza delle frasi, distri- 13 In alto a destra, la dicitura «5 forme trovate (5 attive)» indica che sono state selezionate tutte le 5 forme elencate nell’accumulatore. 14 Sul software Stylo e sul gruppo di ricerca che lo utilizza si può fare riferimento a https: / / computationalstylistics.github.io/ [25.9.2025]. Per l’impiego delle analisi stilometriche nel campo della filologia attributiva si veda il sito https: / / computationalstylistics.github.io/ blog/ imposters/ [25.9.2025]. 15 L’autore aveva iniziato a raccogliere i propri scritti poetici in alcuni codici (2415, 2416 e 2420), l’ultimo contenente testi ritagliati e incollati dai giornali in cui erano apparsi. Tra gli pseudonimi che, per questo motivo, sono a lui sicuramente riconducibili (solo in parte corrispondenti a quelli indicati da Majolo Molinari 1963: II, 866; cf. infra a testo), si segnalano Er carrettiere Peppe Signorini , Er trovatore , Ghetanaccio , Giggetto , Gnàcchete , L’abbate Luviggi , Marco Pepe , Miodine , Peppino , ( E’ ) Rugantino . 56 Martina Ludovisi DOI 10.24053/ VOX-2025-003 Vox Romanica 84 (2025): 51-67 buzione dei morfemi, ecc. 16 ; in altre parole, sulla base di questi criteri si potranno individuare caratteristiche distintive che suggeriranno la paternità di testi anonimi o incerti (Craig/ Kinney 2009: XV-XVI) 17 . Com’è prevedibile, ciò vale solo per i testi di una certa lunghezza, dov’è più evidente l’emersione di tratti stilistici: studi recenti (Eder 2015) hanno evidenziato che i risultati stilometrici più affidabili derivano dall’esame di campioni testuali con una lunghezza minima di circa 5.000 parole, un limite notevole per i pezzi giornalistici che, per natura, sono necessariamente brevi. Si è deciso quindi di focalizzare l’applicazione di tale modello su testi di autori per i quali disponiamo di una produzione qualitativamente sicura e sufficientemente estesa come Adolfo Giaquinto, Giggi Zanazzo, Augusto Marini e il giovane Trilussa, che esordì proprio su uno dei giornali romaneschi oggetto d’indagine, il «Rugantino». Per questi autori, la cui produzione si estende anche al di fuori della stampa periodica, sarà possibile allenare il software, ovvero sottoporre alla sua analisi i testi più ampi di questi autori, come punto di partenza, per poi confrontarli con testi di attribuzione incerta e suggerire possibili paternità. Superata con successo questa fase, si passerà alla verifica delle attribuzioni suggerite da Majolo Molinari (1963) nella sua raccolta: qui, oltre a quelli noti, vengono indicati ulteriori pseudonimi, che però rimangono tuttora incerti perché non rivendicati dall’autore. La prima fase partirà proprio da queste indicazioni per vedere se le informazioni contenute in Majolo Molinari (1963) siano fondate o debbano essere accolte con cautela in assenza di riscontri sul piano linguistico-stilistico, almeno secondo il software impiegato. A questo punto chi si occupa di romanesco postunitario rileverà subito una difficoltà di fondo: in che misura si può attribuire un testo a un autore specifico in un contesto in cui le voci degli autori dialettali si intrecciano, si sovrappongono e, specialmente, dove tutti attingono a piene mani dal monumento belliano? Tenuto conto di queste dinamiche di contaminazione e di imitazione, l’applicazione del modello stilometrico sarà mirata: è evidente che l’obiettivo primario non può essere quello di suggerire attribuzioni per ogni singolo testo anonimo o incerto presente nel database, bensì di indicare una possibile paternità per una cerchia ristretta ma solida, quella relativa agli autori di cui disponiamo di fonti ampie e variegate 18 ; si tratta, comunque, di aggiunte di un certo peso in grado di arricchire la loro bibliografia primaria (cf. §4.2). 16 In caso di esito positivo, i testi verranno registrati nel database con l’indicazione «[autore] (attrib.)», distinguendoli così dai testi firmati. 17 L’approccio adottato da ArPeR si fonda sull’ipotesi che, attraverso un’analisi condotta su un corpus sufficientemente ampio e selezionato di testi attribuiti con certezza, sia possibile individuare tratti unici e ricorrenti anche in testi di minore estensione. Si tratta di quelle sottili scelte linguistiche che, nel loro insieme, concorrono a delineare il profilo di un autore, distinguibile anche all’interno di una tradizione fortemente condivisa. 18 Solo in un secondo momento e compatibilmente con tempi, risorse e successo dell’interazione ARpeR-Stylo , si potrà procedere all’esame di casi non ancora esplorati. 57 DOI 10.24053/ VOX-2025-003 Vox Romanica 84 (2025): 51-67 ArPeR . Un corpus digitale dei periodici dialettali romani 3. Le ragioni di ArPeR: una risorsa per lo studio del romanesco moderno Il periodo postunitario è particolarmente interessante per le sorti del dialetto capitolino, segnato da un lato dal declino di alcuni tratti dialettali, dall’altro dall’emergere di alcune innovazioni, specie dopo l’arrivo di non romanescofoni ( buzzurri , cafoni , cispadani e burini ) nella nuova capitale 19 . Tali dinamiche introdussero a Roma sia elementi meridionali che settentrionali, contribuendo a ridefinire l’assetto etnicolinguistico della città. È ormai noto, infatti, che il flusso migratorio proveniente in prevalenza dalle aree laziali, centrali e meridionali abbia «innescato riflessi linguistici sulla via di un riavvicinamento dell’idioma capitolino alla varietà del centrosud», anche in virtù della «somiglianza di fondo della struttura linguistica tra la parlata del Mezzogiorno e la varietà romana» (Biasci 2013: 252) 20 . Ma le migrazioni postunitarie in direzione della nuova capitale interessarono anche il nord, veicolando voci di provenienza settentrionale, come mostrano gli studi di Riga (2024) su zagajà , presumibilmente d’origine piemontese, e di Trifone (2020) su buzzurro . Il corpus si rivela dunque uno strumento prezioso per verificare gli apporti lessicali entrati a Roma attraverso queste due direttrici. Per cogliere appieno tali dinamiche è utile ampliare il repertorio delle fonti, integrandole con materiali che documentino l’uso del dialetto tanto nella produzione poetica quanto nella prosa, di norma meno sorvegliata della poesia dialettale e meno vincolata a schemi metrici e al modello belliano 21 . La stampa periodica dialettale si configura quindi come una risorsa di grande valore per lo studio del romanesco: lo ha già dimostrato il lavoro di Picchiorri (2019: 478), il quale, analizzando i testi vernacolari contenuti nei fogli pubblicati tra il 1848 e il 1849, nota come questi «merit[i] no attenzione dal punto di vista linguistico come spaccato realistico […] del romanesco di metà Ottocento, soprattutto perché presentano un ricco patrimonio lessicale, spesso scarsamente o niente affatto documentato dai repertori, e testimon[i]no l’emersione di alcuni tratti morfosintattici incipienti nel dialetto dell’epoca» 22 . Ciò 19 Nella Roma postunitaria, infatti, «il flusso migratorio ha assunto dimensioni imponenti, tanto da provocare un aumento abnorme e continuo del numero degli abitanti: 212.432 nel 1871; 422.411 nel 1901; 930.926 nel 1931; 1.651.754 nel 1951; 2.781.993 nel 1971, per finire a 2.830.569 nell’ultimo censimento del 1981» (Stefinlongo 1985: 46). I nuovi abitanti si insediarono soprattutto nelle zone periferiche, determinando un rapido processo di espansione urbana che condusse alla nascita di nuovi quartieri (De Vecchis 2022: 38 N87). 20 Tratta dell’argomento anche De Vecchis (2021: 63-64). 21 La persistenza di tale modello è ben visibile in giudizi come questo: «Giù er fongo, sangue de Giuda, che se parla der papà de li scrittori in vernacolo romanesco. Giù er fongo, che avanti a Belli nun c’è stato mai gnisun poeta che j’abbia potuto fa da farsariga e doppo de lui gnisuno che, nun dico lo supri, ma je vada der paro» («Rugantino», 25 settembre 1887, numero 2, p. 4). 22 Per sostanziare le proprie ricerche hanno utilizzato dati tratti da periodici dialettali romani anche D’Achille/ Giovanardi (1998), D’Achille (2016), Giovanardi (2014), Loporcaro/ Faraoni (2021), Lorenzetti (2017, 2020), ecc.; si vedano poi i contributi di Picchiorri/ Vaccaro (2020) e di Costa (2006), i primi per i giornali della Repubblica Romana, il secondo per i rapporti tra scrittori e stampa satirica a Roma nei periodici tra fine Ottocento e Novecento. 58 Martina Ludovisi DOI 10.24053/ VOX-2025-003 Vox Romanica 84 (2025): 51-67 varrà ancor più nel periodo immediatamente successivo, quando nuove voci e tendenze linguistiche importate tanto da sud - complice il persistente influsso napoletano 23 - che dalle varietà contermini vengono introdotte a Roma proprio dai flussi migratori di cui si è detto: si pensi ad alcuni fenomeni fra quelli segnalati da Faraoni (2021) quali la lenizione delle occlusive, l’evoluzione della perifrasi deontica dovere da + infinito e il costrutto allocutivo introdotto dalla particella a , sia nella forma piena ( A Giovanna ! ) sia in quella apocopata ( A Giovà! ). Quest’ultimo tratto, oggi ampiamente diffuso, si stabilizza nella seconda metà dell’Ottocento, verosimilmente per contatto con varietà centromeridionali e attraverso la rifunzionalizzazione dell’interiezione ah in funzione allocutiva (Loporcaro/ Faraoni 2021: 564s.). In merito al costrutto con forma piena, uno spoglio dei soli primi tre fascicoli del «Rugantino» restituisce questa serie di occorrenze: (2) a. «A Casandrino quale so’ le mantenute der Vaticano? » («Rugantino», 25 settembre 1887, fascicolo 2, p. 2); b. «A regazzi mbe che c’è da guardane, annat’a a spurcià mamma» («Rugantino», 2 ottobre 1887, fascicolo 3, p. 2); c. «Sbrighet’, a Tota, famme n’ po’ dde posto» («Rugantino», 2 ottobre 1887, fascicolo 3, p. 2); d. «A Nena, dico, si’n sia mai viengo lline te manno a ccasa senza na’ ganassa» («Rugantino», 2 ottobre 1887, fascicolo 3, p. 2); e addirittura un caso con apocope del vocativo, stavolta nella rivista «Fornarina» 24 : (3) «A Filomè… si tte lo dassi adesso [il bacio], me strilleressi, o tté staressi zzitta? » («Fornarina», 15 ottobre 1882). Tali esempi confermano il valore documentario delle testate dialettali e l’importanza di utilizzarle come fonti nella ricerca: d’altra parte, se si disponesse di un’opera di agile consultazione che raccogliesse sistematicamente testi dialettali romani di più autori, essa costituirebbe probabilmente un punto di riferimento negli studi sul romanesco dell’epoca. Lo dimostra il fatto che, quando tali testi vengono effettivamente raccolti e pubblicati in volume, questi diventino fonti regolarmente citate negli studi: è il caso dell’antologia di Possenti (1966), che raccoglie una selezione di testi di vari autori dialettali romani (metà Ottocento - metà Novecento ca.), e della raccolta di Faitrop Porta (1992) che di Trilussa raduna e pubblica proprio la produzione giornalistica, limitatamente ai contributi apparsi nel «Don Chisciotte» e nel «Rugantino». Sebbene il progetto, come si è visto, attribuisca priorità all’aspetto linguistico, di fatto l’asse portante dell’indagine, non è secondario il valore letterario e storico che la 23 De Mauro (1989: XXVII) parla di un «diuturno flusso di napoletanismi che segna tutta la storia preunitaria e postunitaria del romanesco». 24 L’esempio è segnalato anche in Loporcaro/ Faraoni (2021), trattandosi di una poesia inclusa nella stampa zanazziana del 1882. 59 DOI 10.24053/ VOX-2025-003 Vox Romanica 84 (2025): 51-67 ArPeR . Un corpus digitale dei periodici dialettali romani pubblicistica romanesca riveste nel contesto dell’Italia postunitaria. I periodici in dialetto offrono infatti una testimonianza rilevante non solo dal punto di vista linguistico, ma anche per i contenuti che veicolano, le tematiche affrontate e le posizioni ideologiche assunte. In particolare, la stampa dell’età umbertina si configura come uno spazio di elaborazione e diffusione di opinioni, spesso legate alla cronaca cittadina o a più ampi dibattiti politici e culturali. Come ha mostrato Paola Puglisi (2011) nel caso del «Rugantino», emergono questioni centrali come quelle collegate alla polemica anticlericale, all’impegno politico di Crispi, all’erezione del monumento a Giordano Bruno e, più in generale, ai fatti di cronaca. Parte dai giornali anche l’esame di Claudio Costa (2006) che nel suo saggio Il Travaso delle idee approfondisce il ruolo della stampa satirica romana nel primo Novecento, evidenziando come il periodico che dà il nome al saggio - per l’appunto Il Travaso , anch’esso interprete delle istanze anticlericali romane e osservatore critico della vita politica della città - abbia contribuito alla definizione di un’identità linguistico-culturale romana e romanesca proprio attraverso l’uso del dialetto. Un’attenta disamina dei materiali contenuti nei giornali, ora facilitata dall’impiego di ArPeR , costituisce quindi un ulteriore e importante aiuto per lo studio della situazione politica, culturale e sociale della Roma postunitaria 25 . 3.1 Un esempio concreto dell’uso di ArPeR Si è visto (§3) che anche uno spoglio parziale e non sistematico di pochi testi del nostro corpus ha effettivamente prodotto una serie di occorrenze del costrutto allocutivo preso brevemente in esame nel paragrafo precedente. In questa sede, si offrirà invece un esempio concreto dell’utilizzo di ArPeR , indagando l’uso di tenere come verbo possessivo, partendo da quanto ricostruito in Ludovisi/ Pesini (2022, 2023). L’obiettivo è quello di esaminare i diversi tipi di relazione possessiva espressi da tenere - sulla base delle categorie di possesso elaborate da Heine (1997a: 34-35, 1997b: 87-88), con alcuni aggiustamenti alla luce di Mazzitelli (2015) - in un campione di testi compresi all’interno del prototipo del nostro Archivio , vale a dire «Rugantino» (numeri 1-5 del 1887, intera annata 1889, numeri 1-7 gennaio 1891), «La Frusta» (intera annata 1873, numeri 1-10 del 1874), «Fornarina» (intere annate: 1882, 1883). Anzitutto, è possibile effettuare una ricerca (espansa) per forma combinata usando i medesimi caratteri jolly impiegati in Gattoweb: digitando nella cella la stringa <t? e*>, combinandola con la sequenza <ten*>, si possono recuperare le forme grafiche riconducibili a tenere . Il sistema restituisce un elenco di contesti che lo studioso può sottoporre a una serie di filtri, così da restringere il campo alle fonti, agli autori o alle annate più interessanti ai fini della propria indagine. Nel nostro caso, dato 25 Già Faraoni (2021) ha evidenziato l’esistenza di due direttrici per l’evoluzione del «romanesco postunitario»: una che muove in direzione dell’italiano, con il progressivo avvicinamento del dialetto alla lingua standard, un’altra che muove in direzione anti-italiana e che ha consentito la sopravvivenza del romanesco. 60 Martina Ludovisi DOI 10.24053/ VOX-2025-003 Vox Romanica 84 (2025): 51-67 l’elevato numero di esempi rinvenuti all’interno del «Rugantino», si è optato per una selezione mirata (solo l’anno 1887) 26 : Fig. 2. Esempio di ricerca secondo le sequenze <t? e*> e <ten*>. Si trascrivono di séguito tutte le occorrenze per agevolarne la citazione 27 : (4) a. «Intanto però er Municipio se merita ’na tiratina d’orecchie n’er modo comme tiè er quartiere de San Cosimato»; b. «cquele miara de pecorelle che ttieneveno in de la rete rippresentaveno le nazzione che lloro aveveno un giorno da vince e da commannà ppoi pe’ ttanti secoli…»; c. [i sonetti romaneschi] «Li tiè ariposti, perché llui, dice, che li fa pe’ divertisse lui, e no’ pe’ ffa divertì ll’antri»; d. «quello che tiè er treatro de Cavurre ha pensato de pijà un barcone a cottimo per trasporto deli cittadini ar distretto»; e. «mo’ co’st’acqua ch’è cascata, nun passi da gnisuna parte si nun tienghi li trommoni»; f. «Vojantri sapete si io je vojo bbene a le crature; si ccome tienevo quell’anima de Ddio, che mm’è morto nun so otto ggiorni; nu’ mme ce fate ripensà che mme viè da piagne! »; 26 Si potevano, in alternativa, scegliere i fascicoli del «Rugantino» del gennaio 1891, che avrebbero restituito i seguenti casi: «vado ar commòne de cammera mia che lo tiengo vvicino a’ lletto» (1 gennaio 1891); «E ’r rimedio lo tienghi proprio te» (1 gennaio 1891); «Che ccià ’na mmalatia strasordinaria/ La quinta zzampa d’un certo animale/ Per appricalla indove tiè quer male» (11 gennaio 1891); «noi quello che cciavemo in der core lo tienemo su’ la bocca» (11 gennaio 1891), ecc. L’esclusione di questi esempi, come di altri, si giustifica per il fatto che il paragrafo non ha lo scopo di integrare l’elenco di occorrenze analizzato in Ludovisi/ Pesini (2022, 2023), bensì di offrire un esempio d’uso della piattaforma. 27 Si integrano gli esempi nella pagina 2 dei contesti, la cui immagine non è stata qui riportata per motivi di economicità espositiva. 61 DOI 10.24053/ VOX-2025-003 Vox Romanica 84 (2025): 51-67 ArPeR . Un corpus digitale dei periodici dialettali romani g. «na sfirzata d’antri romanzi scerti tra li meijo fichi der bigonzo, tajani, francesi, in gresi, robba de la todescheria, tradotti s’intenne mica dalli soliti; ma da ggente che ssa tené la penna in [mano]». L’utente può inoltre combinare i vari filtri e cercare, per esempio, una sola forma all’interno di più annate di un unico giornale. Nel caso in (5) si è scelto di cercare tiengo nella rivista «La Frusta», anni 1873-1874: (5) a. «Nu le tiengo io [le nespole], ma a tempo e loco vieranno puro quelle» (1 luglio 1873); b. «Sor Angelo mia, nun me mettete pavura più de quella che tiengo! ! » (15 novembre 1873); c. «Me tocca a stracinammela appresso, in dove la lasso sinnò? Ché tiengo la camberiera? » (15 gennaio 1874); d. «Antro ch’aricordane! ! lo tiengo stampato quine in der cervello» (9 aprile 1874); e. «Che t’ho da dine, fija ? - Tiengo na pena qua drento (indicando il cuore) na pena» (26 maggio 1874). Pur trattandosi solo di una porzione, anche piuttosto limitata, del materiale che sarà disponibile in futuro, la selezione di esempi qui considerata integra il quadro delineato in Ludovisi/ Pesini (2023: 131-38) 28 . Per il possesso astratto, dove il Possessum è una realtà non visibile o tangibile (malattia, sentimento, stato psichico, ecc.) rientrano nella classificazione gli esempi (5b, e), mentre nella categoria di possesso sociale alienabile (Mazzitelli 2015: 24), riferita a tutte le relazioni sociali eccetto quelle di parentela, si annovera l’esempio (5c). Si riconducono alla categoria di possesso permanente alienabile, dove il possessore detiene la proprietà in virtù di un titolo giuridico, l’occorrenza in (4d) e a un possesso «temporaneo» gli esempi in (5a e 4e). In costrutti predicativi tenere può assumere il valore di ‘avere’ (5d), selezionando un Sogg. Locativo (cf. Ledgeway 2009: 628). Benché nel contributo citato venisse offerto un numero consistente di esempi tratti dai testi romaneschi della seconda metà dell’Ottocento, il novero delle occorrenze non era tale da bilanciare quello offerto, per esempio, dai Sonetti belliani o da altri testi rappresentativi di uno specifico arco cronologico. Pertanto, è innegabile che l’impiego di ArPeR avrebbe giovato a questo tipo di studio, da un lato bilanciando l’indagine, offrendo la possibilità di spogli più estesi, dall’altro lasciando ipotizzare l’emersione di ulteriori dati 29 . 28 Sono da escludere dal novero degli esempi di tenere per ‘avere’ i significati concreti quali ‘reggere’, ‘tenere in mano’ (ad es. da ggente che ssa tené la penna in [mano] , 4g) e i valori come ‘mantenere’ (ad. es. comme tiè er quartiere de San Cosimato , 4a). Sempre col valore di ‘mantenere’, la costruzione tenere + Sogg. Agente può ricorrere con oggetti sia inanimati (4c) sia animati (4b, f). 29 Si pensi alla possibilità di verificare l’assenza o la presenza di usi marginali come quello delle locuzioni del tipo tenere ragione/ torto , attestate solo sporadicamente nel corpus disponibile all’epoca agli autori del contributo (cf. Ludovisi/ Pesini 2023: 134-35, 138s.). 62 Martina Ludovisi DOI 10.24053/ VOX-2025-003 Vox Romanica 84 (2025): 51-67 4. Conclusioni Il progetto di cui qui si è discusso presenta alcuni aspetti problematici (cf. §4.1) ma, al netto di questi, i materiali che ArPeR metterà a disposizione dell’utente apporteranno contributi notevoli alla ricerca scientifica (cf. §4.2). 4.1 Criticità e limiti della fase attuale Si è visto (§2.1) che uno dei nodi critici sarà quello del riconoscimento degli pseudonimi. Sono già state avanzate alcune proposte operative, preferendo, per esempio, circoscrivere l’indagine agli autori di cui possediamo una documentazione ampia, piuttosto che estendere il campo d’indagine indiscriminatamente. Questa soluzione, che prevede un utilizzo critico di Stylo , limita notevolmente il numero degli autori per cui si potrà usare il programma con efficacia, dato che l’analisi verrà condotta su autori di cui, di fatto, disponiamo già di molte opere, ampie ed esterne alla pubblicistica dialettale, su cui verrà allenato il software; in aggiunta a questo, non è detto che i risultati ottenuti grazie a Stylo siano corretti - sebbene essi saranno segnalati come attribuzioni proposte (tramite la dicitura «[autore] (attrib.)») - né sarà possibile giustificare questo dato all’utente tramite note di commento. In effetti, inserire una cella accanto alla modalità di visualizzazione della dicitura è un’ipotesi che, pur presa in considerazione, è stata scartata per ragioni connesse all’economia del lavoro: in altre parole, è parsa poco utile ai nostri fini e molto dispendiosa in termini di tempo. Del resto, non solo non è lo scopo del progetto quello di offrire attribuzioni stilometriche per ogni testo, ma le modalità di tali attribuzioni, così come i limiti, vengono ben espresse dagli autori del software e dagli esperti di stilometria nelle loro pubblicazioni ( Jockers/ Witten 2010, Kestemont et al. 2016, Agapitos/ Van Cranenburgh 2024). A prescindere dai risultati, resta irrisolvibile l’altro aspetto collegato alla presenza di testi anonimi o firmati con pseudonimi: l’uso del filtro autore. Ma se in alcuni casi, come quelli citati, esso risulta depotenziato, in altri può essere utile per allargare lo sguardo relativo alla produzione di uno specifico autore (cf. §4.2). Si prestano ad alcune osservazioni anche le componenti diastratiche e diafasiche: la presenza all’interno del corpus di testi che si pongono a diversi livelli dell’asse verticale di variazione (sonetti dialettali più «elevati» accanto a dialoghi fra popolani) ha portato a riflettere sul tipo di dato che emerge da una ricerca nell’ Archivio . Tuttavia, se per un’analisi accurata della varietà romanesca non si può prescindere dalla variabile sociolinguistica, è pur vero che non è fra gli obiettivi primari del progetto quello di documentarla; è dunque demandato all’utente il compito di valutare ciò che emerge dai singoli contesti della propria ricerca senza aggiungere, allato al testo, informazioni ad esso pertinenti 30 . 30 Ad eccezione di quelli come autore, rivista, anno ecc. ovvero che corrispondono ai filtri della nostra piattaforma. 63 DOI 10.24053/ VOX-2025-003 Vox Romanica 84 (2025): 51-67 ArPeR . Un corpus digitale dei periodici dialettali romani Un altro aspetto problematico riguarda la distribuzione disomogenea dei dati del corpus, sia da un punto di vista quantitativo, sia da quello cronologico. Per il primo, si rileva in effetti una disparità di presenza di testi dialettali nelle diverse testate: numerosissimi, ad esempio, quelli del «Rugantino» rispetto a quelli della «Fornarina»; il rischio di restituire l’ Archivio di una singola rivista a causa di un netto sbilanciamento del corpus in una precisa direzione è purtroppo sempre presente. In aggiunta, è da segnalare un problema di rappresentatività anche in riferimento all’aspetto cronologico, con annate ben documentate e altre, invece, piuttosto lacunose. Questi limiti potranno essere superati in seguito all’estensione dell’ Archivio : l’infrastruttura di ArPeR è infatti concepita in modo che possano essere accolti sempre nuovi testi, così da espandere l’orizzonte cronologico e bilanciare il corpus inserendo ulteriori fonti, specialmente per le annate sottorappresentate. Sebbene, in questa fase iniziale, l’obiettivo principale resti quello di completare il nucleo testuale previsto dal progetto (cf. §1.1), è già in corso un’implementazione dell’ Archivio attraverso l’inserimento di testi tratti da periodici digitalizzati nell’ambito di altri progetti. 4.2 Prospettive e potenzialità di ArPeR Anzitutto, è da ricordare che progetti come ArPeR rappresentano una significativa apertura alle Digital Humanities , favorendo un approccio integrato fra linguistica, filologia e informatica. Valorizzare le fonti in nostro possesso è uno dei princìpi su cui si fonda ArPeR : sfruttare i nuovi mezzi a disposizione della ricerca per ottenere risultati più accurati con un dispendio minore in termini di tempo. Oltre a questo, si possono annoverare ulteriori punti di forza dell’ Archivio : a. ArPeR fornisce un ambiente web integrato 31 , liberamente accessibile, e consente un’interrogazione avanzata del corpus secondo diversi parametri (forma, autore, rivista, annata) che possono essere combinati simultaneamente. b. Una volta effetuata la propria ricerca, il programma consente di accedere al contesto d’occorrenza, ai metadati completi e alla riproduzione fotografica dei fascicoli originali (con rinvio al link se digitalizzati altrove). c. La possibilità di risalire alla fotoriproduzione consente di offrire al lettore, oltre a un certo grado di trasparenza nella consultazione, la lettura delle parti non romanesche necessariamente escluse dal corpus e una contestualizzazione completa delle occorrenze 32 . d. Il filtro «autori», nonostante le difficoltà citate, permette di aggiornare la bibliografia primaria di alcuni scrittori. 31 Sull’architettura informatica della piattaforma e sulle fasi operative di ArPeR cf. Ludovisi (2025). 32 Ci sono casi in cui il testo è parte di un discorso più ampio distribuito in 2 o 3 fascicoli di una medesima rivista. In simili circostanze l’utente potrà accedere all’intera serie e ricostruire integralmente il contesto. 64 Martina Ludovisi DOI 10.24053/ VOX-2025-003 Vox Romanica 84 (2025): 51-67 Su quest’ultimo punto converrà fornire un esempio concreto. La figura 3 raccoglie l’elenco dei testi relativi a uno specifico autore: Fig. 3. Esempio di navigazione per autore (selezione di testi di Giggi Zanazzo). Di Giggi Zanazzo (su cui cf. la nota bio-bibliografica in Zanazzo 1968 e da ultimo Ludovisi 2023) risultavano assenti alcuni componimenti nelle antologie complete postume più importanti, quella del figlio Alfredo (Zanazzo 1921) e quella di Orioli (Zanazzo 1968). È il caso degli ultimi due componimenti della lista - Er parlà de l’Africani e Bbone Feste - pubblicati rispettivamente nel numero del 13 novembre 1887 e del 23 giugno 1889 del «Rugantino», ma sfuggiti alle ricognizioni operate dai due curatori. Si tratta di testi firmati con pseudonimi che Zanazzo stesso riconosce come propri all’interno del già citato codice 2420, elemento che anche all’epoca ne avrebbe legittimato l’inclusione. Se, comunque, tale omissione è in parte giustificata dalla mole di testi pubblicati da Zanazzo, è vero che oggi, dati gli strumenti a nostra disposizione, è quanto mai opportuno sfruttare appieno le potenzialità offerte da risorse come ArPeR , che permettono di colmare simili lacune documentarie. Da ultimo, è bene precisare che i materiali elaborati in ArPeR rispettano i cosiddetti FAIR Principles ( Findable, Accessible, Interoperable, Reusable ; cf. Wilkinson et al. 2016), poiché pubblicati in rete, liberamente accessibili, personalizzabili in base alle esigenze dell’utente e scaricabili. Questo permette di riutilizzare i dati raccolti nella piattaforma che, una volta disponibili, potranno essere integrati in altri ambienti di ricerca, specialmente in progetti affini; un decisivo passo avanti verso una ricerca collaborativa. DOI 10.24053/ VOX-2025-003 Vox Romanica 84 (2025): 51-67 ArPeR . Un corpus digitale dei periodici dialettali romani 65 Bibliografia A gApitos , p./ v An c rAnenBurgh , A. 2024: «A stylometric analysis of Seneca’s disputed plays. Authorship verification of Octavia and Hercules Oetaeus», Journal of Computational Literary Studies 3/ 1: 1-32. B iAsci , g. 2013: «La varietà romana d’italiano oggi: fra conservazioni, spinte centrifughe e ‹ritorno al passato›», in: Atti del III Convegno Dipartimentale dell’Università per Stranieri di Siena (Siena, 4-5 dicembre 2012) , Pisa, Pacini: 243-53. c ostA , c. 2006: «Il travaso delle idee. La stampa satirica a Roma», il 996 4/ 2: 101-11. c rAig , h./ k inney , A. (ed.) 2009: Shakespeare, computers, and the mystery of authorship , Cambridge, Cambridge University Press. d’A chiLLe , p. 2016: «Pussa via! Tra romanesco e italiano», Contributi di filologia dell’Italia mediana 30: 251-69. d’A chiLLe , p./ g iovAnArdi , c. 1998: «Conservazione e innovazione nella sintassi verbale dal romanesco del Belli al romanaccio contemporaneo», in: p. r AMAt / e. r oMA (ed.), Sintassi storica . Atti del XXX Congresso della Società di Linguistica Italiana (Pavia, 26-28 settembre 1996) , Roma, Bulzoni: 469-93; ristampa, con nota di aggiornamento, in id ., Dal Belli ar Cipolla. Conservazione e innovazione nel romanesco contemporaneo , Roma, Carocci, 2001: 43-65 (da cui si cita). d e M Auro , t. 1989: «Per una storia linguistica della città di Roma», in: id . (ed.), Il romanesco ieri e oggi. Atti del Convegno (Roma 1984) , Roma, Bulzoni: 13-37. d e v ecchis , k. 2021: Il romanesco periferico: un’indagine sul campo , Tesi di dottorato (tutor: P. d’A chiLLe ), Roma, Università La Sapienza. d e v ecchis , k. 2022: Il romanesco periferico: un’indagine sul campo , Pisa, Pacini. e der , M. 2015: «Does size matter? Authorship attribution, small samples, big problem», Digital Scholarship in the Humanities 30/ 2: 167-82. e der , M./ k esteMont , M./ r yBicki , J. 2013: «Stylometry with R: a suite of tools», Digital Humanities 2013: Conference abstracts , University of Nebraska-Lincoln: 487-89. F Aitrop p ortA , A-c. 1992: Le prose del «Rugantino» e del «Don Chisciotte» e altre prose , 2 vol., Roma, Salerno Editrice. F ArAoni , v. 2021: «Il romanesco prima e dopo Porta Pia», Relazione al convegno «Dalla Roma pontificia alla Roma italiana. Le istituzioni culturali e la città» (Roma, Università La Sapienza, 20-21 maggio 2021) [si cita dal foglio di accompagnamento]. g iovAnArdi , c. 2014: «Romanesco postunitario o romanesco postbellico? », in: g. M ArcAto (ed.), Le mille vite del dialetto , Padova, CLEUP: 199-210. h eine , B. (1997a): Possession. Cognitive sources, forces and grammaticalization , Cambridge, Cambridge University Press. h eine , B. (1997b): Cognitive foundations of grammar , New York/ Oxford, Oxford University Press. J ockers , M. L./ w itten , d. M. 2010: «A comparative study of machine learning methods for authorship attribution», Literary and Linguistic Computing 25/ 2: 215-23. k esteMont , M. et al. 2016: «Authenticating the writings of Julius Caesar», Expert Systems with Applications 63: 86-96. L edgewAy , A. 2009: Grammatica diacronica del napoletano , Tubinga, Niemeyer. L oporcAro , M./ F ArAoni , v. 2021: «Il costrutto allocutivo a Nando! in romanesco: fonologia, morfologia, sintassi, semantica, pragmatica», ZrP 137/ 2: 561-600. L orenzetti , L. 2017: «Lingue e dialetti imitati nella Roma del 1870», in: A. g erstenBerg et al. (ed.), Romanice loqui , Tubinga, Stauffenburg Verlag: 41-63. L orenzetti , L. 2020: «Sull’emergere di a allocutivo nel romanesco dell’Ottocento», in: v. F ArAoni / M. L oporcAro (ed.), ’E parole de Roma. Studi di etimologia e lessicologia romanesche , Boston/ Berlino, De Gruyter: 94-105. L udovisi , M. 2023: Edizione e commento linguistico delle Poesie romanesche di Giggi Zanazzo fino al 1890 , Zurigo, Zurich Open Repository and Archive, Università di Zurigo. 66 Martina Ludovisi DOI 10.24053/ VOX-2025-003 Vox Romanica 84 (2025): 51-67 L udovisi , M. 2025: «Il progetto ArPeR . Per un Archivio dei Periodici Romaneschi», in: s. d i r eBo rA / M. r ospocher / s. B AzzAco (ed.), Diversità, equità e inclusione. Sfide e opportunità per l’informatica umanistica nell’era dell’intelligenza artificiale. Atti del XIV Convegno AIUCD (Verona, 11-13 giugno 2025) , Verona, AIUCD: 222-27. L udovisi , M./ p esini , L. 2022: «‹Tenere› con valore possessivo nella storia del romanesco (prima parte)», La lingua italiana 18: 73-92. L udovisi , M./ p esini , L. 2023: «‹Tenere› con valore possessivo nella storia del romanesco (seconda parte)», La lingua italiana 19: 131-42. M AJoLo M oLinAri , o. 1963: La stampa periodica romana dell’Ottocento , 2 vol., Roma, Istituto Nazionale di Studi Romani. M AzziteLLi , L. F. 2015: The expression of predicative possession: A comparative study of Belarusian and Lithuanian , Berlino/ Monaco/ Boston, de Gruyter Mouton. p icchiorri , e. 2019: «‹Nun vorrebbia che fusse na cianchetta der nemico›: il romanesco nei giornali della repubblica romana», in g. v AccAro (ed.), Marcello 7.0. Studi in onore di Marcello Teodonio , Roma, Il Cubo: 477-87. p icchiorri , e./ v AccAro . g. 2020: «I giornali della Repubblica romana. Una fonte per lo studio del dialetto», Il 996 18/ 1: 61-72. p ossenti , F. 1966, Cento anni di poesia romanesca , 2 vol., Roma, Staderini. p ugLisi , p. 2011: «‹Ggente mia, garbata e bbella›: Zanazzo giornalista» , in: F. o norAti / g. s cALessA (ed.), Le voci di Roma. Omaggio a Giggi Zanazzo. Atti del convegno di studi (Roma, 18-19 novembre 2010) , Roma, Il Cubo: 47-61. r igA , A. 2024: «Un piemontesismo a Roma? Storia, usi ed etimologia del romanesco ‹zagajà(re)› e dell’italiano ‹zagagliare›», Studi di lessicografia italiana 41: 251-72. s teFinLongo , A 1985: «Note sulla situazione sociolinguistica romana. Preliminari per una ricerca», Rivista italiana di dialettologia 9: 43-67. t riFone , p. 2020: «‹Burino› e ‹buzzurro›: ipotesi etimologiche», in: v. F ArAoni / M. L oporcAro (ed.), ’E parole de Roma. Studi di etimologia e lessicologia romanesche , Boston/ Berlino, De Gruyter: 106-16. v AccAro , g. 2012: «Posso fare un unico vocabolarione romanesco? Per un Dizionario del romanesco letterario», Il 996 10/ 3: 65-85. w iLkinson , M. d. et al. 2016: «The FAIR guiding principles for scientific data management and stewardship», Scientific Data , 3/ 1: 160018. URL: http: / / dx.doi.org/ 10.1038/ sdata.2016.18 [25.9.2025]. z AnAzzo L. 1921-1922: Versi romaneschi editi ed inediti , ed. A. z AnAzzo , 2 vol., Roma, M. Carra e C. di Luigi Bellini. z AnAzzo L. 1968: Poesie romanesche , ed. g. o rioLi , 3 vol., Roma, Avanzini e Torraca. DOI 10.24053/ VOX-2025-003 Vox Romanica 84 (2025): 51-67 ArPeR. A digital corpus of Roman dialect periodicals between the late 19 th and early 20 th centuries Abstract: This paper presents the purposes and first achievements of the SNSF-Project ArPeR - Archivio dei Periodici Romaneschi . The aim of the project is to create an open-access digital archive of Roman dialect periodicals published between 1870 and 1920, drawing both on already digitized materials and newly produced reproductions. The platform, which represents ArPeR ’s digital output, will be available in early 2026 and enable advanced queries across the corpus by author, periodical, date and linguistic forms. The project offers a valuable resource for historical and literary research and aspires to become a key tool for the study of post-unification Romanesco . All materials will be freely accessible and reusable in accordance with the FAIR principles. Keywords: Romanesco, Archive of Romanesco Periodicals, Post-unification Roman journalism ArPeR . Un corpus digitale dei periodici dialettali romani 67
