Logo

P. Busa, il pioniere della linguistica computazionale*

MR: Tra i nomi delle persone che hanno lasciato un segno nella storia dell'informatica c'è quello di un religioso, padre Busa. Con il Prof. Federico Gobbo docente di Pianificazione Linguistica e Lingue Pianificate dell'Università di Torino e, in passato, docente di filosofia dell'informatica dell'Università dell'Insubria conosciamo la figura di questo studioso.

FG: P. Busa è un personaggio eccezionale, nel senso che rispetto ai tempi in cui ha iniziato a lavorare con i computer, è stato un pioniere in tutti i sensi, in particolare per quanto riguarda la linguistica computezionale non solo in Italia ma in assoluto perché lui già nella sua tesi di laurea del 1946, un anno dopo la fine della seconda guerra mondiale, aveva tratteggiato un metodo per fare una verifica puntuale del lessico di Tommaso d'Aquino. Tale verifica richiedeva un lavoro molto preciso ma anche il controllo di tutte le occorrenze delle parole che fare manualmente avrebbe richiesto molti anni. Per cui lui si interessò a queste macchine che allora erano assolutamente nuove, considerate affare da militari - i computer erano degli armamenti, fondamentalmente, che hanno permesso agli alleati di vincere la guerra contro le forze dell'asse. Non erano di uso comune ma lui ne vide queste potenzialità.

Nel 1949, tre anni dopo, si trovava a New York e andò a trovare Thomas J. Watson Sr, il presidente dell'IBM e gli raccontò di questo suo progetto e il dirigente americano accettò. L'IBM si voleva accreditare in quegli anni i pm stava diventando l'azienda principale di informatica che se voleva segnare la storia dell'informatica anche mostrando come i computer potessero essere utili su diversi fronti e quindi investiva anche nella ricerca di base perché sicuramente il lavoro di padre Busa era un lavoro in cui lui ha costruito sia al metodo oltre che i dati

MR: Padre Busa ha usato i computer per un'analisi linguistica, in poche parole.

FG: In parole semplici, sì. Il risultato possiamo valutarlo nel 1980, quando dopo trent'anni esce l'Index Thomisticus in 56 volumi 56 volumi in cui ogni parola di tutto il lessico utilizzato da Tommaso d'Aquino viene indicizzato o che ci sono circa a 182 KB di indici e per ogni parola e questo permette di fare molte cose permette di capire molto bene come utilizzava i termini romane e fu qualcosa qualcosa di assolutamente eccezionale poi questi 56 volumi più tardi uscirono in cd e nel 2000 e furono messi nel Web. Adesso si possono consultare liberamente e da 2006 all'Università Cattolica di Milano c'è un gruppo di lavoro che sta annotando questo corpus viene chiamato corpus - nel gergo diciamo dei linguisti computazionali, un insieme strutturato di dati testuali - con degli alberi sintattici che seguono la scuola delle dipendenze di Praga. Il lavoro di padre Busa, in realtà, va avanti lui anche se lui è scomparso quest'anno, qualche mese fa [L'intervista è stata rilasciata nel 2011].

MR: Lei ha incontrato P. Busa? Ci può raccontare la sua esperienza?

FG: Io ho incontrato P. Busa nel 2006 durante una conferenza lui era invitato come relatore invitato al congresso della Società di Linguistica Italiana di Vercelli, organizzata dall'Università del Piemonte Orientale. La cosa che mi colpì molto è che non parlò soltanto del suo lavoro rispetto alla linguistica computazionale ma anche di quello che voleva fare nel futuro. Bisogna considerare che nel 2006 aveva 93 anni per cui era abbastanza impressionante vedere questa persona entusiasta d ei progetti che voleva realizzare ed erano progetti molto grandiosi quindi lui ci parlò un po' del suo lavoro con IBM e chi ha raccontato che litigava sempre con i programmatori. Usò un'espressione che mi segnai tra virgolette sui miei appunti “facevo la danza delle ore su un pavimento di uova fresche”, che dà un po' l'idea di come fosse difficile riuscire a comunicare con questi programmatori. Per quanto riguarda il fatto che il corpo di lessico tomistico non sia stato annotato fino a tempi recenti con della sintassi ha spiegato che i linguisti non comunicano tra loro, ognuno usa il proprio modello e lui non sapeva quale scegliere.

Ci ha parlato, poi, dei suoi ultimi progetti: uno era lessico tomistico biculturale. A P. Busa sembrava molto più ragionevole lavorare sulla linguistica computazionale di una lingua chiusa come latino, dotata di una corpus di testi definito e non in crescita perché si possono ottenere risultati molto più saldi. Con una lingua viva, invece, la base di dati sui testi usati è comunque parziale perché essa si evolve. Il suo punto di vista è abbastanza interessante perché, di solito, la maggior parte delle applicazioni e delle ricerche di linguistica computazionale sono rivolte a lingue vive, mentre il lavoro sul latino, il greco antico ed il sanscrito è considerato legato agli studi umanistici, non certo a trattamenti informatici. Il lessico tomistico biculturale è praticamente la traduzione del lessico tomistico in termini moderni, con la lingua moderna. Lui fece questo esempio: Il latino lla parola “caput” può significare non solo una testa o il capo di un'organizzazione ma anche, per figura retorica, Gesù Cristo, in quanto capo della Chiesa. La traduzione del lessico, quindi, deve tener conto di tutti questi aspetti.

Lui si occupò anche del problema del multilinguismo nell'UE e progettò le lingue disciplinate. Le lingue vive sono in continuo mutamento non si possono veramente metter dentro ad un computer. Questo lui l'aveva ben chiaro e, per questo, voleva riuscire a trovare un sistema di lessico, una scrittura ideografica gemella delle varie lingue in modo tale che così si potesse fare un sistema traduzione automatica. Non so come questa idea è stato sviluppata. Sicuramente, questo genere approccio richiede una grande manualità da parte di programmatori e linguisti e ,quindi, molto tempo. Consideriamo che lui, in qualche modo, lavorava sui tempi dell'eternità. Come religioso sosteneva che i computer sono un dono di Dio e perciò dobbiamo utilizzarli e non ha avuto problemi a lavorare sullo stesso progetto per trent'anni di seguito.

L'IBM ha avuto un ruolo fondamentale nei primi anni del secondo dopoguerra, attraverso finanziamenti cospicui e a lungo termine per l'informatica, cosa che adesso non fa più nessuno non solo per motivi banalmente economico finanziari ma anche considerando il cambiamento tecnologico: i computer del '46 e il computer degli anni 60 erano frutto di un'evoluzione di tipo graduale. A partire dagli anni 70 c'è una forte accelerazione che ende r difficile poter avere una visione ampia del futuro.

MR: Io sottolineerei anche il carisma di P. Busa.

Lui è andato direttamente dal capo dell'IBM. Tenga conto, anche, che aveva anche la grande forza di aver convinto il Vaticano per avere accedere a tutti i repertori originali di Tommaso d'Aquino e non è una cosa da poco. C'è anche da dire che padre Busa ha formato di fatto una scuola di linguistico computazionali che opera ancora oggi in tutt'Italia a con ottimi risultati. 

 

* L'articolo rappresenta una rielaborazione di una puntata della trasmissione "Lingue e Cultura"

Template Design © Joomla Templates | GavickPro. All rights reserved.