giovedì 15 febbraio 2018

Un’intervista e due segnalazioni

 
Sono stato intervistato dal sito Letture.org a proposito del mio libro su Lingue e intelligenza artificiale. Lintervista è piuttosto articolata, e per me è stata l’occasione di sintetizzare alcune valutazioni che mi sembrano importanti. Ringrazio molto i curatori del sito!
 
Negli ultimi giorni, il mio libro è stato anche segnalato sulla stampa. Sabrina Minardi (L’Espresso) lo cita in una rassegna intitolata Lessico da scoprire (11 febbraio 2018); Massimiliano Panarari ne parla in un articolo su Apocalittici e integrati alla sfida dell’automazione uscito su La stampa dell’11 febbraio 2018; l’articolo del giornale è accessibile integralmente solo agli abbonati, ma il testo è riproposto anche sul blog Docenti preoccupati.
 

venerdì 26 gennaio 2018

Tavosanis, Lingue e intelligenza artificiale

  
 
Mirko Tavosanis, Lingue e intelligenza artificiale
È appena arrivato in libreria il mio nuovo libro: Lingue e intelligenza artificiale, pubblicato da Carocci.
 
Ci tengo a dire che alla base del libro c’è una pura curiosità personale. Qualche tempo fa mi sono infatti chiesto: quanto bene funzionano i sistemi moderni di elaborazione del linguaggio naturale? Io sono un “addetto ai lavori” attivo in un settore strettamente affine, ma mi sono accorto che la risposta non era ovvia né facile da trovare.
 
Uno dei motivi dietro a queste difficoltà è il fatto che i discorsi in materia sono immersi in un mare di esagerazioni. In fin dei conti, che i sistemi informatici siano capaci di trascrivere il parlato o di tradurre testi ho cominciato a sentirlo dire trent’anni fa. Ricordo bene, per esempio, un bravo editore italiano che nel 1990 dichiarava di aver assistito alla prova di sistemi automatici di traduzione e dichiarava che erano in grado di tradurre bene narrativa e saggistica. Già all’epoca trafficavo un po’ con queste cose e sapevo bene che nulla di tutto questo era vero; o meglio, che le prestazioni che venivano vantate erano remotissime da quelle che si potevano ottenere in circostanze reali. Con un po’ di esagerazione, ma non troppa, si può dire che a quei tempi i sistemi di trascrizione non trascrivevano e i sistemi di traduzione non traducevano.
 
Da qualche anno, però, mi sono accorto con piacere che le cose sono cambiate. Finalmente alcuni di questi sistemi funzionano e si possono usare nella vita di tutti i giorni. Solo che non sono perfetti… e non è chiaro quali cose funzionino bene e quali no. Le informazioni pubblicate sono poche e ben nascoste.
 
A un certo punto, quindi, mi sono detto che mi interessava avere dati più precisi. In particolare, mi interessava capire quanto funzionassero i sistemi che avevano un rapporto con il parlato e quelli che possono vantare l’apporto di tecniche nuove, definite genericamente come tecniche di “intelligenza artificiale”.
 
Uno dei motivi per cui questa curiosità era forte è stato il rapporto con la scrittura. A me interessa soprattutto la lingua scritta, e questi sistemi in alcuni casi sembrano permettere cose che in precedenza solo la scrittura poteva fare. Per questo, tra l’altro, ho aperto un blog dedicato alle interfacce vocali.
 
La risposta alla domanda di base, comunque, è rimasta molto sfaccettata. Diciamo che, nella mia prospettiva, le prestazioni dei sistemi si sono rivelate sorprendentemente buone per quanto riguarda la traduzione del “parlato letto”, sorprendentemente cattive per quanto riguarda la trascrizione di conversazioni spontanee, mediocri ma sorprendentemente utili per quanto riguarda la traduzione da una lingua all’altra, sia nello scritto sia nel parlato… In molti casi, i risultati che sono riuscito a misurare sono stati molto diversi da quelli che mi sarei aspettato.
 
In aggiunta a questi numeri ho poi cercato di fare qualche speculazione sull’utilità futura di questi sistemi. Qui il discorso ha dovuto intrecciare le prospettive informatiche (che conosco poco) e quelle storico-linguistiche (che invece spero di conoscere abbastanza bene). Il risultato lo giudicheranno i lettori. Per me, in ogni caso, c’è la soddisfazione di essermi tolto diverse curiosità e di essere passato, spero, alla fase successiva.
 
Oltre che nelle librerie tradizionali, il libro è disponibile anche attraverso canali di vendita come Amazon. Spero che in tempi ragionevoli sia possibile avere anche una versione come e-book.
 
Mirko Tavosanis, Lingue e intelligenza artificiale, Roma, Carocci, 2018, pp. 126, € 12, ISBN 978-88-430-9013-6.
 

venerdì 29 dicembre 2017

Escher a Pisa

  
 
In video ci si può vedere seduti su un triangolo di Penrose
Qualche settimana fa sono andato a vedere la bella mostra di M. C. Escher allestita a Palazzo Blu a Pisa. Non mi aspettavo troppe sorprese, perché le opere di Escher sono, come tutti, abituato a vederle ovunque: sui poster, sui puzzle e sulle copertine dei libri. Però, quando si guardano gli originali qualcosa di nuovo si trova sempre – anche nel caso in cui gli originali sono costituiti in buona parte da stampe.
 
Per esempio, è stata una sorpresa vedere il livello di dettaglio in alcune opere. In alcuni casi ci sono iterazioni decrescenti talmente minuscole che mi chiedo quanto tempo e quali tecniche abbiano richiesto per la realizzazione: una lente d’ingrandimento, un buon sostegno per la mano e infinita pazienza? In una riproduzione di dimensioni limitate, per quanto buona sia, questi dettagli si perdono.
 
Dal punto di vista dei contenuti, invece, la scoperta più interessante è stata quella dei paesaggi italiani, risalenti in buona parte agli anni Venti e radicalmente estranei all’iconografia tradizionale. I soggetti esposti provengono soprattutto dalla Campania e dagli Abruzzi; viceversa, mi sembra poco presente lo sfondo che si collegherebbe a Escher in modo più intuitivo, cioè quello della Liguria. Da Genova alle Cinque Terre e a Portofino, scogli, strisce di colore e prospettive dall’alto sarebbero perfette per l’inserimento in alcune delle stampe più famose. Escher comunque ha visitato spesso la Liguria, quindi sarei sorpreso se non ce ne fossero tracce più consistenti in altre opere.
 
L’allestimento della mostra ha lati molto positivi. L’ingresso è a effetto. Una panchina video al primo piano permette di vedersi seduti su un triangolo impossibile, ed è una buona soluzione per dare soddisfazione al visitatore e concretizzare in qualche modo le prospettive impossibili per cui Escher è famoso.

La cascata di Escher

 
Andando in mostra, temevo poi l’affollamento. È un bene che i musei siano affollati… ma a volte le scolaresche sono talmente numerose e vocianti che è davvero difficile veder bene le opere. In questo caso in effetti i gruppi c’erano, ma erano tenuti piacevolmente sotto controllo dagli accompagnatori. Anzi, ho avuto l’impressione che in diversi casi le guide facessero proprio attenzione a non intralciare i visitatori singoli, il che è un ottimo esempio di professionalità.
 
Aggiungo che la sorpresa più gradita in assoluto l’ho avuta in una sala in cui alcuni lavori geometrici di Escher sono messi a confronto con opere medievali e rinascimentali di tema paragonabile, e sorprendentemente simili. Immagino che questo non sia l’allestimento generale della mostra, ma una soluzione trovata ad hoc per Pisa, con opere che fanno parte della collezione permanente di Palazzo Blu. Se è così, è stata veramente un’ottima scelta.
 

mercoledì 27 dicembre 2017

Tavosanis, L’italiano L2 negli elaborati universitari del Corpus ICoN


 
“Quaderni di AIΩN”, n.s., 5
Ho ricevuto da poche settimane l’estratto di un mio contributo dedicato a L’italiano L2 negli elaborati universitari del Corpus ICoN: esempi di analisi. Il contributo è il frutto del lavoro svolto in un Progetto di ricerca di interesse nazionale (PRIN) iniziato nel 2012 e terminato nel 2015. Questo lavoro si è concretizzato in diverse pubblicazioni, in parte già uscite e in parte ancora in stampa, e in un sito web: Corpus ICoN.
 
Il contributo appena uscito era stato presentato in forma orale durante un convegno del PRIN tenuto nella splendida cornice di Procida. Per quanto riguarda i contenuti, all’interno del contributo vengono fornite in primo luogo alcune informazioni di base sul Corpus ICoN. Vengono poi presentati due esempi di analisi eseguite sui materiali del corpus, e su queste mi sembra utile dire qualche parola.
 
Il primo esempio è un confronto tra gli errori nell’uso dell’articolo determinativo da parte di studenti di varia L1. Il secondo, portato avanti con l’uso del programma READ-IT, è un esame di alcuni tratti linguistici negli elaborati di studenti che hanno come L1 spagnolo, greco, portoghese e russo.
 
Per quest’ultimo punto, a parità di condizioni, sarebbe intuitivo che l’uso dell’italiano fosse più flessibile ed evoluto da parte degli studenti che hanno una L1 più vicina all’italiano. Facendo controlli quantitativi, però, le scale risultano diverse dal previsto. Prendiamo per esempio la lunghezza media delle frasi, dando per scontato che frasi più lunghe indichino una maggiore confidenza con la sintassi italiana. I risultati nel campione preso in esame, espressi in token, sono stati:
 

  • Spagnolo 39 
  • Greco 35 
  • Portoghese 31 
  • Russo 28
 
Se le posizioni estreme di spagnolo e russo non sorprendono, è più strano che la confidenza risulti maggiore negli studenti greci che in quelli portoghesi.

Il campione usato è piuttosto ridotto, circa 30.000 token per ogni lingua, ed è bene non trarre conclusioni affrettate su questa base. Disponendo di  informazioni quantitative, è però adesso possibile allargare i confronti e vedere se lo stesso fenomeno si ritrova in altri contesti.

Mirko Tavosanis, L’italiano L2 negli elaborati universitari del Corpus ICoN: esempi di analisi , in Scritture brevi: segni, testi e contesti. Dalle iscrizioni antiche ai tweet, a cura di Alberto Manco e Azzurra Mancini, “Quaderni di AIΩN”, n.s., 5 , 2016 (ma 2017), pp. 177-187, ISSN 1825-2796, ISBN 978-88-6719-140-6. Estratto.
 

martedì 5 dicembre 2017

Intervista per Wikimedia

  
 
Sono stato intervistato per il blog di Wikimedia Italia. L’intervista è stata pubblicata il 4 dicembre 2017 con il titolo Scrittura scientifica? Si impara con Wikipedia e naturalmente riguarda le attività del mio Laboratorio di scrittura. Spero soprattutto che un po’ di promozione aiuti il coordinamento con iniziative simili, e che il modello possa essere ripreso in altri contesti e migliorato… nel frattempo in questo semestre il Laboratorio, nonostante sia molto oneroso, continua a darmi discrete soddisfazioni.

 
Creative Commons License
Blog di Mirko Tavosanis by http://linguaggiodelweb.blogspot.com is licensed under a Creative Commons Attribuzione-Non opere derivate 2.5 Italia License.