Archive for the ‘california’ Category

h1

MMDS 2008 wrap-up

luglio 4, 2008

At last I’ve got the chance to write about the MMDS conference.

It was an awesome workshop: if with WSDM 2008 I had lost the faith in science, in these days I regained a deep devotion.

The schedule was very dense, most of the talks were enlightening, and there were two coffee breaks a day with fresh (sweet!) fruit, bagels and muffins. Everything for 25 bucks! It’s so nice being a student.

Like in February with the 24-70 f2.8, the parks around Stanford gave me a great opportunity of trying out my shiny new 70-200 f2.8 IS. What a wonderful lens! It’s sharper than the 24-70, probably because of the stabilizer. The results were not so bad:
Thinking bird
Squirrel

Thanks to my usual care, I also managed to drop it, resulting in a nice scratch close to the bayonet and one on the hood. Luckily it’s sturdy (and heavy) like a tank.

There were also a lot of nice people! We formed a small group with other students, we had lunches together, we even went together to the gay pride when the workshop ended. I hope to meet them again in the future.

And now the boring part. Most of the talks were interesting, some where very interesting or even enlightening. These are my favorites, I strongly advice to go read the slides:

  • Christos Faloutsos (Carnegie Mellon University)
    TUTORIAL: Graph mining: laws, generators and tools
  • James Demmel (University of California, Berkeley)
    Avoiding communication in linear algebra algorithms
  • Ronald Coifman (Yale University)
    Diffusion geometries and harmonic analysis on data sets
  • Nikhil Srivastava (Yale University)
    Graph sparsification by effective resistances
  • Leonidas Guibas (Stanford University)
    Detection of symmetries and repeated patterns in 3D point cloud data
  • Piotr Indyk (Massachusetts Institute of Technology)
    Sparse recovery using sparse random matrices
  • Gunnar Carlsson (Stanford University)
    TUTORIAL: Topology and data
  • Partha Niyogi (University of Chicago)
    Manifold regularization and semi-supervised learning
  • Nir Ailon (Google Research, New York)
    Efficient dimension reduction
  • Lek-Heng Lim (University of California, Berkeley)
    Ranking via Hodge decompositions of graphs and skew-symmetric matrices

Regarding the ones that I didn’t find interesting, probably I just didn’t understand them. Many required a basic knowledge about statistics (regression, distributions, moments, machine learning) which I know nothing about. In my next life I’ll try to take statistics more seriously.

I was very surprised by applications of topology to data mining. They are still not very refined, but could lead to beautiful techniques. I was also surprised by the fact that many speakers came from mathematics departments: in Italy I couldn’t imagine an algebraic topologist even knowing about data mining. I am reconsidering applying for a PhD in Mathematics (but not in Italy…)

Luca F. pointed me out the website of MMDS 2006, and the titles of the talks seem as interesting. Probably the slides are worth a look (if I only had time… 😦 )

h1

We work hard, we play hard!

luglio 1, 2008

Dovrei bloggare sulla conferenza, ma parliamo prima del weekend…

Come saprete in diverse città del mondo si è svolto il Gay Pride (che ora chiamano solo Pride, credo). Tra queste San Francisco, in cui la comunità gay è numerosa e attiva. Potevo perdermi questo evento di importanza mondiale? Dovendo scegliere tra una folla di manifestanti in abiti insoliti, o recuperare una settimana di studio/lavoro persa per via della conferenza, ho scelto la folla.

Il SF Pride si svolge in due giorni, la sera del sabato c’è un party nel quartiere Castro, e la mattina della domenica la parata nel distretto finanziario. Ho messo tutta la mia apparecchiatura fotografica nello zaino, e sono andato.

Al party sono andato con Luca, venuto nella bay area per la conferenza, che commentava che se ci fosse stato un servizio di un telegiornale italiano che ritraeva noi due che passeggiamo in un Gay Party, la cosa sarebbe stata piuttosto equivoca…

C’era più gente che la Luminara a Pisa:
SF Pride Party

Eppure ci si riusciva a muovere abbastanza agevolmente; niente che ricordasse i tragici momenti delle manifestazioni italiane, ad esempio quando deve attraversare un passeggino… (sì, c’era qualche passeggino).

Il dress code non era troppo severo:
SF Pride Party

Ho passato gran parte della sera a caccia di una foto come questa:
Girls kissing

A causa della poca luce, e quindi autofocus lento (nonostante l’apertura f2.8, sigh) non sono riuscito a fotografare un paio di travestiti con viso e corpo bellissimi…  molte donne vere ucciderebbero per avere quegli occhi o quelle gambe. Per un istante hanno messo in dubbio la mia eterosessualità (solo un istante, però).

Molti festeggiavano in casa, salutando dalle finestre:
SF Pride Party

Per non urtare la vostra sensibilità tralascio un paio di foto di saluti fatti con altre parti del corpo.

Il giorno dopo siamo stati alla parata con un po’ di ragazzi conosciuti alla conferenza (obbligatoria foto di gruppo):
Last group photo...

A manifestare, anche persone abbastanza inaspettate…
SF Pride Parade

… o pittoresche
SF Pride Parade

E i giochi di parole si sprecavano:
SF Pride Parade

Anche se, alla fine, il tema dominante è l’amore:
LOVE

A un certo punto ho finito la memoria della scheda e mi sono messo in disparte per scaricare le foto sul pc, in quel momento è passata la delegazione di Google… quindi niente foto. Sembra che ci fossero anche quelli di Yahoo, con i cartelloni “We love gay geeks!”. E io che credevo che i geek fossero tutti asessuati…

Ciò che mi ha colpito di più non è stata tanto l’esagerazione, che di certo non manca in una parata come questa in cui lo scopo è far rumore, quanto la varietà. Ho scattato foto principalmente al non ovvio, al pittoresco e colorato, ma insieme ai travestiti e i macho seminudi sfilavano famiglie, coppie appena “sposate”, bambini con due papà o due mamme, e omosessuali di varie età, razze e provenienze. Daniela, un’altra ragazza della conferenza, raccontava che a sua figlia di 7 anni a scuola spiegano che è normale che un altro bambino possa avere due “genitori” dello stesso sesso, per evitare che questi bambini siano emarginati. Sembra che qui la convivenza omosessuale sia molto più comune e accettata.

È questa varietà che mi fa riflettere sulla natura dell’omosessualità. Non può essere solo un fatto culturale, una rara anomalia che, messa in luce da una enorme pubblicità, diventa di moda. Non può essere una cosa acquisita nell’infanzia per via di un ambiente non da manuale di pedagogia. Cause come queste non avrebbero potuto colpire persone così diverse, il cui unico punto di contatto è il provare attrazione per persone dello stesso sesso.

Tuttora non riesco a farmi un’idea precisa. Sospendo il giudizio, visto che comunque questo non influenzerebbe il mio rispetto per loro. Ma non riesco a rispondermi se mi chiedo se ci sia del “giusto” o dello “sbagliato”.

P.S. Riconosciuta la citazione?

h1

Aggiornamento sulla tesi

giugno 19, 2008

Passata la prima settimana qui a Berkeley, aggiornamento sulla situazione.

Non ho ancora avuto occasione di uscire una sera, ed apprezzare la vita notturna di Berlekey (suppongo piuttosto povera in questo periodo, visto che molti studenti sono tornati a casa). La mattina alla sede di Oakland di Ask.com (bell’ufficio, non c’è che dire), e il pomeriggio in dipartimento (no, qui non c’è l’aula studenti, spiacente). Insomma, non molto diverso da Pisa, se escludiamo i 15 minuti di treno per Oakland.

Mi rimane il tardo pomeriggio, in cui vagabondo per campus e dintorni, cercando un posto nuovo dove cenare. Berkeley è un posto piacevole per passeggiare.

Finalmente la tesi ha preso una direzione positiva. O per lo meno, ha preso una direzione. Dopo le chiacchierate preliminari, e un po’ di sbattimento per preparazione iniziale su pseudocasualità, combinatoria additiva, teoremi di densità, lemmi di Szemeredi, il mio co-relatore se ne esce con un nuovo argomento che, ovviamente, non c’entra niente con quanto si era detto prima.

L’altro argomento era certamente di più ampio respiro, e probabilmente sarebbe anche piaciuto di più ai matematici puri che dovranno giudicarmi in commissione di laurea. Però non era chiaro cosa dovessi fare, e sicuramente non avrei cavato un ragno dal buco, o comunque non in tempi ragionevoli. Qui la direzione invece è stata precisa dall’inizio: implementare l’algoritmo, fare esperimenti, vedere se c’è qualcosa da dire sull’analisi teorica. Implementare? Non me lo sono fatto chiedere due volte 🙂 Ora chi lo dice a mia madre che non tratto più il teorema di Green-Tao? 

Risultato, un’implementazione è pronta (insieme a quelle di un altro paio di algoritmi, di cui uno è lo stato dell’arte) e i risultati preliminari sono promettenti. Non è la prima volta che il Python mi salva la vita. Mentre sono nella Bay Area considererò un pellegrinaggio da Guido Van Rossum.

Nel cercare librerie per risparmiarmi lavoro nell’implementazione sono rimasto esterrefatto dall’ecosistema di librerie scientifiche/matematiche che si è formato attorno a Python. Sembra che abbia catturato l’entusiasmo dei ricercatori (e come biasimarli?), e grazie alla semplicità di modularizzazione e interoperabilità ne sia uscito un ambiente completo. Come Matlab, ma su un vero linguaggio di programmazione. Librerie che meritano di essere menzionate:

  • SciPy: Semplicemente impressionante. Algebra lineare numerica, funzioni statistiche, e milioni di altre cose che non ho ancora avuto il tempo di guardare. Il tutto con una interfaccia pythonica. Insieme a MatPlotLib per i grafici rende Matlab solo un brutto ricordo.
  • NetworkX: Libreria di grafi che implementa qualsiasi algoritmo vi venga in mente, e qualsiasi costruzione (grafi particolari, casuali, prodotti…). Si interfaccia con SciPy (per esempio per la costruzione del laplaciano). Programmativamente non è un granchè (il modulo principale è un blobbone di funzioni, il grafo è un dizionario di dizionari), ma fa onestamente il suo lavoro.
  • CVXOPT: Ottimizzazione convessa, l’ho usato per risolvere il primale-duale di Semidefinite Programming per l’algoritmo di Goemans-Williamson. Non ci ho guardato a fondo, ma funziona ed è abbastanza veloce, considerando che gli algoritmi sono implementati in Python (ma usando le primitive BLAS. Si può interfacciare alla libreria DSDP ma devo impostare l’SDP in un modo diverso, ci sto lavorando). Secondo l’articolo del ’95 ci volevano intorno ai 4000 secondi per risolvere un grafo di 200 nodi. Con la mia pessima implementazione ci mette intorno ai 5 secondi sul mio MacBook Pro. Sembra che sia hardware che algoritmi siano migliorati… 🙂

Tornando alla tesi, qui ho conosciuto un paio di dottorandi che lavorano su problemi simili e si sono anche loro interessati al nuovo algoritmo. Chiacchierando con loro per un paio d’ore alla lavagna ho imparato di più che negli ultimi mesi (ma lo sapevate che gli autovettori del grafo di Cayley sono i caratteri della rappresentazione, e quindi nel caso abeliano la base di Fourier? La teoria delle rappresentazioni SERVE A QUALCOSA!)

Se fossi rimasto a Pisa probabilmente in questo momento sarei ancora a scambiare email (con round-trip medio di un giorno, visto il fuso orario) per capire l’argomento della tesi…

h1

MMDS 2008

giugno 19, 2008

I just discovered that on 25-28 June Stanford University will host MMDS 2008 (Workshop on Algorithms for Modern Massive Data Sets), and I’ll still be in California around these dates! Besides, I am still in time for registration.

The schedule looks very promising, some of the speakers are the maximum authorities of their respective fields, and I’ve read many of their papers. Hope this is a good chance to ask them some questions, which probably will rule me out from a possible career in their universities 🙂

Looking forward to be there!